Lunes, 30 de Mayo de 2016 08:30

La ley de la gravedad de Newton inspira nuevos algoritmos

Antonio Mart韓
Califica este artículo
(3 votos)
觭car Reyes (i) y Sebasti醤 Ventura junto a una caricatura de Isaac Newton expuesta en el Departamento de Ciencia de la Computaci髇 e Inteligencia Artificial de la UCO 觭car Reyes (i) y Sebasti醤 Ventura junto a una caricatura de Isaac Newton expuesta en el Departamento de Ciencia de la Computaci髇 e Inteligencia Artificial de la UCO

Un equipo de la Universidad de C髍doba rescata la constante universal para desarrollar mejores clasificadores de datos

Lo que puede valer para todo el universo, bien puede servir tambi閚 para el mundo virtual. As lo considera un equipo de inform醫icos de la Universidad de C髍doba (UCO), que ha desarrollado algoritmos basados en la ley de la gravedad. Los algoritmos generados son m醩 eficaces que los convencionales y permiten clasificar datos que pueden servir para el diagn髎tico de enfermedades, discriminar el correo v醠ido del spam o categorizar fotograf韆s.

Enunciada por Isaac Newton en 1687, la ley de la gravitaci髇 universal habla de la fuerza de atracci髇 para toda la materia existente. Todos los objetos est醤 sujetos a ella. Esa fuerza es la que lleva a la manzana a caer al suelo, pero tambi閚 la que establece las relaciones entre estrellas y planetas. Newton estableci la f髍mula matem醫ica de esta interacci髇 en Philosophiae Naturalis Principia Mathematica: 揇irectamente proporcional al producto de las masas de los objetos e inversamente proporcional al cuadrado de la distancia que las separa. Su descubrimiento fue un punto de inflexi髇 en la historia de la ciencia.

El equipo del Departamento de Ciencia de la Computaci髇 e Inteligencia Artificial que dirige Sebasti醤 Ventura dispone de una l韓ea de investigaci髇 en torno a los algoritmos de aprendizaje perezoso. Un algoritmo computacional es una serie de operaciones para resolver problemas inform醫icos, por ejemplo, si una fotograf韆 se parece a otra y as clasificarlas juntas. Generalmente se construye un modelo para dar respuesta a estas cuestiones. Los algoritmos perezosos, sin embargo, ganan su fama de vagos porque no parten de ning鷑 modelo, sino que aprovechan las caracter韘ticas de los datos para determinar a posteriori la clase a la que pertenecen los objetos. Entre los algoritmos perezosos hay unos que clasifican datos por cercan韆 a otros datos. Son los algoritmos del vecino m醩 cercano.

Perezosos y vecinos
揕os algoritmos perezosos son 鷗iles, pero a veces hay l韒ites entre los vecinos que no son muy claros, estima Ventura. Puede que algunos datos de una familia se salgan por mucho de la media, establezcan un l韒ite muy difuso y distorsionen, con ello, la ubicaci髇 de los nuevos datos que llegan. Con el fin de mejorar la eficiencia de este enfoque, los inform醫icos de la UCO no se fijaron en la distancia al vecino m醩 pr髕imo, sino en la capacidad de atracci髇 que pod韆n tener. Pensaron que cada dato pod韆 ejercer una fuerza gravitatoria, como si fuera un planeta. Adem醩, consideraron que la fuerza de las part韈ulas de una misma clase se pod韆 sumar, de manera que la clase a la que pertenece un nuevo objeto est determinada por la clase que ejerce una fuerza m醲ima sobre 閘.

Con este planteamiento, el equipo de la UCO, en colaboraci髇 con las universidades Central de Las Villas y de Holgu韓 (Cuba), ha creado algoritmos m醩 eficientes. 揗ejoran la obtenci髇 de clasificaciones, resume el catedr醫ico. El trabajo ha sido publicado recientemente en la revista cient韋ica Information Sciences. En este trabajo se intentan clasificar datos que pueden presentar m醩 de una etiqueta. Por ejemplo, cuando reconocemos personas en una fotograf韆, una foto puede contener a varias personas y, por tanto, no se puede usar el nombre de una 鷑ica persona para etiquetarla. 揈n el trabajo se resuelve el problema de la clasificaci髇 multietiqueta incorporando tanto el concepto de vecindad o distancia, t韕icos de los algoritmos perezosos, como el concepto de pureza, que se refiere a la cantidad de vecinos similares entre s頂, resuelve Reyes, estudiante cubano de doctorado en Ingenier韆 Inform醫ica en la UCO participante en el estudio.

觭car Reyes, Carlos Morell, Sebasti醤 Ventura. 慐ffective lazy learning algorithm based on a data gravitation model for multi-label learning. Information Sciences. Volumes 340341, 1 May 2016, Pages 159174