viernes, 30 de marzo de 2012

La web semántica: ¿Utopía o realidad?

 Para el Consorcio W3C la web semántica es la extensión del espacio web actual, donde se la dota de "mayor significado en la que cualquier usuario en Internet podrá encontrar respuestas a sus preguntas de forma más rápida y sencilla gracias a una información mejor definida. Al dotar a la Web de más significado y, por lo tanto, de más semántica, se pueden obtener soluciones a problemas habituales en la búsqueda de información gracias a la utilización de una infraestructura común, mediante la cual, es posible compartir, procesar y transferir información de forma sencilla. Esta Web extendida y basada en el significado, se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semántica en la que, en ocasiones, el acceso a la información se convierte en una tarea difícil y frustrante."

La web semántica ayuda a resolver dos problemas de alta importancia, la sobrecarga de información y la heterogeneidad de fuentes de información (la cual atenta contra la  interoperabilidad), permitiendo que los usuarios deleguen ciertas tareas sobre componentes de software. Gracias al análisis de estructuras de datos que almacenan, el software es capaz de procesar contenidos, razonar sobre estos, mezclarlos y elaborar deducciones con la finalidad de resolver problemas de manera automática.

Técnicamente hablando, la web semántica se basa en un conjunto de especificaciones técnicas que tienen por finalidad  tratar la información de manera que ésta sea facilmente interpretada por programas de computadora. Las tecnologías clave son el lenguaje de marcas XML, usado generalmente para describir objetos, y los lenguajes de metadatos y de representación de la información, como RDF y OWL.



Arquitectura tecnológica de la web semántica. Fuente Wikipedia

Desafios

Para Luís Codina, profesor en la Universidad Pompeu Fabra y especialista en el tema, el futuro de la web semántica "... no se espera para mañana, ni para pasado mañana. Una web inteligente en un sentido apropiado de la palabra no tiene fecha realista. Siempre que se ha dado una fecha, aunque haya sido a veinte años vista, se ha incumplido. En los años 40 se creía que sería en los 60; en los 60 se decía que sería en los 80, y así sucesivamente. Y aún estamos esperando". Por otro lado, el mencionado investigador hace referencia a los obstáculos actuales para el desarrollo de la web semántica, indicando que por ejemplo ". ... una empresa tiene pocos o ningún incentivo a corto plazo para poner contenidos codificados con metadatos del tipo RDF o de algún lenguaje emparentado como RDFa. Pero lo más importante es que no ha llegado todavía ninguna aplicación o tecnología rompedora, como las redes sociales en su momento. El resultado es que falla todo lo demás, empezando por la inversión". Completando lo anterior con algunos aportes sobre los estándares "... el W3C ha desarrollado una auténtica sopa de letras de estándares, por lo que se ha convertido en un trabajo a tiempo completo seguirlos. Además, no son nada fáciles de entender, por alguna razón les encanta hacerlos muy muy abstractos y crípticos, siguiendo una jerga muy difícil de descifrar, pero esto ya es otra historia."


Para Pastor Sanchez el presente de la web semántica es más prometedor, dado que "... se puede constatar una tendencia general hacia facilitar la publicación de datos semánticos, y un escenario en el que surgen tecnologías divergentes con enfoques alternativos sobre la Web semántica. Por tanto, las organizaciones deben encontrar su posición en esta nueva realidad de una Web semántica más abierta, mientras que los desarrolladores deben considerar la aplicación o evolución de tecnologías ya existentes para no volver a pasar por un camino ya recorrido". El investigador plantea un panorama más global que el que mencionó Codina, dado que no solo ve en la evolución de la web semántica  a los estándares tradicionales.



Palpando la web semántica

Swoogle es un sistema de indización, recuperación y organización de contenidos para documentos del dominio de la web semántica (es decir que en su estructura deben respetar las normas vigentes).  El servicio de recuperación busca, procesa, analiza e indiza documentos que esten disponibles en línea. Lo hace a traves de un sistema de búsqueda y resultados de interfaz web similar a Google, que  busca en más de 10.000 ontologías disponibles en la Web (1.0, y 2.0).  Swoogle fue desarrollado por la Universidad de Maryland, Baltimore County (UMBC) con financiación de la DARPA, EE.UU. y los organismos de la Fundación Nacional de Ciencias.


La Fundación Wikimedia se ha lanzado a desarrollar el proyecto Wikidata, el cual podría contribuir considerablemente al desarrollo de la Web Semántica. La idea es "crear una única base de datos colaborativa, capaz de ser accesible y editable tanto por humanos como por máquinas, y que a la vez servirá de “cerebro” o repositorio global de datos estructurados para nutrir a las más de 280 ediciones de Wikipedia, independientemente del idioma en que se encuentren". Se aprovecharán las ventajas de la Web semántica, armando una base de datos que sea capaz de ser accedida tanto por máquinas como por usuarios, con la finalidad de enriquecer la calidad de los artículos de la Wikipedia,  sin importar en qué idioma se agreguen al repositorio.

Por parte de Google, según se cuenta en el blog Doculinux, hubo   interés en desarrollar aplicaciones de la web semántica sobre su buscador. Para ello adquirieron la firma Metaweb Technologies. La cual posee  una base de datos de 12 millones de entidades (personas, lugares y objetos) que es la base para un próximo servicio denominado Google Knowledge Graph (GKG).

GKG se proyecta como un gran grafo de entidades interconectadas y sus atributos. Se comenta que la base de datos ha crecido hasta alcanzar  los 200 millones de entidades. (el competidor Freebase sólo alcanza los 20 millones).


Al aplicar estrategias de búsqueda semántica, Google pretende estudiar la relación entre las términos de una consulta, con el objetivo de analizar su significado.  Al obtener la verdadera intención de la consulta el resultado de la misma será más preciso (tendrá menos ruido documental) y por ende satisfacerá con mayor calidad las necesidades de información del usuario.  De alguna manera, estos proyectos apuntan al procesamiento del lenguaje natural.


Referencias

Codina, L. () "La llegada de la Web Semántica no tiene fecha realista". Disponible en http://goo.gl/0MVCV

Pastor Sanchez, J. (2011) "Prospectiva de la Web semántica: divergencia tecnológica y creación de mercados Linked Data". Notas ThinkEPI. Disponible en http://goo.gl/MmgwB

W3C. Guía breve de la web semántica. Disponible en http://goo.gl/yzAMO


No hay comentarios:

Publicar un comentario