Mente Errabunda: Web semántica

La World Wide Web o simplemente Web como servicio creado para Internet, es un espacio preparado para el intercambio de información diseñada para el consumo humano. Las aplicaciones Web son creadas por personas para ser entendidas por personas. No existe un formato común para mostrar la información, por lo cual, los diseñadores y desarrolladores de aplicaciones Web crean sus páginas dependiendo de los potenciales usuarios que van a visitarlas. Los actuales buscadores residentes en la Web realizan la búsqueda de información, con más o menos fortuna, mediante palabras clave que aparecerán en el código de lenguaje de marcado de hipertexto de las aplicaciones Web dispersas en Internet. En los últimos años, algunas empresas están realizando anotaciones de datos introducidas dentro de este código lenguaje de marcado de hipertexto, siguiendo algún esquema de anotación común, normalmente basado en el lenguaje de marcado extendido.

Otra carencia de la situación actual es que, con los estándares Web del momento, no se puede diferenciar entre información personal, académica, comercial, etc. Es decir, cuando un buscador Web realiza una consulta con algunas palabras clave, normalmente aparece información que no es útil porque no corresponde a lo que se está buscando. Además no todas las páginas proporcionan igual cantidad de información, debido precisamente a que no existe un formato o convenio que establezca el contenido que debe añadirse a los sitios Web. Por otro lado, los agentes de búsqueda actuales no se diseñan para “comprender” la información que reside en la Web, precisamente porque es prácticamente imposible conocer la representación de los datos ubicados en las diferentes aplicaciones residentes en la Web.

Con lo mencionado y de forma similar a como la presentó Tim Berners-Lee el año 1998 y adaptando los ejemplos a la ingeniería de ontologías, se puede decir que la Web, basada en documentos y enlaces de hipertexto, fue diseñada para la lectura humana y no para que la información que contiene pudiera procesarse de forma automática. Si se hace una búsqueda de documentos, por ejemplo, por el término "ingeniería de ontologías", la Web no distingue entre los distintos significados o contextos en los que aparece este término: programas para diseñar ontologías, información docente, empresas que anuncian su Web, etc. La Web actual tampoco permite automatizar procesos, como por ejemplo, buscar un seminario sobre ingeniería de ontologías, hacer la reserva de la plaza, consultar los medios de transporte disponibles hasta la ciudad donde se celebra el evento, reservar el pasaje y conseguir un plano de dicha ciudad. Aún utilizando el más potente de los buscadores, se pierde muchas horas navegando por los resultados obtenidos tras la consulta, para solamente acceder a la información de forma manual, cuando esto lo podría hacer fácilmente un programa informático o un agente inteligente.

La Web semántica viene a ser una extensión de la Web actual dotada de significado, esto es, un espacio donde la información tiene un significado bien definido, de manera que pudiera ser interpretada tanto por agentes humanos como por agentes computarizados La Web semántica se encuentra dotada de mayor significado en la que cualquier usuario en Internet puede encontrar respuestas a sus preguntas de forma más rápida y sencilla gracias a una información definida de mejor manera. Se pueden obtener soluciones a problemas habituales en la búsqueda de información gracias a la utilización de una infraestructura común, mediante la cual, es posible compartir, procesar y transferir información de forma sencilla. La Web semántica tiene como objetivo crear un medio universal para el intercambio de información basado en representaciones del significado de los recursos de la Web, de una manera inteligible para las máquinas. Con ello se pretende ampliar la interoperabilidad entre los sistemas informáticos y reducir la mediación de operadores humanos en los procesos inteligentes de flujo de información. La web semántica rescata la noción de ontología del campo de la inteligencia artificial como vehículo para cumplir este objetivo. Una ontología contiene definiciones que proporcionan un vocabulario para referirse a un determinado área de conocimiento, a un conjunto de conceptos que se especifican en lenguaje natural con el objetivo de crear un idioma común para intercambiar información. Ese vocabulario se define mediante un conjunto de términos básicos y relaciones entre dichos términos, así como las reglas que combinan los términos y las relaciones que permiten ampliar las definiciones dadas en el vocabulario. Por tanto, una ontología es una forma de ver el mundo, ya que determina los términos a utilizar para describir y representar un determinado área de conocimiento, haciendo énfasis en la compartición del conocimiento y el consenso en la representación de éste.

Una de las primeras preguntas que se debe responder es cómo encaja la Web semántica con la actual, es decir, cómo accederá el usuario a la Web semántica, y sobre todo, cómo hacer la transición de la Web actual a la Web semántica. Para que la Web semántica pueda realizarse es importante que guarde, al menos al principio, una compatibilidad con la tecnología actual. Es deseable que se mantenga el lenguaje de marcado de hipertexto u otros lenguajes compatibles con los navegadores actuales, como vehículo de comunicación con el usuario. La asociación entre las instancias de la web semántica y el código del lenguaje de marcado de hipertexto se puede establecer mediante distintos mecanismos. Una de las formas posibles consiste en conservar los documentos actuales, y crear las instancias asociadas anotando su correspondencia con los documentos. Esta posibilidad es la más viable cuando se parte de un gran volumen de material antiguo. Otra forma consiste en generar dinámicamente aplicaciones Web a partir de ontologías y sus instancias. Esta última opción puede resultar factible cuando los documentos antiguos ya se estaban generando automáticamente a partir de una base de datos.

La transición de la Web actual a la Web semántica puede implicar un costo altísimo si se tiene en cuenta el volumen de contenidos que ya forman parte de la Web. Crear y poblar las ontologías supone un esfuerzo extra que puede resultar tedioso cuando se agregan nuevos contenidos, pero directamente prohibitivo en lo que respecta a integrar los miles de gigabytes de contenidos antiguos. Las estrategias más viables combinan una pequeña parte de trabajo manual con la automatización del resto del proceso. Las técnicas para la automatización incluyen, entre otras, la correspondencia de la estructura de las bases de datos a ontologías, el aprovechamiento, previa conversión, de los metadatos y estándares de clasificación presentes en la Web y fuera de ella, además de la extracción automática de los metadatos a partir de texto y recursos multimedia. Otra dificultad importante a la hora de realizar la web semántica en la práctica, es la de consensuar ontologías en una comunidad, por poco amplia que sea. Converger a una representación común es una labor más compleja de lo que puede parecer, ya que cada parte del sistema conlleva, típicamente, ciertas peculiaridades necesarias, y un punto de vista propio que a menudo necesita incidir en la propia ontología. La representación del mundo no es neutra respecto al uso que se le va a dar: tanto un dietista como un biólogo tienen el conocimiento suficiente sobre las plantas, pero la representación que pueden hacer de esa materia es muy distinta, y probablemente no será adecuada imponer la misma representación para ambas perspectivas. Las vías para salvar esta dificultad consisten en compartir ontologías para las áreas comunes en que puede tener lugar una interacción o intercambio de información entre las partes, y establecer formas de compatibilidad con las ontologías locales, mediante extensión y especialización de las ontologías genéricas, o por correspondencia y exportación entre ontologías.

La forma en la que se procesará esta información no sólo será en términos de entrada y salida de parámetros sino en términos de su significado. La Web Semántica como infraestructura basada en metadatos aporta un camino para razonar en la Web, extendiendo así sus capacidades. No se trata de una inteligencia artificial mágica que permite a las máquinas entender las palabras de los usuarios, es sólo la habilidad de una máquina para resolver problemas bien definidos, a través de operaciones bien definidas que se llevan a cabo sobre datos existentes bien definidos. Para obtener esa adecuada definición de los datos, la Web Semántica utiliza los estándares RDF y OWL, estos ayudan a convertir la Web en una infraestructura global en la que es posible compartir, y reutilizar datos y documentos entre diferentes tipos de usuarios. RDF proporciona información descriptiva simple sobre los recursos que se encuentran en la Web y que se utiliza, por ejemplo, en catálogos de libros, directorios, colecciones personales de música, fotos, eventos, etc. OWL es un mecanismo para desarrollar temas o vocabularios específicos en los que asociar esos recursos.

Guillermo Choque Aspiazu
http://www.eldiario.net/
Agosto 24 de 2009

viernes, 27 de noviembre de 2009

Web semántica

No hay comentarios:

Libro Redes Neuronales

Libro Redes Neuronales

Archivo del blog