viernes, 23 de abril de 2010

Habitantes de la Web semantica

La Web, tal y como se la conoce, es un espacio de información en el que cualquiera puede publicar documentos y ponerlos a disposición de todo el mundo, lo que ha supuesto una revolución en aplicaciones y nuevas formas de negocio tales como el comercio electrónico. La Web semántica es entendida como una Internet en la que las computadoras no sólo son capaces de presentar la información contenida en las páginas Web, como lo hacen ahora, sino que además pueden "entender" dicha información. La Web semántica es una extensión de la actual Web que permitirá encontrar, compartir y combinar la información más fácilmente. Actualmente la información presente en la Web se encuentra estructurada mediante lenguajes de marcas que únicamente describen la forma en que dicha información debe ser presentada al usuario por el navegador, pero no expresan nada sobre su significado, es decir, su semántica. El objetivo del proyecto de la Web semántica es que toda esta información sea comprensible no sólo por humanos, sino también por computadoras. Para conseguir esto se deberá codificar la semántica de los documentos Web mediante lenguajes de metadatos y ontologías, estas últimas definidas como representaciones compartidas de conocimiento en forma de taxonomías de conceptos relacionales y reglas de inferencia.

En la última década se ha producido una preocupación constante para que las páginas sean comprendidas por los usuarios a través del diseño pero poco se han preocupado para que las computadoras lo entendieran. La Web semántica propone superar las limitaciones de la Web actual mediante la introducción de un conjunto de descripciones explícitas del significado, la estructura interna y la estructura global de los contenidos y servicios disponibles en el servicio World Wide Web, promoviendo la separación de contenido y formato. Esta semántica permitirá que sus habitantes denominados agentes inteligentes, puedan “entender” el significado de los documentos, con lo que podrían asistir a usuarios en tareas como, por ejemplo, la recuperación de información o la gestión de su agenda.

En la práctica esto significa que las máquinas, entre las que se cuentan las computadoras personales o cualquier otro dispositivo conectado a Internet, podrán realizar, casi sin necesidad de intervención humana, infinidad de tareas que simplificarán la vida de las personas. La Web semántica, explican los autores, “no es una Web aparte sino una extensión de la actual en la que la información tiene un significado bien definido, posibilitando que las computadoras y las personas trabajen de manera cooperativa”. Así, lo que hasta ahora había sido básicamente “un medio de documentos para personas” pasará a ser un sistema de datos e información que se podrán procesar de manera automática.

Para explotar la Web semántica se necesita un lenguaje común con suficiente capacidad expresiva y de razonamiento para representar la semántica de las ontologías. Es necesario crear una ontología definida en formato de “descripción de recursos” y ubicada en la Web para determinar el significado contextual de una palabra por medio de la consulta a la ontología apropiada. De esta forma, agentes inteligentes y programas autónomos podrían rastrear la Web de forma automática y localizar, exclusivamente, las páginas que se refieran a la palabra buscada con el significado y concepto precisos con el que sea posible interpretar el término. Por lo tanto, para potenciar el uso de ontologías en la Web, se necesitan aplicaciones específicas de búsqueda de ontologías, que indiquen a los usuarios las ontologías existentes y sus características para utilizarlas en su sistema, como podría ser el uso del buscador semántico SWOOGLE.

En este sentido, se entiende por agente inteligente aquella entidad de software que habita la Web semántica, recoge, filtra y procesa la información contenida en la Web, realiza inferencias sobre dicha información e interactúa con el entorno sin necesidad de supervisión o control constante por parte del usuario. Las cualidades que tendría un agente inteligente ideal, según el investigador James A. Hendler, serían: (1) Comunicativo. El agente debe entender las necesidades, objetivos y preferencias del usuario para que éste pueda realizar su función correctamente. El agente también debe comunicarse con el entorno mediante representaciones compartidas de conocimiento, las ontologías. (2) Capaz. El agente no sólo debe proporcionar una información, sino también un servicio, es decir, debe tener capacidad para hacer cosas. Por ejemplo, si se precisa un artículo de revista y ésta es de pago, el agente debe ser capaz de encontrar el artículo, informar del precio, proporcionar el número de tarjeta de crédito, etc. (3) Autónomo. El agente, además de comunicarse, debe interactuar con el entorno, tomando decisiones y actuando por sí solo, limitando sus acciones según el nivel de autonomía permitida por el usuario. (4) Adaptativo. Debe ser capaz de aprender del entorno, las preferencias de usuarios, fuentes de información y de otros agentes.

La Web semántica debería ser capaz de procesar contenido, razonarlo y hacer deducciones lógicas a partir de éste, y cuando un usuario quiera, realizar todas estas acciones de forma automática. Un agente inteligente entiende lo que se pide, comprende el contenido de los sitios, valida si lo encontrado corresponde a lo pedido y deduce nueva información sobre la ya obtenida. Pero para realizar todas estas tareas es necesario estandarizar las funciones que aportan las distintas capas de la Web semántica: el alfabeto, las referencias, el lenguaje, el formato, las anotaciones sobre significados, los conceptos generales y las reglas y sistemas de deducción. La Web semántica se basa en la estandarización de todos sus datos, todo en la Web, páginas, servicios, etc., deben presentarse en el mismo formato, el cual puede ser comprendido por una nueva generación de agentes inteligentes que clasificarán la información de una manera más eficiente para devolver resultados más precisos ante una búsqueda o un pedido de información.

La idea es que los datos puedan ser utilizados y “comprendidos” por las computadoras sin necesidad de supervisión humana, de forma que los habitantes de la Web puedan ser diseñados para tratar la información situada en las páginas Web de manera semiautomática. Se trata de convertir la información en conocimiento, referenciando datos dentro de las páginas Web a metadatos con un esquema común consensuado sobre algún dominio. Los metadatos no sólo especificarán el esquema de datos que debe aparecer en cada instancia, sino que además podrán tener información adicional de cómo hacer deducciones con ellos, es decir, axiomas que podrán aplicarse en los diferentes dominios que trate el conocimiento almacenado. Con ello, se mejorará la búsqueda de información y se potenciará el desarrollo de aplicaciones, como el comercio electrónico, ya que las anotaciones de información seguirán un esquema común, y los buscadores Web compartirán con las anotaciones Web los mismos esquemas. Empresas que traten con clientes y proveedores, podrán intercambiar sus datos de productos siguiendo estos esquemas comunes consensuados.

Los agentes no sólo encontrarán la información de forma precisa, si no que podrán realizar inferencias automáticamente buscando información relacionada con la que se encuentra situada en las páginas, y con los requerimientos de la consulta indicada por el usuario. Por tanto, la Web semántica facilita que sean los agentes inteligentes quienes busquen, comparen y manejen la información de Internet para las personas. El papel del agente inteligente en el proceso de recuperación “semántica” de información no debe confundirse con la de un buscador inteligente. Un buscador inteligente se aprovecha del enriquecimiento semántico de los recursos Web para mejorar, principalmente en la precisión, la recuperación de información, aunque su funcionamiento se basará, como los actuales buscadores, en la previa indización de todos aquellos recursos susceptibles de ser recuperados.

En cambio, un agente inteligente recorrerá la Web a través de los enlaces entre recursos, hiperdocumentos, ontologías, en busca de aquella información que le sea solicitada, pudiendo además interactuar con el entorno para el cumplimiento de tareas encomendadas. Por ejemplo, un agente inteligente, ante una consulta dada, podría consultar autónomamente un buscador, y a partir de sus resultados, explorar la Web hasta encontrar la información solicitada, pudiendo finalmente llevar a cabo una acción sobre dicho recurso, como podría ser la reserva de un boleto aéreo La Paz – Santa Cruz o la reserva de una habitación en un hotel de Caranavi.

Guillermo Choque Aspiazu
http://www.eldiario.net/
Febrero 22 de 2010

No hay comentarios: