viernes, 4 de diciembre de 2009

Agentes ontológicos

A pesar de que el surgimiento de la Web ha supuesto un cambio radical en cuanto a la facilidad de acceso y difusión de la información electrónica, el gigantesco número de hiperdocumentos y su crecimiento exponencial, sumados a su falta de estructuración lógica, está dando lugar a graves problemas en la recuperación de información en la Web. Los actuales buscadores, basados en indización humana en el caso de los índices de búsqueda, e indización automática en el caso de los motores de búsqueda, son incapaces de ofrecer tasas de exhaustividad y precisión realmente aceptables en sus resultados. El problema de la precisión en la recuperación de información puede ser visto como consecuencia de la falta de significado o semántica que para las computadoras tienen los documentos Web. Como cualquier usuario de Internet habrá advertido por su propia experiencia personal diaria, la Web actual está construida con una cantidad ingente de recursos poco estructurados y pobremente definidos. El precio que se paga por ello es la emergencia de una cantidad desproporcionada de información irrelevante. Una de las causas formales infraestructurales que explican esta situación es que la Web actual se basa en el lenguaje de marcado de hipertexto. La insatisfacción creciente con respecto a este lenguaje de programación de usuario, que permite codificar de manera hipertextual textos, imágenes, sonidos y multimedia, podría sintetizarse en la opinión generalizada entre los especialistas de que dicho lenguaje es, simplemente, un lenguaje estructural de maquetación.

El año 1999, Tim Berners-Lee, el creador de la World Wide Web, escribió por primera vez acerca de los requisitos hipotéticos que debería de cumplir una futura Web semántica que facilitase “la implementación del significado, de la inteligencia en la red”. En el discurso académico generado recientemente en torno a Internet, se retoma este planteamiento y empieza a detectarse un cierto consenso en torno a la idea de que el futuro de la Web se está gestando en la investigación en formas de intelección artificiales cualitativas similares a la humana. El primer paso importante hacia esa Web de naturaleza semántica se basa en la adopción generalizada del lenguaje de marcado extendido, incluido desde hace varios años ya en los programas de usuario de creación de aplicaciones Web, y que añade a las propiedades acreditadas del lenguaje de marcado clásico la posibilidad de inclusión en el nivel de código de una infraestructura de metadatos que aporte una descripción ontológica explícita de la información contenida en el recurso.

Las ontologías han sido tradicionalmente utilizadas como modelos de representación del conocimiento en la inteligencia artificial. Según la definición ofrecida por Tom Gruber el año 1993, una ontología es “una especificación explícita y formal de una conceptualización”. De manera más concreta, una ontología estará formada por una taxonomía relacional de conceptos y por un conjunto de axiomas o reglas de inferencia mediante las cuales se podrá inferir nuevo conocimiento. El servicio que ofrece Internet a través de la Web, sin embargo, es mucho más extenso y dinámico que una base de conocimiento, por lo que la implementación de un lenguaje de definición de ontologías estándar y la posterior consistencia de dichas ontologías, se presentan como un reto complicado, principalmente por la naturaleza descentralizada de la Web semántica. Con un esquema de armazones se pueden describir jerarquías de clases, tales como las ontologías simples, sobre las que es posible realizar consultas y razonamiento automático. Aún así, este esquema no es lo suficientemente expresivo para representar ontologías de la complejidad que necesita la Web semántica, ya que el agente inteligente sólo podría realizar inferencias sobre la herencia de propiedades, pues el esquema no permite declarar axiomas. A esto habría que añadir que algunas características del esquema como la reificación, que consiste en la posibilidad de tratar una aserción como parte de otra, permitiendo de esta forma declarar aserciones sobre otras aserciones, las que dificultan el razonamiento realizado con una máquina de inferencias.

De manera concreta, las ontologías tienen los siguientes componentes que se utilizan para representar el conocimiento de algún dominio: (1) Conceptos. Constituyen las ideas básicas que se intentan formalizar. Los conceptos pueden ser clases de objetos, métodos, planes, estrategias, procesos de razonamiento, etc. (2) Relaciones. Estas representan la interacción y enlace entre los conceptos del dominio. Suelen formar la taxonomía del dominio. Por ejemplo: subclase-de, parte-de, parte-exhaustiva-de, conectado-a, etc. (3) Funciones. Representan un tipo concreto de relación donde se identifica un elemento mediante el cálculo de una función que considera varios elementos de la ontología. Por ejemplo, pueden aparecer funciones como categorizar-clase, asignar-fecha, etc. (4) Instancias. Se utilizan para representar objetos determinados de un concepto. (5) Axiomas. Constituyen teoremas que se declaran sobre relaciones que deben cumplir los elementos de la ontología. Por ejemplo, “Si A es de la clase B y B es de la clase C, entonces A es de la clase C”. Estos últimos componentes, los axiomas, permiten junto con la herencia de conceptos, inferir conocimiento que no esté indicado explícitamente en la taxonomía de conceptos.

Un agente es una entidad software que recoge, filtra y procesa información contenida en la Web, realiza inferencias sobre dicha información e interactúa con el entorno sin necesidad de supervisión o control constante por parte del usuario. Estas tareas son realizadas en representación del usuario o de otro agente. Para el investigador James Hendler las cualidades que debe tener un agente inteligente son: (1) Comunicativo. El agente debe entender las necesidades, objetivos y preferencias del usuario, ya que de dicha comunicación o interacción usuario-agente depende que el agente pueda llevar a cabo su función de manera eficiente. Así mismo debe comunicarse con el entorno mediante representaciones compartidas de conocimiento, en el caso del agente ontológico mediante ontologías. (2) Autónomo. El agente, además de comunicarse, debe interactuar con el entorno, tomando decisiones y actuando por sí solo, limitando sus acciones según el nivel de autonomía permitida por el usuario. (3) Adaptable. El agente debe ser capaz de aprender del entorno, es decir las preferencias de los usuarios, las fuentes de información y conocimiento de otros agentes.

El papel del agente inteligente en el proceso de recuperación “semántica” de información no debe confundirse con el de un buscador inteligente. Un buscador inteligente se aprovecha del enriquecimiento semántico de los recursos Web para mejorar principalmente en la precisión que debe existir en la recuperación de información, aunque su funcionamiento se basa, como los actuales buscadores, en la previa indización de todos aquellos recursos susceptibles de ser recuperados. En cambio, un agente inteligente recorrerá la Web a través de los vínculos entre recursos, en busca de aquella información que le sea solicitada, pudiendo además interactuar con el entorno para el cumplimiento de las tareas encomendadas. Por ejemplo, un agente inteligente, ante una consulta dada, podría consultar autónomamente un buscador, y a partir de sus resultados, explorar la Web hasta encontrar la información solicitada, pudiendo finalmente llevar a cabo una acción sobre dicho recurso, como podría ser la reserva de una habitación en un hotel. El investigador Hendler, el año 1999, enuncia así el optimismo de los especialistas al respecto: “En pocas palabras, si en estos momentos no está usted utilizando tecnología basada en agentes inteligentes, no se preocupe, porque muy pronto lo hará”.

El primer punto de referencia que puede ser considerado para la concepción de un administrador ontológico es la especificación funcional del agente ontológico definida por la “Fundación para Agentes Físicos Inteligentes” que expresa el propósito de un administrador ontológico consiste en “Habilitar a los agentes a manejar explícitamente las ontologías representadas, mediante un servicio que ofrezca un componente dedicado denominado agente ontológico, cuyo papel en la comunidad es proporcionar algunos de los siguientes servicios”: (1) descubrir y acceder a las ontologías públicas, (2) mantener un conjunto de ontologías públicas, (3) traducir expresiones entre diferentes ontologías y distintos lenguajes de contenido, (4) responder a consultas de relaciones entre términos o entre ontologías y, (5) facilitar la identificación de una ontología compartida para comunicación entre agentes. La “Fundación para Agentes Físicos Inteligentes” define un escenario de administración de servicios ontológicos dedicados a la gestión de ontologías mediante el modelo de comunicación, en el que aparece un par de componentes que interactúan por medio de mensajes editados en el “lenguaje de comunicación de agentes” basado en una ontología de comunicación. En complemento a los mensajes existe una ontología del dominio del conocimiento de la aplicación, la cual es manejada por medio de un administrador ontológico el cual proporciona servicios de consulta, traducción y equivalencia de conceptos.

Guillermo Choque Aspiazu
http://www.eldiario.net/
Septiembre 7 de 2009

No hay comentarios: