lunes, 21 de mayo de 2012

Información imperfecta

La información cotidiana con la que se trabaja está afectada de ciertas imperfecciones. El ser humano funciona habitual y sorprendentemente bien con ellas. Sin embargo, estas imperfecciones plantean dificultades de uso computacional. Según Francisco Crespo, en su tesis de doctorado del año 2003 titulada “Un modelo paramétrico matemático difuso para la estimación del esfuerzo de desarrollo del software”, la información perfecta es aquella que no contiene imperfecciones tales como la imprecisión, la vaguedad, la ambigüedad, la aleatoriedad o la incertidumbre. Sin embargo, en la realidad se trabaja con diferentes tipos de imperfección en la información, que provienen de distintos orígenes. Por ejemplo, la aleatoriedad es una fuente de imperfección en la información que se ha estudiado extensamente en el campo de la “Teoría de la Probabilidad”. Por otro lado, el lenguaje natural utiliza la vaguedad en la comunicación como una de sus características más habituales. En el contexto de los sistemas de información, en muchas ocasiones se utiliza el término incertidumbre para hacer referencia a varios de esos tipos de imperfección en la información o en los datos. En la introducción realizada en el libro escrito por Klir y Wierman, el año 1998 titulado “Información basada en incertidumbre”, la palabra incertidumbre se utiliza como término general que hace referencia a diferentes deficiencias en la información: La información, que pertenece al modelo dentro del cual se está conceptualizando la situación, puede ser incompleta, imprecisa, fragmentada, no completamente fiable, vaga, contradictoria o deficiente de alguna otra forma. En general, estas diversas deficiencias en la información pueden derivar en diferentes tipos de incertidumbre.

Por otro lado, según el Diccionario de la Real Academia de la Lengua Española, el término incertidumbre se define como la “falta de certidumbre o certeza”, remitiendo al término certeza, que cuenta con dos acepciones: “Conocimiento seguro y claro de algo” y “firme adhesión de la mente a algo, sin temor de errar”. Los términos seguridad y claridad hacen referencia a dos tipos fundamentales de imperfección en la información, no necesariamente excluyentes: La incertidumbre es la imperfección resultante de la duda o inseguridad de la adecuación a la realidad de una determinada proposición o información. Por ejemplo, si no se está seguro de la edad de un estudiante, pero se sabe que es joven, y se afirma que “el estudiante tiene 21 años”, la proposición es precisa pero incierta. Este tipo de imperfección se encuentra en la persona, o el agente o sistema, que duda sobre la realidad. La imprecisión es la imperfección sobre el contenido mismo de la proposición. En la situación anterior, si se afirma “el estudiante es joven”, la proposición es imprecisa pero no incierta. Este tipo de imperfección está contenido en la propia información.

Según el investigador Villar, en la tesis de grado del año 1997 titulada “Aplicación de la teoría de conjuntos borrosos al diagnóstico de procesos industriales”, en la mayor parte de las ocasiones en las que se llevan a cabo procesos de toma de decisiones en el mundo real, la información de que se dispone es de algún modo imperfecta al no poder ser expresada de una manera precisa, cierta, completa y consistente. Así, la imperfección en la información debe ser entendida en su sentido más amplio en donde la imprecisión, la vaguedad, la incertidumbre y la erroneidad son los aspectos más significativos que la caracterizan. La imprecisión se presenta por la ausencia de especificidad en la información. Se puede tener total certeza sobre la veracidad de la afirmación, pero resulta ser totalmente imprecisa y por lo tanto poco específica. Por el contrario, cuanto más precisa es una información, menor es la veracidad de la misma y mayor su concreción. La presencia de parecidos parciales genera la existencia de grados de verdad parciales que dan lugar a la vaguedad en los conceptos. Usualmente la vaguedad aparece en afirmaciones de uso común en el lenguaje hablado, tanto en la vida cotidiana como en ambientes más técnicos o científicos, considerados generalmente más precisos.

La incertidumbre concierne al estado de conocimiento acerca de la certeza de un suceso. Así, la certeza puede ser verdadera o falsa, pero el conocimiento puede no permitir decidir entre la veracidad o falsedad del suceso. Existen varias formas usualmente frecuentes de expresar la incertidumbre en el lenguaje hablado. Una muy habitual es considerar probabilidades, generalmente subjetivas, o considerar posibilidades. En todas ellas hay diferencias semánticas importantes que dan lugar a distintas formas de entender la incertidumbre. Por otro lado, no debe confundirse la incertidumbre de una información con los grados de verdad parciales. La erroneidad o incoherencia en la información se da cuando ésta es incompatible con el conocimiento disponible. Para evitar una confusión terminológica, se utiliza el término imperfección en sentido general, y para discutir aspectos específicos, que afecten sólo a un tipo determinado, se hace referencia explícita a la clasificación del investigador Smets, en el artículo escrito el año 1997 titulado “Información imperfecta: Imprecisión-incertidumbre”, según la cual, los diferentes modelos de información “imperfecta” se pueden categorizar en tres grupos, dependiendo de la fuente de la imperfección: (1) Imprecisión. En este caso existe falta de exactitud en la información, que puede o no contener un error, de modo que se tienen dos subgrupos: (a) Imprecisión con error. Si hay un error con respecto a la realidad, se tiene imprecisión combinada con error, que puede variar desde una pequeña inexactitud, hasta información completamente incorrecta e incluso carente de sentido. (b) Imprecisión sin error. Hay casos en los cuales la información es vaga, pero no errónea. En otros casos, la información es incompleta, aunque no errónea. (2) Inconsistencia. Cuando se combina varias fuentes de información, se puede dar el caso de información inconsistente, cuando las afirmaciones entran en conflicto o son incoherentes. (3) Incertidumbre. La incertidumbre hace referencia al estado de conocimiento del individuo sobre la relación entre una información y la realidad.

Algunas de las medidas que cuantifican la información imperfecta, conocidas como técnicas de representación de la información imperfecta, son las siguientes: (1) La medida difusa de Sugeno. El año 1977 el profesor Sugeno, en el artículo titulado “Medidas difusas e integrales difusas: una guía”, estableció los axiomas fundamentales que cualquier medida de incertidumbre e imprecisión debían satisfacer. (2) Teoría de la probabilidad. La teoría de la probabilidad es una de las herramientas de modelado de la incertidumbre más antiguas en donde han dejado huella científicos de gran talla como Kolmogorov, Galileo, Fermat, Pascal, Bernoulli, Laplace, Gauss, Bayes, entre muchos otros. Se la considera la técnica de modelado de la incertidumbre con mayor uso en campos tan diversos como la investigación de operaciones, la economía, las finanzas, las comunicaciones, etc. (3) Modelos de cotas de probabilidad. En ocasiones, no es sencillo cuantificar la incertidumbre de manera precisa usando una única medida de probabilidad, y es necesario considerar un conjunto de medidas de probabilidad admisibles para el modelado de la incertidumbre, tal como se describe entre otros en el libro escrito el año 1981 por Walley, titulado “Razonamiento estadístico con probabilidades imprecisas”. En esta situación pueden definirse cotas de probabilidad superior e inferior para cada evento. (4) Conjuntos difusos y la teoría de la posibilidad. La teoría de conjuntos difusos, introducida por Lofti A. Zadeh en su publicación del año 1965 titulada “Conjuntos difusos”, marcó un hito en el modelado de la información imperfecta y sirvió para incluir a la teoría de conjuntos tradicional como un caso particular de la teoría de conjuntos difusos. La teoría de la posibilidad es una aplicación importante de la teoría de conjuntos difusos que fue introducida por Zadeh el año 1978, en el artículo titulado “Conjuntos difusos como una base para una teoría de posibilidades”, que permite modelar la imprecisión y la incertidumbre en la información en un mismo marco teórico.

Las técnicas de información imperfecta que complementan las presentadas en el párrafo anterior son: (5) La teoría de la evidencia. Desde que fue introducida por Dempster y Shaffer, en el artículo del año 1967 titulado “Probabilidades superior e inferior inducidas por una asignación de varios valores”, complementado con el libro del año 1976 titulado “Teoría de la evidencia”, dos de los objetivos principales que ha tenido la teoría de la evidencia concerniendo al modelado y cuantificación de la credibilidad atribuida a los eventos han sido, por un lado, establecer una representación formal de la imperfección de la información y, por otro, permitir que la información proveniente de diferentes fuentes pueda ser combinada para generar esquemas de inferencia que puedan ayudar a la toma de decisiones con algún grado de certeza. (6) Factores de certeza. Los factores de certeza fueron originariamente utilizados en el sistema experto MYCIN, reportado en detalle en el libro “Sistemas expertos basados en reglas: Experimentos MYCIN para el Proyecto de Programación Heurística de Stanford”, y han sido muy utilizados posteriormente debido a su simplicidad. Los autores de MYCIN decidieron no utilizar las técnicas proporcionadas por la teoría de probabilidad debido a que los siguientes son inconvenientes típicos de la teoría de la probabilidad: (a) Los expertos no consiguen expresar sus procesos de razonamiento en términos probabilísticos coherentes. (b) La probabilidad requiere de grandes cantidades de datos y muchas aproximaciones y suposiciones. Así, los creadores de MYCIN desarrollaron una nueva técnica, cuya base es la teoría lógica de la probabilidad, en donde la probabilidad es el grado de confirmación de una hipótesis con respecto a la observación de la evidencia.

Referencias Bibliográficas
  • Buchanan, B.G. and Shortliffe, E.H. (1984) Rule-Based Expert Systems: The MYCIN Experiments for the Stanford Heuristic Programming Project. Addison-Wesley, Reading, MA.
  • Crespo Yáñez, F.J. (2003) Un Modelo Paramétrico Matemático Difuso para la Estimación del Esfuerzo de Desarrollo del Software. Tesis de doctorado de la Universidad de Álcala. España.
  • Dempster, A.P. (1967) Upper and Lower Probabilities Induced by a Multivalued Mapping. Ann. Math. Statistics, vol. 38, pp. 325-339.
  • Klir, G. and Wierman, M. (1998) Uncertainty-Based Information. Elements of Generalized Information Theory. Springer-Verlag.
  • Shaffer, G. (1976) A Mathematical Theory of Evidence. Princeton: Princeton University Press.
  • Smets, P. (1997) Imperfect information: Imprecision-uncertainty. In Uncertainty Management in Information Systems. From Needs to Solutions, pages 225–254. Kluwer Academic Publishers.
  • Sugeno, M. (1977) Fuzzy Measures and Fuzzy Integrals: a survey, in Fuzzy Automata and Decision Processes. North Holland, Amsterdam: M.M. Gupta, G.N. Saridis and B.R. Gaines, pp. 89-102.
  • Villar, J. (1997) Aplicación de la teoría de conjuntos borrosos al diagnóstico de procesos industriales, en Departamento de Electrónica y Automática. Madrid: Tesis doctoral Universidad Pontificia de Comillas.
  • Walley, P. (1981) Statistical Reasoning with Imprecise Probabilities. London: Chapman and Hall.
  • Zadeh L. A. (1965) Fuzzy Sets. Information and Control, vol. 8, pp. 338-353.
  • Zadeh L. A. (1978) Fuzzy Sets as a Basis for a Theory of Possibility. Fuzzy Sets and Systems, vol. 1, pp. 3-28.
Guillermo Choque Aspiazu
http://www.eldiario.net/
Mayo 21 de 2012