Ontologías e Inteligencia Artificial

qué-es-el-ser-ontologiaSegún el Diccionario de la Real Academia Española, ‘ontología’ es la “parte de la metafísica que trata del ser en general y de sus propiedades trascendentales”, sin embargo la noción de ‘ontología’ que a nosotros nos interesa procede del campo de la Inteligencia Artificial, y está vinculada a un vocabulario para expresar conceptos, propiedades y relaciones cuyas jerarquías de clases permiten la descripción y comprensión de un dominio. La finalidad de este esquema conceptual, dentro de un dominio dado, es la de facilitar la comunicación y la compartición de información entre diferentes sistemas.

La definición más común de ontología (Gruber 1993) en el contexto que nos ocupa nos dice que ésta es “a formal explicit specification of a shared conceptualization”, entendiéndose sus atributos de la siguiente manera:

  • Conceptualization: una forma de entender/describir un dominio
  • Shared: consensuada por un grupo, compartida por varias partes
  • Explicit: descrita en un lenguaje
  • Formal: comprensible para una máquina

Una ontología es pues una representación de algún aspecto de la realidad donde los conceptos y sus denominaciones se definen en razón de sus características como procesos, entes o propiedades. Por lo que atañe a la perspectiva de nuestro estudio, la característica principal de la ontología es la de ser una jerarquía taxonómica, cuyas relaciones permiten desambiguar la polisemia por medio de la selección de los significados próximos en el árbol. 


Las ontologías se empezaron a utilizar a finales de los 80 en el campo de la Inteligencia Artificial como medio para la compartición y la reutilización de conocimiento. En la segunda mitad de los 90, se empezaron a aplicar a la web para la inclusión de descripciones semánticas explícitas de recursos (contenidos y servicios). Hoy son un eje fundamental en las nuevas tecnologías para la Web Semántica.

Para que la información en la Web Semántica sea interpretada por los ordenadores sin necesidad de supervisión humana, es necesario codificarla mediante ontologías. Dichas ontologías representarán el conocimiento de Internet, definiendo formalmente los conceptos de los diferentes dominios y de sus relaciones, y dotarán a los ordenadores de la capacidad para realizar deducciones en base a este conocimiento.

Las principales áreas de aplicación de las ontologías son la ingeniería del conocimiento, la Gestión del Conocimiento, los sistemas de información cooperativos, la integración inteligente de información, la recuperación de información, el comercio electrónico y el procesamiento del lenguaje natural.

Dentro de esta última área las ontologías son una herramienta indispensable para la desambiguación del sentido de palabras (WSD), de la que dependen diversas aplicaciones de procesamiento de lenguaje natural como son: la categorización de texto, la traducción automática, la restauración de acentos, el encaminamiento y filtrado de textos, el agrupamiento y segmentación de textos, la corrección ortográfica y gramatical, y el reconocimiento de voz.

El artículo de Yuxiao Zhao y Kristian Sandahl titulado Potential advantages of semantic web for internet commerce describe un total de doce ventajas de la Web Semántica sobre la Web actual en diferentes campos. De éstas, hemos seleccionado aquellas en las que las ontologías juegan un papel fundamental.

  1. Búsqueda. Las búsquedas actuales por palabra clave arrojan una gran cantidad de resultados no deseados. Sin embargo, las búsquedas basadas en ontologías usan las relaciones y los axiomas de conceptos, gracias a lo cuál se pueden filtrar resultados aparentemente apropiados pero no deseados, y añadir resultados aparentemente diferentes.
  2. Gestión del conocimiento. La Gestión del Conocimiento incluye los procesos de captura, extracción, proceso y almacenamiento de conocimiento. Las ontologías permiten la extracción de datos web significativamente relacionados sin importar si son datos estructurados o no estructurados. Las ventajas de la Gestión del Conocimiento se ven materializadas a través de la manipulación ontológica de la información que precisa de herramientas de soporte como las de creación de ontologías, o las de manipulación y aprendizaje de ontologías (Staab: 2001; Maedche y Staab: 2001).
  3. Filtrado de Información. Las empresas generan grandes cantidades de datos; dentro del proceso de filtrado de estos datos se debe descartar la información no deseada y guardar aquella que posee valor añadido para la empresa. Teóricamente el filtrado semántico será mucho más efectivo que un filtrado en base a palabras clave.
  4. Flexibilidad y estandarización de vocabularios. Teóricamente, las ontologías permitirán a los usuarios escoger de una manera más flexible las palabras que deseen usar. En la práctica, hay autores que constatan una mejora en la comunicación entre departamentos de un grupo financiero estandarizando conceptos con la creación de un vocabulario central en un contexto ontológico.

 

 

Deja un comentario