El objetivo de las ontologías de la Web Semántica es dotar a los ordenadores de la capacidad de estructurar y manejar la información en base a una valoración semántica de sus contenidos, con la finalidad de que la inteligencia artificial pueda entender el significado del contenido.
La idea de Web Semántica como una segunda generación de la Web tiene como una de sus primeras fechas fundacionales mayo de 2001. Este nuevo concepto fue expuesto entonces por los investigadores Berners-Lee, James Hendler y Ora Lassila en un artículo publicado en la revista American Scientific, titulado precisamente The Semantic Web. En dicho artículo se muestra una Internet en la que los ordenadores son capaces, además de presentar la información contenida en las páginas web, de entender dicha información. Según los autores, la Web Semántica es una extensión de la web actual en la que la información tiene un significado bien definido, posibilitando que los ordenadores y las personas trabajen en cooperación.
Para materializar esta cooperación, la web necesita una nueva configuración de la información, de forma que ésta sea legible, tanto por los ordenadores como por las personas. Por consiguiente, el objetivo de la Web Semántica es dotar a los ordenadores de la capacidad de estructurar y manejar la información en base a una valoración semántica de sus contenidos, con la finalidad de que los ordenadores puedan entender el contenido de los documentos que alojan.
Con el fin de alcanzar este objetivo fundamental es preciso modificar la forma en la que trabaja la Web, perfeccionándola y ampliando sus capacidades semánticas, hasta ahora prácticamente inexistentes. Para ello, se han buscado nuevos lenguajes y herramientas que ordenen la información almacenada en Internet de manera similar al análisis semántico del lenguaje humano. La previsión es que esta semantización se lleve a cabo mediante la adopción de diferentes tecnologías, dos de las cuales ya son una realidad: el eXtensible Markup Language (XML) y el Resource Description Framework (RDF).
El lenguaje XML permite a los usuarios añadir una estructura a los documentos. Por otro lado, el lenguaje RDF es un marco en el que es posible describir la información para que la procesen las máquinas e intenta aportar significado a la estructura de los documentos.
El otro elemento clave de la Web Semántica son las ontologías, descritas como sistemas de expresiones que definen formalmente las relaciones entre términos. En este contexto, el objetivo fundamental de las ontologías es el de conseguir la desambiguación del sentido de las palabras en un documento, es decir, identificar el significado correcto de las palabras polisémicas según el contexto de los documentos.
Es en la segunda parte de este trabajo donde se pretende analizar en profundidad el papel que juegan las ontologías en la desambiguación del sentido de las palabras, función denominada Word Sense Desambiguation (WSD). La desambiguación de las palabras polisémicas ofrece la posibilidad de ampliar el abanico de resultados de las herramientas de sugerencia, pudiendo ofrecer sinónimos directos e incluso locuciones nominales de significado similar.
Por tanto, en esta parte del trabajo se realiza un repaso teórico sobre las ontologías, desde su definición más común hasta sus componentes básicos, pasando por sus diferentes tipologías y usos principales. A continuación se hace especial hincapié en el papel que juegan en las tecnologías semánticas, su funcionamiento junto a los metadatos RDF y su papel central en la futura Web Semántica.
Para ilustrar estos apartados teóricos se analizan las estructuras de la ontología WordNet y más detalladamente la de la ontología AdSense de Google. El trabajo finaliza con un análisis de los procesos de la herramienta ontológica de AdSense. En esta última parte se estudia la aplicación semántica de la ontología, su funcionamiento y los diferentes niveles de anotación ontológica descritos en el apartado teórico. A modo de recapitulación, se comparan WordNet y AdSense en base a la teoría vista a través de un cuadro resumen.
Para la realización de esta parte del proyecto de investigación se ha seguido el siguiente procedimiento: en primer lugar, se ha examinado la producción teórica sobre el tema, especialmente la procedente de bitácoras, comunidades y empresas de optimización en motores de búsqueda. En segundo lugar se ha procedido al estudio de los tutoriales de las empresas pay per click Overture y Google y de sus respectivas herramientas de sugerencia de palabra clave. En tercer lugar se ha analizado la herramienta ontológica de Applied Semantics y se ha complementado con documentación paralela centrada en ontologías y en tratamiento del lenguaje.