Cuando en el año 2001 Berners-Lee publicó su artículo, la Web Semántica parecía un proyecto con vistas a largo plazo. Sin embargo, transcurridos sólo dos años fue posible constatar una primera aproximación a esta Web Inteligente de manos de una de las empresas que mejor se identifica con la Web.
En marzo de 2003 Google adquirió la empresa Applied Semantics, y fue entonces cuando algunos especialistas se atrevieron a afirmar que Google se estaba semantizando por completo. La unión de su base de datos de contenidos con la ontología de Applied Semantics fue la que consumó este paso adelante hacia la Web Semántica.
A raíz de aquella compra su puso oficialmente en marcha el programa de anuncios contextuales Google Content-Targeted Advertising, conocido comercialmente como Google AdSense. El mismo Google define AdSense en su apartado de preguntas frecuentes:
«AdSense de Google es un método rápido y sencillo para que cualquier editor de sitios Web pueda publicar en sus páginas de contenido anuncios Google relevantes y ganar dinero gracias a ellos. Dado que los anuncios están relacionados con lo que los usuarios buscan en su sitio, este programa le ayudará a obtener beneficios económicos de sus páginas de contenido al tiempo que las mejora. El programa es gratuito y Google le paga por los clics válidos que reciban los anuncios Google de su sitio».
El programa piloto permitía a los grandes sitios web integrar los anuncios de Google AdWords en sus propias páginas. Al principio cada contrato era negociado independientemente con Google, y no podían participar los sitios web con menos de 20 millones de visitas al mes. El actual programa Google AdSense permite participar a sitios web más pequeños, incluso a aquellos con sólo unos cientos de visitas mensuales.
Cómo funciona AdSense
Google AdSense permite a los propietarios de un sitio web insertar publicidad contextual. Los anuncios de Google AdWords aparecen en los sitios web dados de alta en el programa AdSense y Google paga entre 30 y 50 céntimos por cada clic sobre los anuncios insertados en los sitios.
Los sitios aceptados en el programa AdSense simplemente han de insertar un trozo de código HTML en sus páginas web. Automáticamente el sitio es indexado por un spider ‘semántico’, y los resultados son usados para encontrar anuncios que concuerden con el contenido del sitio. Esto permite a Google insertar un banner o un anuncio tipo skyscraper que contiene la publicidad de pago.
A pesar de que el programa abrió sus puertas a los pequeños sitios, no todos son aceptados. Google revisa los sitios para asegurarse que cumplen ciertas condiciones. Entre aquellos no elegibles están los sitios que incluyen contenidos acerca de drogas, pornografía o juego.
En principio tampoco están permitidas las páginas personales, y de forma similar algunos blogs pueden ser rechazados, dado que cubren una amplia variedad de temas siendo difícil encontrar un tema target. Aún así, la política actual de Google es revisar caso por caso para comprobar si encajan en su red de anunciantes. Si finalmente son aceptados, la tecnología contextual de Google entrega automáticamente listados de anuncios que encajan con el contenido temático de un sitio.
Qué tecnología utiliza AdSense
Google lanzó AdSense justo después de adquirir la empresa Applied Semantics, siendo su piedra angular la tecnología desarrollada por esta empresa.
Los productos de Applied Semantics estaban basados en su tecnología CIRCA, siglas de Conceptual Information Retrieval and Communication Architecture, cuya característica principal es su capacidad de encontrar conexiones entre objetos que están relacionados de alguna manera, ya sea directamente o a través de un concepto o idea.
El sistema establece las relaciones entre objetos a partir de lo que denomina como ‘espacio semántico’. Dentro de este espacio las relaciones entre objetos vienen determinadas por una ‘distancia conceptual’ de mayor o menor proximidad.
El ‘espacio semántico’ es definido por una enorme ontología que se halla detrás de tecnología CIRCA. Esta ontología establece cómo diferentes conceptos están relacionados unos con otros. Además está unida a una taxonomía, cuyos conjuntos jerarquizados de categorías permiten organizar fácilmente la información.
Extrayendo el significado y las relaciones de una página web por medio de la ontología y haciendo corresponder esta información en su taxonomía, CIRCA permite a AdSense servir anuncios relevantes en un sitio web a pesar de que las palabras clave base de dicho anuncio no sean idénticas a ninguna de las del sitio.