Knowledge Graph y la Web Semántica

It's only fair to share...Share on FacebookShare on Google+Tweet about this on TwitterShare on LinkedInEmail this to someone
Pin on Pinterest

¿Alguna vez le has preguntado algo a Google? Seguro que has escrito en la barra del buscador cosas como “cuántos gramos son una taza”, “cómo convertir un video en .avi a .mp4”, “cuál es la capital de Bután” “quién escribió Cumbres borrascosas”; y claro lo que sucede es que Google te lista un montón de resultados ordenados según las coincidencias con tus preguntas, porque Google no sabe la respuesta, pero te puede señalar opciones relevantes de acuerdo a lo que has escrito.

Según lo anterior, Google es un buscador que cumple con su objetivo básico: arrojar resultados de búsqueda que puedan atender necesidades, como un buen convertidor de medidas o formatos, una buena enciclopedia, un traductor, etc. Lo que Google ha hecho por mucho tiempo es recomendar, pero esta vez quiero mostrarte que con la evolución de Internet, la cantidad de contenido disponible en la nube y las posibilidades de optimización, Google ya no solo recomienda, sino que está trabajando para poderte dar más respuestas cada día.

La web semántica

La web está construida a partir de documentos en HTML, un lenguaje de maquetación basado en etiquetas que se encarga de organizar el contenido de un sitio para que muestre los títulos como títulos, el texto organizado en párrafos y tablas, y los objetos audiovisuales que queramos insertar. Las etiquetas funcionan como instrucciones para el navegador, es decir que el usuario solo se encuentra con el contenido dispuesto como lo hemos indicado.

Sin embargo, las etiquetas no solo sirven para dar instrucciones de display, sino que también permiten añadir información adicional sobre nuestro contenido, que solo será leída por el navegador y por los motores de búsqueda. Esto quiere decir que es posible describir lo que hemos producido ante los ojos de Google para que sea considerado no solo como un artículo sino como algo más específico: una reseña de un libro o una película, un producto con todos sus detalles, una receta, datos de contacto, entre otras cosas.

La semántica estudia el significado de las palabras, y la web está llena de contenido escrito, así que la web semántica es un conjunto de actividades que se basan en la idea de que es posible agregar significados a dicho contenido para describirlo, entenderlo y relacionarlo entre sí, con el fin de mejorar la experiencia de los usuarios en Internet.

Veamos un ejemplo. Cuando escribimos algo para la web, un navegador leería un título así:

<h2>Kill Bill Vol.1</h2>

El título está bien tal y como está escrito, sin embargo, si yo quisiera contribuir con la web semántica podría añadir un elemento al contenedor de dicho título, en el que señale que todo el contenido que viene a continuación trata sobre un solo tema, y podría agregar un atributo a esa línea de código en la que está el título para especificar que “Kill Bill Vol.1” es una película, como expliqué en mi artículo sobre markup y schema.org. Esto, a grandes rasgos, haría que todos los datos que yo estoy publicando sean tenidos en cuenta para que Google tenga una idea cada vez más clara sobre “Kill Bill Vol.1”. Así, la próxima vez que alguien escriba “Kill Bill” en la barra del buscador, Google no solo recomendará sitios para leer más, sino que tendrá la respuesta ahí mismo.

Knowledge graph y la web semántica

En 2012 Google añadió al motor de búsqueda un gráfico de conocimiento basado en búsqueda semántica, en función de proveer respuestas estructuradas a los usuarios, además de los resultados de búsqueda de otros sitios web.

Tim Berners-Lee fue el creador del lenguaje HTML, del sistema de localización de objetosURL y el protocolo HTTP, tecnologías en las que se basa gran parte de la web. Su idea inicial, desde que logró conectar un cliente y un servidor por primera vez en la historia, estaba dirigida hacia la web semántica. Por eso en 1994 fundó la W3C, una comunidad internacional que trabaja para desarrollar guías y lineamientos estándar, como los deschema.org, con el fin de sacar el mejor potencial de la web. La W3C pretende apoyar y dar soporte a una web basada en datos que permitan a los computadores hacer un mejor trabajo en función de nuestra experiencia en Internet.

Componentes de la web semántica

En principio la web semántica se compone de metalenguajes y frameworks que hacen posible la interoperabilidad de las máquinas, como XML, RDF y SPARQL.

XML es un lenguaje de markup, como HTML, que permite almacenar datos en documentos estructurados; RDF es un framework que define el modelo conceptual para describir datos; SPARQL es un lenguaje de consulta para RDF. Los tres se interrelacionan y son tecnologías esenciales y básicas para el desarrollo de la web semántica.

Actualmente estos componentes se han condensado en un solo lenguaje de marcado ontológico llamado OWL, que está diseñado para aplicaciones que necesitan procesar la información, además de presentarla para los usuarios de internet. OWL hace parte del stack de recomendaciones de la W3C relacionadas con la web semántica, pues es un lenguaje que va más allá de XML y RDF, pues aporta más vocabulario para describir propiedades y clases.

Barreras de la web semántica

Al entender la web semántica como concepto surgen tres barreras puntuales que hacen que esto no sea una realidad completa en la web hoy en día.

  1. La forma de contribuir con la web semántica recae en una sola cosa: datos. Para que Google pueda tomar datos de diferentes sitios web es necesario que todos los contenidos estén escritos de manera estándar, considerando los componentes anteriores. Solo así el navegador podrá identificarlos y el motor de búsqueda hará la relación entre ellos.
    Para lograr lo anterior es necesario que todos los webmasters editemos el contenido de nuestros sitios manualmente, según los lineamientos de la W3C, y esto es una tarea dispendiosa que no todos están dispuestos a realizar, considerando que el fin es un bien común.
  2. La web semántica supone una amenaza clara para los websites que viven de publicidad, pues la consecuencia de que los contenidos de la web estén escritos de manera estándar es que Google podría dar las respuestas a las consultas de los usuarios en su página de resultados de búsqueda. En ese sentido se vuelve innecesario visitar los sitios que aparecen en los SERPs, independientemente de su posicionamiento, y esta sería otra razón por la que no se haría la optimización del contenido, pues nuevamente, es para un bien común.
  3. Gran parte de las personas que trabajan en Internet, sobre todo en la producción de contenido, tienen la idea de que Google se ha desviado de su esencia inicial de filtrar y rankear el mejor contenido para los usuarios, y esa es una de las razones principales por las que no consideran la optimización del contenido como algo relevante. Un ejemplo claro de esto es la idea falsa de que Google intenta hacerle competencia a otras redes sociales con Google+, cuando lo que realmente pretende es eliminar el anonimato de la web. Asociar nuestro contenido con nuestras cuentas de Google+ fue una muy buena práctica de SEO hasta el 2014, pues no solo contribuía con nuestra autoridad y reputación online sino que nos daba puntos en posicionamiento porque estábamos colaborando con la descripción de un contenido disponible en la web.

Fuente: https://platzi.com/blog/knowledge-graph-y-la-web-semantica/

It's only fair to share...Share on FacebookShare on Google+Tweet about this on TwitterShare on LinkedInEmail this to someone
Pin on Pinterest

Deja un comentario