Google RankBrain ¿Que es? ¿Que hace?

It's only fair to share...Share on FacebookShare on Google+Tweet about this on TwitterShare on LinkedInEmail this to someone
Pin on Pinterest

En octubre pasado se publicó una entrevista de la Pubcon 2016 en la que Eric Enge (@stontemple) consulta al Googler Gary Illyes (@methode) acerca de varios temas dentro de los cuales estuvo RankBrain.

Este artículo resume parte de los dichos de Gary en esa entrevista e intenta dar un marco simple y práctico de ¿que es? ¿como funciona? y si podemos o no optimizar nuestro SEO para RankBrain.

¿Que puedes leer aquí?

  1. ¿Que es RankBrain?
  2. Inteligencia Artificial y Machine Learning
  3. ¿Como funciona una red neuronal?
  4. ¿Cuales son los problemas con Machine Learning?
  5. ¿Que hace RankBrain?
  6. ¿Que elementos se toman en cuenta en RankBrain?
  7. ¿Donde afecta o se aplica RankBrain?
  8. ¿Por que se llama RankBrain?
  9. Conclusiones

¿Que es RankBrain?

RankBrain es un algoritmo de Google que utiliza inteligencia artificial basada en Deep Machine Learning y Redes Neuronales multi capa cuya principal función es predecir el significado e intención de búsqueda para consultas que Google nunca ha visto.

Al utilizar inteligencia artificial, tiene la particularidad de aprender en función del entrenamiento que reciba y para ello requiere de enormes cantidades de datos que contengan la menor cantidad de ruido, es decir, que se encuentren relativamente ordenados o estructurados.

Rankbrain pertenece al algoritmo central Hummingbird y por tanto analiza TODAS las búsquedas que procesa Google, sin embargo, no posee siempre impacto en los rankings, sino que internamente el algoritmo se da cuenta de si debe participar o influir mas o menos en los SERPS finales. Si éste (Rankbrain u otro algoritmo, funciona para todos) reacciona frente a ciertas condiciones básicas de activación se inicia el procesamiento para dicho Query, el que dará un resultado que afectará en mayor o menor medida al SERP final. En que % lo haga, dependerá seguramente de factores como si es o no un Long Tail Query (LTQ) u otro en donde exista data suficiente como para aplicar machine learning y gatillar el procesamiento para dicho Query.

El algoritmo por otro lado tiene una parte manual, su esqueleto o framework si se quiere y probablemente recibe entrenamiento “manual” de parte de los ingenieros, con nociones básicas sobre como reaccionar frente a ciertas situaciones u otras acciones o toma de decisiones básicas.

Luego de ello se somete al algoritmo a “entrenamiento de datos”, que no es otra cosa que alimentar de patrones al algoritmo, en donde va asociando si el resultado fue malo, mediocre o bueno en una escala de 0 a 1 para cada Query.

Parte de estos patrones lo configuran como ya es sabido NLP Natural Language Procesing, vectorizando las palabras de manera de poder identificar muy fácilmente su contexto. Reconoce queries similares basado en el análisis de vectores de alta dimensión y la proximidad de un query (vector) con el otro.
Ej: Si buscas la palabra pantera, posiblemente estés buscando el animal o el grupo musical o la película. En este caso la palabra pantera asociada al animal tendrá ciertas coordenadas X,Y (no se si estén utilizando eje Z pero no sería raro) y cierto ángulo de inclinación con respecto al centro. Así, la palabra Pantera para el grupo de música tendría otra coordenada X,Y y ángulo distinto. En la siguiente figura se entiende mas claramente, espero.

coordenadas-pantera

 

Inteligencia Artificial y Machine Learning

En 2012 Google contrató a Ray Kurzweil como director de ingeniería, el cual trajo una nueva visión de como procesar y enfrentar la información de internet por parte de Google, y con ello poder ofrecer mejores resultados a sus usuarios.

Rankbrain es un nuevo paso en la búsqueda de Inteligencia Artificial (AI) de parte de Google y para ello utiliza Machine Learning.

El Machine Learning no es otra cosa que el reconocimiento de patrones por parte de la máquina. Estos patrones son almacenados y luego de obtenerse cierta data (normalmente se requiere de mucha data) es posible procesarlos e ir identificándolos, valorándolos, asociándolos, etc. en donde la máquina va “aprendiendo” cuando el resultado fue satisfactorio o insatisfactorio.

 

Debido a la cantidad de patrones que deben procesarse al mismo tiempo es que Google decidió utilizar redes neuronales multicapa o Multi Layer Neural Networks, que permiten el procesamiento de grandes cantidades de información de forma paralela tal como sucede en nuestro cerebro, y no de forma lineal como sucede normalmente en el mundo digital como nos dice Ray Kurzweil en su libro La Singularidad esta cerca.

Esta nueva capacidad de procesar múltiples cosas se consigue haciendo tomar una decisión a cada neurona.

¿Como funciona una red neuronal?

Pero las redes neuronales tienen un problema que hasta ahora limita a los ingenieros de Google y es poder saber que sucede dentro de las capas profundas de cada red o más bien que decisiones se tomaron a nivel de cada neurona y capa neuronal, pudiendo solo hacer debug, por ahora, en una sola capa y esperando a que ese resultado represente en gran parte a la totalidad.

¿Cuales son los problemas con Machine Learning?

Para poder entrenar un algoritmo se requieren dos cosas fundamentales:

  • Grandes cantidades de data
  • Que esta data esté ordenada de manera de que el algoritmo pueda entenderla

Si falta una de ellas el algoritmo comienza a entregar resultados extraños.

 

¿Que hace RankBrain?

La indicación inicial que se nos dio y que como veremos más adelante ha variado en el tiempo, es que la principal tarea de RankBrain es la de entender la búsqueda.

Para ello establece elementos como: El significado de las palabras, la relación que estas tengan y finalmente la intención o sentimiento del usuario al realizar una búsqueda.

Gary Illyes

“Rankbrain utiliza muchas señales o factores, pero esencialmente ajusta los rankings basado en el query”

¿Que elementos se toman en cuenta en RankBrain?

Es muy probable que fuera del NLP esté utilizando otros elementos para poder establecer con mayor claridad la intención y significado de búsqueda. Para ello utiliza tu historial de búsquedas, CTR del SERP, rankings históricos  y muchos otros.

¿Donde afecta o se aplica RankBrain?

En donde mejor funciona y de paso más se utiliza Rankbrain, es para entender las consultas que Google nunca ha visto, que ojo, no son pocas, cerca de un 20% del total de búsquedas diarias, lo que lo ha llevado a ser rápidamente el TERCER FACTOR DE RANKING MAS IMPORTANTE (Fuente: Eric Enge entrevista a Gary Illyes en Pubcon 2016), Luego de los contenidos (Panda) y Enlaces (Penguin).

Cuando hablamos de búsquedas que Google nunca ha visto nos referimos en su mayoría a LTQ o búsquedas de cola larga que es en donde Rankbrain brilla siendo capaz de predecir cual sería un mejor resultado en rankings a partir de la comparación y procesamiento de queries similares realizadas en el pasado y de cómo fueron evaluados los resultados.

Normalmente se usa coleccionando datos sobre una Query especifica que ayudan a decidir como rankear los resultados.

Gary Illyes

“Es una de las cientos de señales que tenemos como componentes del Ranking”

¿Por que se llama RankBrain?

Aquí nuestra teoría. Google Brain es un proyecto iniciado en 2011 que se ha convertido en un framework que busca entender y profundizar en Machine Learning.

Es muy probable que el nombre provenga de éste equipo de trabajo cuya misión es adentrarse en la investigación y uso de Inteligencia Artificial AI. Machine Ranking hubiese sido algo mas tosco, Artificial Rank tampoco pegaba mucho, por lo que “Brain Rank era el nombre”, según los propios dichos de Gary, supongo que luego simplemente dieron vuelta las palabras para que sonara mas armónico y voilà Rank Brain.

Conclusiones

Según los últimos dichos de Gary Illyes, RankBrain no solo actúa frente a las búsquedas sino que interviene en los rankings finales.

Es muy probable que Rank Brain esté utilizando la experiencia completa del usuario gravada o monitoreada vía Chrome o Android y solo se encuentren intentando ordenar la data de tal manera de que sus algoritmos de AI puedan entenderla y así pasar al próximo nivel y convertirse en el principal factor de Ranking incluso por sobre Panda y Penguin durante los próximos meses o par de años.

El debate está abierto y te invito a comentar y compartir éste artículo que pretende abrir un punto de vista acerca de RankBrain que hasta ahora no hemos considerado y que al parecer está ahí desde hace un tiempo.

It's only fair to share...Share on FacebookShare on Google+Tweet about this on TwitterShare on LinkedInEmail this to someone
Pin on Pinterest

Deja un comentario