Google RankBrain: aclarando los mitos y conceptos erróneos

Han pasado casi 3 años y medio desde que Google anunció por primera vez el uso de RankBrain (26 de octubre de 2015, pero comenzó a implementarse a principios de 2015, en varios idiomas).

En ese tiempo, ha habido pocos detalles provenientes de G sobre qué es o cómo funciona.

El resultado es que numerosos SEO se han intensificado para llenar ese vacío con sus propias especulaciones y opiniones, y al hacerlo, han causado todo tipo de confusión.

Este es mi intento de corregir y limpiar parte de ese desorden.

(Hay un TL: DR en la parte inferior si desea omitir la verborrea: D)

¿Qué hace RankBrain?

Aunque no hay mucho disponible públicamente, lo que tenemos es bastante específico:

Si RankBrain ve una palabra o frase con la que no está familiarizado, la máquina puede adivinar qué palabras o frases podrían tener un significado similar y filtrar el resultado en consecuencia, haciéndolo más efectivo en el manejo de consultas de búsqueda nunca antes vistas. .

– Greg Corrado, de Bloomberg Google entrega su lucrativa búsqueda web a máquinas de inteligencia artificial}

O, si lo desea más conciso que eso;

“… Déjame intentarlo una última vez: Rankbrain nos permite comprender mejor las consultas. … ”

– Gary Illyes (@methode), en Twitter

Google recibe un porcentaje justo de consultas por día que no ha visto antes: 15% en la última verificación.

Estos pueden incluir errores ortográficos y errores tipográficos, elisiones / omisiones, frases / estructuras sintácticas inusuales, palabras incorrectas que se utilizan, negaciones (“no x”), cosas que acaban de suceder, etc., etc.

RB recibe estas búsquedas nuevas, maravillosas y extrañas, e intenta identificar las búsquedas existentes y los resultados que probablemente sean adecuados para la consulta del buscador.

¿Cómo funciona RankBrain?

Una vez más, G no nos dio exactamente una visita guiada sobre esto, pero hay algunas partes.

“… RankBrain usa inteligencia artificial para integrar grandes cantidades de lenguaje escrito en entidades matemáticas, llamadas vectores, que la computadora puede entender. Si RankBrain ve una palabra o frase con la que no está familiarizado, la máquina puede adivinar qué palabras o frases podrían tener un significado similar y filtrar el resultado en consecuencia, haciéndolo más efectivo en el manejo de consultas de búsqueda nunca antes vistas. . … ”

– Greg Corrado, de Bloomberg: Google entrega su lucrativa búsqueda web a máquinas de inteligencia artificial

Entonces, en lugar de mirar palabras e intentar analizarlas y comprender la semántica (procesamiento tradicional del lenguaje natural [NLP]), los convierte en números y los traza en un gráfico (con múltiples dimensiones, no solo X e Y).

Los elementos cercanos poseen algún tipo de relación. El tipo de relación se reflejará en la posición de cada término y la distancia de sus vecinos.

Si eso suena vagamente familiar, es porque suena muy similar a Word2Vector.

Entonces, cuando G recibe una consulta que no reconoce del todo, puede encontrar piezas relacionadas semánticamente y observar los resultados.

Pero, ¿y si está mal?

Bueno, ahí es donde puede aparecer la respuesta de Gary Illyes a una pregunta sobre su reciente Reddit AMA:

“…

RankBrain es un componente de clasificación de aprendizaje automático atractivo para las relaciones públicas que utiliza datos de búsqueda históricos para predecir en qué es más probable que un usuario haga clic para una consulta nunca antes vista. Es una pieza de ingeniería realmente genial que nos salvó el trasero innumerables veces cuando los algoritmos tradicionales eran como, por ejemplo, “¡mira un” no “en la cadena de consulta! ¡Vamos a ignorarlo! ”, pero generalmente se basa en (a veces) datos de meses de antigüedad sobre lo que sucedió en la página de resultados, no en la página de destino. Tiempo de permanencia, CTR,… esos son generalmente una mierda. La búsqueda es mucho más simple de lo que la gente piensa.

… ”

– Gary Illyes (@methode), en Reddit

Agregué la negrita para llamar la atención sobre la parte clave.

G puede volver atrás y ver en qué se hace clic para diferentes búsquedas y verificar su rendimiento. Esto puede ayudar al sistema a saber qué sugerencias son adecuadas y cuáles no.

Si quieres algo con un poco más de carne, ¿quizás quieras algunas patentes?

Si es así, tuve la suerte de recibir ayuda de Bill Slawski, quien me señaló dos patentes potencialmente interesantes:

Greg Corrado trabajó en la primera patente (computación numérica …), a partir de la cita de Bloomberg a la que se hizo referencia anteriormente.

Si no le apetece sufrir el trauma de leer las patentes, Bill tiene dos partes mucho más agradables que le brindan información sin la necesidad de analgésicos:

Ejemplo de lo que RankBrain puede estar haciendo

¿Qué tal si revisamos una demostración simple del tipo de cosas que hace RB?

Consulta: Cómo Nemee 2020

Google recibe esa consulta y no tiene nada que parezca coincidir y poco que parezca por encima de una relevancia débil.

Entonces, necesita hacer algo de trabajo.

  • Puede identificar el tipo de consulta mediante el uso de “cómo”.
  • Puede identificar un factor de tiempo en “2020”.
  • O puede identificar varios potenciales para “nemee”, incluido “meme”.

La consulta se vectoriza y se encuentran los vecinos más cercanos para esos vectores.

En los resultados se incluyen vectores que representan:

  • “Cómo”
  • “Cómo puedo”
  • “Como la gente”
  • “crear un meme”
  • “Pronunciar meme”
  • “Di meme”

Entonces tenemos dos tipos de consultas probables:

  1. Una cuestión de cómo decir …
  2. Una cuestión de cómo hacer …

Pero tenemos un tercer factor, el “2020”. Cuando miramos los grupos de resultados, apenas hay consultas o resultados preexistentes que incluyan tiempo con pronunciación, donde hay un número moderado de consultas de “cómo hacer” y resultados que sí lo hacen.

RB decide que los resultados más probables que coinciden con esta consulta son los de las consultas de “cómo hacer”, por lo que los resultados que recibiría coincidirían;

como hacer un meme 2020”.

¿RankBrain usa señales de experiencia del usuario?

No.

Y de eso se trata esta publicación: aclarar todas las tonterías que algunas personas han estado presionando sobre “Tiempo de permanencia”, “Tasa de clics” y “Rebotes”, etc.

RankBrain no usa señales de UX de tus páginas.

Para una confirmación rápida;

“… Tiempo de permanencia, CTR, … esos son generalmente una mierda … “

Eso es de la respuesta AMA de Gary que cité anteriormente.

Pero puedes usar un poco de sentido común en este punto.

Hágase la siguiente pregunta:

¿Por qué un sistema que está construido para tratar de encapsular las relaciones entre cadenas de texto estaría observando cuánto tiempo pasó alguien en una página o qué tan rápido se fue?

Cuando se detiene y lo mira de esa manera, y considera el ejemplo anterior, puede ver cómo las señales de UX basadas en el sitio no tienen relevancia para RankBrain.

La única métrica de este tipo que sabemos que pueden usar son los clics basados ​​en SERP para identificar qué tipo de resultados parecían relevantes para ese tipo de consulta.

¿Puedes optimizar para RankBrain?

Si.

Google incluso nos ha dicho que podemos 😀

“…
Optimizar para RankBrain es realmente muy fácil, y es algo que probablemente hemos estado diciendo durante quince años, y la recomendación es, escribir en lenguaje natural. Intente escribir contenido que suene humano. Si intentas escribir como una máquina, RankBrain se confundirá y probablemente te empujará hacia atrás. Pero si tiene un sitio de contenido, intente leer algunos de sus artículos o lo que sea que haya escrito, y pregunte a la gente si suena natural. Si suena conversacional, si suena como lenguaje natural que usaríamos en su vida diaria, entonces seguro, está optimizado para RankBrain. Si no es así, entonces está “anulando la optimización
… ”

– Gary Illyes (@methode), hablando con TheSEMPost

Lo sé, es un poco tonto.

Pero, si retrocede un poco, ¡G ha explicado cómo optimizar para RankBrain!

  • “… Si RankBrain ve una palabra o frase con la que no está familiarizado … ”
  • “… haciéndolo más efectivo en el manejo de consultas de búsqueda nunca antes vistas … ”
  • “… predecir en qué es más probable que haga clic un usuario para una consulta nunca antes vista … ”

Todo lo que tiene que hacer es enfrentarse a las prácticas estándar de SEO y apuntar a exactamente lo contrario de lo que normalmente buscaría: un alto volumen de búsqueda.

En su lugar, observe todas las consultas y luego genere variantes que no están en las listas.

¡Lo sé, eso es aún más tonto!

(Pero, sea honesto, quería saber: D)

Pero hay más, especialmente para aquellos que tratan con contenido relevante para el tiempo; eventos y ocurrencias.

Como son “nuevas”, es probable que las consultas también lo sean (al menos parcialmente). Para obtener una ventaja aquí, es posible que pueda realizar búsquedas similares usted mismo y observar los patrones que poseen. Una vez que tenga algunas muestras y los datos de volumen de búsqueda asociados, puede elegir los que considere más ventajosos y relevantes, y luego incorporarlos a su contenido.

Si desea un poco más de información sobre RB y cosas como Association Rule Learning (profundizando en el lado de la informática), Dan Taylor tiene un artículo anterior que puede ser de interés: Así es como RankBrain impacta (y no) SEO

¿RankBrain influye en las clasificaciones?

No, es una cuestión de inclusión.

Aunque Google ha declarado que RB es uno de los factores de clasificación más influyentes, no es un factor de SEO típico.

A diferencia de los títulos o el texto del enlace, no es un degradado ni una variable, es booleano.

O lo perciben como relevante y lo incluyen en las SERP para una consulta, o no lo está.

Por lo tanto, puede optimizar para RankBrain, pero no es una cuestión de influencia en el ranking, es una cuestión de inclusión de índices.

TL; DR

¿Qué hace RB?

Intenta responder consultas desconocidas observando los datos de búsqueda anteriores y la relación de los términos utilizados en esas búsquedas.

¿Cómo hace eso RB?

Convirtiendo palabras en números y trazándolas en espacio vectorial.

Luego, puede dividir una consulta en partes y buscar términos similares en el espacio vectorial para tratar de comprender la relación y la intención potencial de la búsqueda.

Ejemplo:

Consulta: “cómo nemee 2020”

Convierta consultas en vectores, encuentre los vectores más cercanos, intente calcular coincidencias probables.

Aparecen dos tipos de consultas distintos; “Crear” y “decir”.

“2020” se asocia más fuertemente con “crear” que con “decir”.

RB devolverá SERP para “como hacer un meme 2020”.

¿RB usa UX?

No.

Maneja palabras y vectores.

No se utilizan elementos como la tasa de rebote, los clics largos, etc.

¿Puedes optimizar para RB?

Si.

Escribiendo de forma natural y asegurándose de que su contenido contenga variaciones.

Para algunos tipos de contenido (ocurrencias / eventos / noticias), es posible que pueda verificar búsquedas similares y adelantarse al resto.

¿RankBrain influye en las clasificaciones?

No en el sentido tradicional de SEO. No se trata de “posición”, se trata de si se muestra para esa consulta o no.