jueves, marzo 28, 2024
No menu items!
InicioBlogsPor qué Google Search Console y Google Analytics Data nunca coinciden

Por qué Google Search Console y Google Analytics Data nunca coinciden

Una queja común sobre Google Search Console (GSC) es que los datos son “inexactos” en comparación con los resultados de Google Analytics.

Conoces la situación.

Todos lo hemos hecho.

¡Intenta alinear el tráfico a las páginas de destino desde los análisis con clics de Google Search Console y los números no se acercan!

Luego murmura algo sobre “no proporcionado” y envía un mensaje instantáneo a un amigo sobre los viejos tiempos en los que podía ver palabras clave en sus análisis.

Si bien es una cuestión de precisión, no se trata de exactitud per se.

Esa disparidad de datos es en realidad por diseño.

Analicemos los detalles y descubramos por qué es eso.

Google Search Console y Google Analytics no miden las mismas cosas

La explicación breve es que las dos fuentes de datos tienen diferentes metodologías de medición.

GSC se construye a partir de registros de consultas y clics, o selección, por lo que los datos serán algo similares a lo que podría esperar de sus propios archivos de registro de acceso (ya sabe, los archivos que le pide a DevOps para obtener acceso para el análisis del archivo de registro) .

Por el contrario, su paquete de análisis recopila datos del clickstream a través de JavaScript. Eso inherentemente introduce muchas variables para cómo las cosas se pueden medir tan bien como qué esas cosas son

Para comprender mejor qué causa las diferencias en los datos entre GSC y análisis, primero debe comprender cómo cada herramienta recopila y comprende los datos de comportamiento del usuario.

La anatomía de los registros de consulta y selección (clic)

La búsqueda incesante de Google de la calidad de búsqueda los lleva a rastrear una gran cantidad de puntos de datos para cada búsqueda y cada buscador, con la esperanza de obtener una comprensión completa de lo que está sucediendo en los SERP.

La anatomía de los registros de consulta y selección (clic)

Si bien han indicado muchas veces que no permiten que los clics y las tasas de clics influyan en las clasificaciones, a pesar de la evidencia en contrario, también han dicho que usan datos de clics para evaluar el rendimiento.

Por qué Google Search Console y Google Analytics Data nunca coinciden

Este ha sido uno de los argumentos en curso entre los Googlers de cara al público y los SEO.

Personalmente, creo que el lado de Google es un argumento semántico.

Existen varias medidas de evaluación que son estándar para la recuperación de información, tales como:

  • Clics
  • SERP abandono.
  • Tasa de éxito de la sesión.
  • Etc.

Como se puede imaginar, Google tiene su propio sabor llamado modelo de clics, atención y satisfacción (lea la explicación de Bill Slawski si necesita una traducción).

Se está discutiendo en un documento llamado “Incorporación de clics, atención y satisfacción en un modelo de evaluación de la página de resultados del motor de búsqueda” combinado con la metodología basada en clics resaltada en la patente de clasificación basada en el tiempo sugiere que alguien al menos se tomó el tiempo para pensar cómo los clics pueden afectar las clasificaciones.

Según el testimonio de Eric Schmidt en 2011, Google realizó “13,111 evaluaciones de precisión”. Eso sería un promedio de ~ 35 por día.

Por lo tanto, es lógico suponer que, si siempre está evaluando en un entorno de producción, como lo es el equipo de Búsqueda, entonces siempre existe la posibilidad de que los clics de los usuarios afecten las clasificaciones.

Y luego está esta sección de la Clasificación de resultados de búsqueda de modificación basada en la patente de estadísticas de búsqueda de corpus que habla sobre los registros de búsqueda y cómo podrían informar las clasificaciones en el futuro:

“La información almacenada en los registros de sesión 2060 o en los registros de búsqueda pueden ser utilizados por el motor de modificación de rango 2070 al generar una o más señales para el motor de clasificación 2030. En general, se puede recopilar una amplia gama de información y utilizarla para modificar o sintonizar la señal del usuario para hacerla, y los resultados de búsqueda futuros proporcionados, se ajustan mejor a las necesidades del usuario. Por lo tanto, las selecciones de los usuarios de uno o más corpus para emitir búsquedas e interacciones de los usuarios con los resultados de búsqueda presentados a los usuarios del sistema de recuperación de información se pueden utilizar para mejorar las clasificaciones futuras “.

Sin embargo, lo más interesante es el concepto de que estos registros presentan mucho ruido además de sus señales más valiosas.

Eso sugiere que tomar los clics por completo al pie de la letra sería un error.

¿De qué tipo de ruido estamos hablando?

Bueno, por ejemplo, ¿cuántas impresiones representan las herramientas de clasificación?

¿Cuántas veces presionas enter en autosuggest y luego te das cuenta de que activa una búsqueda de “fan” en lugar de “fantástico 4”?

O bien, ¿qué pasa cuando estás desplazándote en el móvil y accidentalmente gordo dedo el resultado incorrecto?

Todos estos son ejemplos de cómo los datos que recopila Google podrían presentar una gran cantidad de inexactitudes y deben dar cuenta de ellos.

Gracias por permitirme eso a un lado.

OK, entonces, ¿qué hay en los archivos de registro?

Si la documentación, ahora desaparecida, de Google Search Appliance es una indicación (que puede no serlo), los registros de consultas y clics son simplemente archivos de texto que registran datos sobre los usuarios y sus interacciones con el SERP.

🔥 Leer:  ¿Qué es el código de error Valorant 0? - ¿Hay una solución?

La documentación analiza los registros de búsqueda, que pueden ser o no lo mismo que los registros de consultas y clics, como se hace referencia en las patentes de Google.

A pesar de ser una versión simplificada del sistema, nos da una idea de lo que se rastrea: las características del usuario, su consulta y las características de lo que hacen clic.

Profundizando, en los Sistemas y métodos de Google para generar estadísticas a partir de patentes de registros de consultas de motores de búsqueda, hablan un poco más sobre cómo podría funcionar un sistema que podría impulsar una herramienta como Google Trends.

Para esta discusión, supongo que el conjunto de datos subyacente es similar, si no el mismo, a lo que alimenta Google Search Console y el Planificador de palabras clave de Google Ads.

Hablan sobre los registros de consultas de la siguiente manera:

“Un motor de búsqueda web puede recibir millones de consultas por día de usuarios de todo el mundo. Para cada consulta, el motor de búsqueda genera un registro de consulta en su registro de consultas. El registro de la consulta puede incluir uno o más términos de consulta, una marca de tiempo que indica cuándo la consulta es recibida por el motor de búsqueda, una dirección IP que identifica un dispositivo único (por ejemplo, una PC o un teléfono celular) desde el cual se envían los términos de la consulta, y un identificador asociado con un usuario que envía los términos de la consulta (por ejemplo, un identificador de usuario en una cookie del navegador web) “.

En otras palabras, los registros de consultas del motor de búsqueda son una versión un poco más robusta de los registros de búsqueda de GSA.

Los autores explican más detalladamente un poco más adelante en la patente con una discusión sobre cómo también se rastrean las cookies, los dispositivos, el idioma del usuario y la ubicación.

También proporcionan la siguiente figura para proporcionar una representación visual de los datos recopilados en el registro de consultas:

representación visual del registro de consultas

Dando más color al sistema, la patente discute este concepto de un registro de sesión, que es un mecanismo para determinar si un usuario dado ha realizado las mismas o similares búsquedas dentro del período de tiempo dado.

Esto es especialmente importante cuando se trata de medir e informar impresiones y / o volumen de búsqueda:

“Un registro de sesión de consulta incluye consultas muy espaciadas en el tiempo y / o consultas relacionadas con el mismo interés del usuario. En algunas realizaciones, el proceso de extracción de la sesión de consulta se basa en heurística. Por ejemplo, las consultas consecutivas pertenecen a la misma sesión si comparten algunos términos de consulta o si se envían dentro de un período de tiempo predefinido (por ejemplo, diez minutos) a pesar de que no hay un término de consulta común entre ellos “.

Las heurísticas a las que se hace referencia en lo anterior son quizás el núcleo de por qué Search Console y su paquete de análisis nunca coincidirán.

Esencialmente, lo que dice el autor es que Google toma una decisión en su registro de consultas para determinar si las búsquedas en su sesión son lo suficientemente únicas como para registrarse como distintas.

Por lo tanto, lo que puede creer que son dos visitas distintas a su sitio porque provienen de dos búsquedas diferentes que llegaron a dos páginas de destino diferentes podría potencialmente se considerará una búsqueda y, por lo tanto, una impresión, según cómo se registre en los registros de consultas de Google.

Registros de búsqueda de Google

Los registros de clics, por otro lado, presentan más información sobre el comportamiento del usuario una vez que se le presentan una serie de resultados.

La clasificación de resultados de búsqueda de modificación basada en la patente de estadísticas de búsqueda de corpus revela lo que se puede almacenar en este conjunto de datos (énfasis mío):

“La información grabada, incluida la información de selección de resultados, se puede almacenar en los registros de sesión 2060. En algunas implementaciones, los datos de búsqueda y la información de selección de resultados se almacenan en registros de búsqueda. En algunas implementaciones, la información registrada incluye entradas de registro que indican, fo cada selección de usuario, la consulta (Q), el documento (D), el tiempo (T) entre dos selecciones sucesivas de resultados de búsqueda, el idioma (L) empleado por el usuario y el país (C) donde está el usuario probablemente ubicado (por ejemplo, en función del servidor utilizado para acceder al sistema IR). En algunas implementaciones, también se registra otra información sobre las interacciones del usuario con una clasificación presentada, incluida información negativa, como el hecho de que se presentó un resultado de documento a un usuario, pero no se hizo clic en él, las posiciones de clic en la interfaz de usuario, los puntajes IR de los resultados clicados, los puntajes IR de todos los resultados mostrados antes del resultado cliqueado, los títulos y fragmentos que se muestran al usuario antes del resultado cliqueado, la cookie del usuario, la antigüedad de la cookie, la dirección IP (Protocolo de Internet), el agente de usuario del navegador, etc.. Se puede registrar aún más información, como los resultados de búsqueda devueltos para una consulta, donde los resultados de búsqueda son elementos de contenido categorizados en uno o más corpus. En algunas implementaciones, se registra información similar (p. Ej., Puntajes IR, posición, etc.) para una sesión completa o varias sesiones de un usuario. En algunas implementaciones, el registro de información similar no está asociado con sesiones de usuario. En algunas implementaciones, dicha información se registra por cada clic que ocurre antes y después de un clic actual “.

🔥 Leer:  Cómo publicar en Instagram desde tu computadora [7 Easy Steps]

Si bien Google Search Console solo muestra una fracción de esta información, está bastante claro cómo la herramienta Search Analytics es efectivamente una interfaz de usuario limitada construida sobre este conjunto de datos.

Lo interesante aquí es la mención de actividades que pueden ocurrir en un SERP.

Esto indica que no solo se realiza un seguimiento de cada clic, sino también las características detrás de lo que generó la posición de un resultado en un SERP.

¿Qué determina un clic?

¿Qué determina un clic?

La documentación pública de Google Search Appliance no indica qué se considera un clic o una impresión.

Por ejemplo, si busco una palabra clave y hago clic en un resultado, retrocedo y hago clic en el mismo resultado nuevamente, ¿Google está considerando esos dos clics distintos o uno?

Sin embargo, los sistemas y métodos para generar estadísticas a partir de la patente de registros de consultas de motores de búsqueda dan una idea de la respuesta a esa pregunta.

Lo primero que debe saber es que a menudo muestrean los datos. Esto tiene mucho sentido en el entorno de Google Trends.

Sin embargo, el autor señala que hay casos de uso en los que es posible que no muestreen los datos.

Para obtener información estadística confiable del registro de consultas 108, no siempre es necesario encuestar todos los registros de consultas (también denominado registros de registro o registros de transacciones) en el registro de consultas. Mientras la información estadística se derive de un número suficiente de muestras en el registro de consultas, la información es tan confiable como la información derivada de todos los registros. Además, lleva menos tiempo y recursos informáticos encuestar un registro de consultas submuestreado. Por lo tanto, un proceso de muestreo de registro de consulta 110 puede emplearse para submuestrear el registro de consulta 108 y producir un registro de consulta submuestreado 112. Por ejemplo, el registro de consulta submuestreado 112 puede contener diez por ciento o veinte por ciento de los registros de registro en el registro de consulta original 108. Tenga en cuenta que el proceso de muestreo es opcional. En algunas realizaciones, el registro de consulta 108 completo se usa para generar información estadística.

Google también parece considerar profundamente que dos consultas consultas similares pueden representar una búsqueda.

Esta línea de pensamiento es un componente central que produce una diferencia en la medición entre herramientas.

Como Google se ha movido más recientemente para dar a las versiones singulares y plurales de palabras clave el mismo volumen de búsqueda, para disgusto de la comunidad de búsqueda, es valioso ver una perspectiva interna sobre el asunto.

He presentado su discusión de la patente en su totalidad a continuación (énfasis mío):

“Por ejemplo, el usuario puede primero enviar una consulta” Restaurante francés, Palo Alto, CA “, en busca de información sobre restaurantes franceses en Palo Alto, California. Posteriormente, el mismo usuario puede enviar una nueva consulta “Restaurante italiano, Palo Alto, CA”, en busca de información sobre restaurantes italianos en Palo Alto, California. Estas dos consultas están lógicamente relacionadas, ya que ambas se refieren a la búsqueda de restaurantes en Palo Alto, California. Esta relación puede demostrarse por el hecho de que las dos consultas se envían a tiempo o que las dos comparten algunos términos de consulta (por ejemplo, “restaurante” y “Palo Alto”) “.

“(0035) En algunas realizaciones, estas consultas relacionadas se agrupan en una sesión de consulta para caracterizar las actividades de búsqueda de un usuario con mayor precisión. Una sesión de consulta se compone de una o más consultas de un solo usuario, incluidas todas las consultas enviadas durante un corto período de tiempo (por ejemplo, diez minutos) o una secuencia de consultas que tienen términos de consulta superpuestos o compartidos que pueden extenderse a lo largo de período de tiempo algo más largo (por ejemplo, consultas enviadas por un solo usuario durante un período de hasta dos horas). Las consultas que se refieren a diferentes temas o intereses se asignan a diferentes sesiones, a menos que las consultas se envíen en una sucesión muy cercana y no se asignen a una sesión que incluya otras consultas similares. El mismo usuario que busca restaurantes en Palo Alto puede enviar una consulta “iPod Video” más adelante para obtener información sobre el nuevo producto fabricado por Apple Computer. Esta nueva consulta está relacionada con un interés o tema diferente que los restaurantes de Palo Alto y, por lo tanto, no se agrupa en la misma sesión que las consultas relacionadas con restaurantes. Por lo tanto, las consultas de un solo usuario pueden estar asociadas a múltiples sesiones. Dos sesiones asociadas con el mismo usuario compartirán la misma cookie, pero tendrán identificadores de sesión diferentes “.

Baste decir que el registro detrás del motor de búsqueda de Google utiliza una serie específica de metodologías para determinar qué es una búsqueda distinta y un clic distinto.

Esto puede o no alinearse con lo que cree o cómo está configurada su plataforma de análisis para creer que es una sesión.

Cómo Analytics determina una sesión

Cómo Analytics determina una sesión

Los paquetes de análisis, por otro lado, también siguen una serie de métodos para medir a un usuario y su actividad.

Dependiendo del paquete de análisis, una “sesión” o una visita pueden ser definidas por el usuario.

🔥 Leer:  Lista completa de los próximos juegos en Nintendo Switch en 2020

Según la documentación de Google Analytics, “por defecto, una sesión dura hasta 30 minutos de inactividad, pero puede ajustar este límite para que una sesión dure de unos segundos a varias horas”.

Entonces, si bien no sabemos el momento exacto de lo que Google Search considera una sesión, los números considerados en los extractos anteriores son ciertamente menos de 30 minutos.

En una patente relacionada con Google Analytics, el Sistema y el método para agregar datos analíticos, los autores hablan sobre cómo se rastrea a un usuario a través de una ID de sesión y cómo se puede invalidar ese mecanismo:

“Una identificación de sesión generalmente se otorga a un visitante en su primera visita a un sitio. Es diferente de una ID de usuario en que las sesiones suelen ser de corta duración (caducan después de un tiempo predeterminado de inactividad que puede ser minutos u horas) y pueden volverse inválidas después de que se haya alcanzado un objetivo determinado (por ejemplo, una vez que el comprador finalizó su pedido, no puede usar la misma ID de sesión para agregar más elementos “.

Como resultado, un usuario puede medirse potencialmente varias veces para la misma visita.

Los paquetes de análisis son entornos complejos que permiten diferentes niveles de especificidad en su configuración.

Existen numerosas razones por las que no verá la coherencia entre dos paquetes de análisis, y mucho menos dos herramientas que miden cosas diferentes.

Por qué los dos no coinciden

En pocas palabras, un clic de Google Search Console no es una sesión de Google Analytics y una sesión de Google Analytics no es un clic de Google Search Console.

En el escenario anterior, en el que un usuario ha hecho clic dos veces, eso podría considerarse dos clics y una sesión.

Por qué los dos no coinciden

Alternativamente, si un usuario realizara las dos búsquedas diferentes y hiciera dos clics diferentes, su actividad podría considerarse una impresión y un clic, pero también podría invalidar su ID de sesión o tiempo de espera en algún momento y considerarse dos visitas distintas en analítica.

O considere esto:

Un usuario hace clic en su resultado, pero su análisis no se activó por varias razones. Eso habla de cualquiera de la cantidad de razones por las cuales el análisis no siempre es la fuente de verdad más confiable.

Finalmente, GSC usa URL canónicas, mientras que los análisis pueden usar cualquier URL para informar una sesión. Google habla un poco sobre esto en su documentación.

Sin embargo, su discusión tiene más que ver con explicar las diferencias dentro del contexto de la integración de GSC a GA en lugar de explicar las diferencias en las metodologías de medición

Discrepancias de datos entre GSC y Analytics

¿Por qué es esto un problema?

El problema central es que muchos especialistas en marketing no creen en los datos de GSC porque consideran a los análisis como su principal fuente de verdad.

Ignorando que toda la analítica es inherentemente defectuosa, postulo que la paridad entre las fuentes no es realista y estamos viendo dos lados de la misma verdad, solo que medidos de manera diferente.

Los datos de rendimiento de Google Search Console son una medida de lo que sucede en Google, no necesariamente de lo que sucede en su sitio.

Ah, y mientras lo hacemos, no olviden que los datos de posición de GSC están midiendo algo diferente a sus datos de clasificación.

Cómo obtener datos más precisos

La precisión de los datos informados en Google Search Console en realidad aumenta a medida que introduce más especificidad sobre cómo revisa un sitio web.

En otras palabras, si crea perfiles que reflejan niveles más profundos de la estructura del directorio, la herramienta genera más datos.

Puede ser bastante tedioso agregar 10s o cientos de subdirectorios a su Google Search Console, pero el aumento en la precisión de los datos puede resultar bastante útil para casos de uso como pruebas A / B y comprensión de oportunidades de palabras clave destacadas.

Cómo obtener datos más precisos

Al agregar una gran cantidad de perfiles, la limitación clave a tener en cuenta es que la interfaz de usuario de GSC lo limita a 1,000 consultas por filtro de búsqueda.

Por lo tanto, debe considerar usar la API para extraer sus datos, ya que devuelve 5,000 por filtro de búsqueda.

Además, para extraer la mayor cantidad de datos posible, debe considerar recorrer una serie de intentos como filtros de búsqueda (S / O a William Sears).

Esto garantiza que esté utilizando tantos subconjuntos de palabras como sea posible como filtros para obtener tantos resultados como sea posible.

Hacer esto por subdirectorio y seguir la taxonomía de su sitio le permitirá obtener los datos más precisos posibles.

Nada fue igual

Nada fue igual

Desde el debut de “(no proporcionado)” a finales de 2011, sabíamos que nuestros datos de búsqueda orgánica se erosionarían.

Siendo realistas, nunca viviremos en un mundo donde ya podamos vincular una visita directamente a una sesión.

Los datos que proporciona Google Search Console son los mejores que tendremos en el futuro.

Si bien los datos no coincidirán con su fuente de verdad, eso no significa que sean inexactos.

De la misma manera que no deberías esperar Facebook Los datos de anuncios para que coincidan con Google Analytics o los archivos de registro en Kibana para informar lo mismo que Adobe Analytics, no debe esperar que Google Search Console coincida con sus datos de análisis.

Ahora, sal y sé genial.

Imágenes en la publicación: creadas por el autor, marzo de 2020
Todas las capturas de pantalla tomadas por el autor, marzo de 2020

Tabla de contenidos

Toggle

Recomendamos

Populares