SPAM Google Analytics, la manera más eficaz de eliminarlo

Igual no lo sabes, pero muy probablemente la mayoría de las visitas que tengas registradas en Google Analytics sea SPAM. Y si no me crees sigue leyendo.

¿Qué es el SPAM en Google Analytics?

Son visitas que impactan en tu cuenta de Google Analytics pero no han interactuado con tu página web, es decir son datos fantasma que no corresponden a usuarios reales, sino a robots que se encargan de llenar tu cuenta con datos falsos.

La mayoría de estos datos falsos no son fáciles de rastrear y necesitas tiempo para aplicar nuevos filtros según van apareciendo nuevos robots.

Y si tu página web tiene pocas visitas, ya te adelanto por propia experiencia, que puede darse el caso de que el 100% de tus visitas sea spam.

Eso son malas noticias, pero con el método que explico en este artículo yo he podido cargarme hasta el 99,97% de spam, ¿no es mal dato verdad?

¿Cómo hemos eliminado el SPAM hasta ahora?

Tal vez sea también tu caso, pero yo para filtrar el spam hacía lo siguiente:

  • Añadía un filtro de inclusión donde sólo entraba en mi web los que tuvieran mi nombre de host, tanto con www. como sin ellas:
    Filtro con nombre de host válidos
  • Añadía tantos filtros de exclusión para las referencias con nombres raros y extensiones aún más raras. En este estupendo artículo, @carlosesal habla de este tema.

Como te decía yo también lo he hecho así pero seguía teniendo spam y perdiendo tiempo en crear nuevos filtros en todas mis cuentas de Google Analytics.

Además Google tampoco hace gran cosa, solo un check que pone Excluir todos los hits de robots y de arañas conocidos que resulta completamente insuficiente.

Lo puedes ver en la confuguración de vista de tu cuenta de Google Analytics:
Administrador > VER > Ver configuración

Excluir robots en Google Analytics

Pero el spam ha ido evolucionando y puedes infectarte desde páginas web donde has consultado, por ejemplo, buscando “cómo controlar el spam”, incluso desde redes sociales… localizan tu id de Google Analytics y te abrasan a visitas fantasma.

Pero… ¿por qué tanto SPAM?

El código de Google Analytics ha ido evolucionando, la última versión es Universal Analytics y entre sus enormes mejoras con respecto a la anterior versión, está que te permite hacer seguimiento del tráfico ONLINE de tu web: tráfico desde redes sociales, tráfico directo, tráfico orgánico, etc…

…pero también de la parte OFFLINE.

Por ejemplo, imagina que tienes una tienda física con una caja registradora, con Universal Analytics puedes unirla a tu cuenta de Google Analytics y contabilizar estas interacciones mediante una url especial con parámetros y tu id de seguimiento de Google Analytics.

Este tipo de url es lo que se conoce como protocolo de medición (Measurement Protocol)

La ventaja de Universal Analytics, con respecto a la otra versión, es bestial porque ahora puedes unificar los datos de la parte ONLINE con los datos de la parte OFFLINE de tu negocio y así tendrás más recursos parar mejorar-optimizar tu empresa.

Pero la desventaja es que ese protocolo de medición lo utilizan los SPAMMERS para entrar en tu cuenta de Google Analytics sin necesidad de interactuar con tu página web.

Usuarios reales vs Robots

Así que si tienes una única vista de tráfico configurada en Google Analytics y la tienes sin filtros, tendrás un alto porcentaje de SPAM, casi seguro.

En mi caso había picos de hasta un 70% de las visitas que eran SPAM. ¡Mucho sí!

Con la técnica que voy a explicar más abajo, sólo se va a contabilizar las interacciones en tu página web, las que no interactúan pero impactan no se contabilizan, así tendrás datos más fiables y reales del comportamiento y audiencia de tu página web.

Pero antes tienes que saber cómo detectar el spam.

¿Cómo identificar si tienes SPAM?

Al ser robots los que aportan visitas falsas, tiene patrones de comportamiento fáciles de detectar. Se caracterizan por lo siguiente:

  • Algunos robots hacen visitas fantasma estacionales, es decir, se repiten de la misma forma en un intervalo de tiempo:
    Spam estacional

    En este ejemplo la línea naranja indica picos de visitas de spam que se repiten en intervalos de fecha y vienen de una ciudad americana.
  • También se caracterizan porque el número de usuarios coincide con el número de sesiones y el % de usuarios nuevos es del 100% en un largo periodo de tiempo.
    Sesiones igual a usuarios

    En este caso he ido a Google Analytics > Informes > Tecnología > Red y he filtrado por el proveedor de servicios amazon tecnologies inc, que resultó ser spam.
  • Y añadido a lo anterior, también con porcentaje de rebote del 100%, es decir impactan y desaparecen.
  • Si el público objetivo de tu página web no tiene que ver con países como Rusia o Ucrania, si segmentas tus datos por País, ahí verás mucho spam también.
    Tráfico desde Rusia muy sospechoso
  • Nombres de referencia desconocidos o con extensiones poco comunes.
    Lo puedes ver en Informes > Adquisición > Todo el tráfico > Referencias:

    Ejemplos: lifehacker.com; thenextweb.com; news.combinator.com; abc.xyz; boltalko.xyz

    Spam en referencias de audiencia

Cada vez el spam es más sofisticado y se detecta mucho peor y Google, de momento, no hace nada… ¿es por algún interés que desconozcamos?

¿Qué necesitas parar filtrar SPAM con esta técnica?

Bien, ahora que ya sabemos un poco más del asunto del SPAM, te voy a explicar qué hacer con esas visitas que no aportan nada, de la manera más eficaz que conozco hasta la fecha.

Todo gracias a un artículo sobre dimensiones personalizadas de Lucía Marín y otro de ikhuerta.com, pero yo lo voy a explicar lo más sencillo que pueda 😀

Para ello lo que tienes que tener, sí o sí, es lo siguiente:

  • Una cuenta de Google Analytics. (Obvio)
  • Google Tag Manager instalado. ( Importante porque es más fácil de implementar esta técnica sin cambiar líneas de código en Google Analytics ). Si no conoces GTM ya estás tardando porque es el complemento perfecto para Google Analytics, en este artículo de 5 pasos te explico.
  • Una vista con datos sin filtrar para que compruebes la diferencia de visitas sin SPAM. (No es imprescindible pero sí aconsejable).
  • 3 minutos más de tu tiempo (para que lo hagas ya! en tu cuenta de Google Analytics)

Aquí va la técnica:

1.Entra en Google Analytics

Crea una dimensión personalizada en Google Analytics:
La puedes crear en Google Analytics > Administrador > Propiedad > Definiciones personalizadas > Dimensiones personalizadas > Añadir nueva

Localizar dimensiones personalizadas en Google Analytics

Ponle a tu nueva dimensión personalizada un nombre que la identifique,

yo la he llamado, para este ejemplo “AdiosSpam”. y haz clic en botón guardar.

Configurar dimensión personalizada

2.Vete ahora a tu cuenta de Google Tag Manager

#1. Crea una nueva variable:
Area de trabajo > Variables > Variables definidas por el usuario > Nueva
Configurar variable nueva en Google Tag Manager

#2. Esta variable que sea de tipo constante:
Yo la he llamado “FueraSpam” pero tú puedes ponerle el nombre que quieras.

Y un valor también cualquiera, por ejemplo “NoPasaranNiUnoMasa modo de contraseña.

Variable de tipo constante en Google Tag manager

Ahora y esta es la parte más importante:

En todas las etiquetas que tengas activas en Google Tag Manager ( las de página vista, evento, transacciones, etc), en las que ofrezca la opción de añadir dimensión personalizada, añade tu nueva nueva dimensión “FueraSpam” con el índice que corresponda:

Etiqueta GTM con dimensión personalizada

3.Vuelve a Google Analytics y crea un filtro de inclusión:

Está en Google Analytics > Administrador > Ver > Filtros

Y configúralo de esta forma:

Filtro antispam solo hits de Google Tag Manager

¿Qué conseguimos con esto?

  • #1. Que sólo contabilice en Google Analytics las interacciones que tienen tu contraseña, es decir todas las interacciones que se produzcan en tu web.

    En Google Analytics las interacciones son “páginas vista”, es decir todas las páginas que ven los usuarios, “eventos” por ejemplo hacer clic en un botón o en un enlace que esté seguido por Google Analytics, “transacción” todas las transacciones de tu tienda online, etc…

    Y todas estas interacciones deben tener la dimensión personalizada “AdiosSpam” para que empiece a filtrar los datos de usuarios reales.

  • #2. Que el spam oculto en las referencias desaparezca y sólo veas nombres con url válida y real.
  • #3. Sólo interacciones con tu web que sean reales, es decir, de usuarios que te visitan.

Compruébalo tú mism@:

Bueno… compruébalo justo cuando se esté produciendo visitas por spam.

Sí lo sé, para este caso hace falta que tengas de promedio muchas visitas al día.

En Google Analytics verás en tiempo real los impactos en tu cuenta pero que dan valor “0 usuarios activos en el sitio” y destellos cortísimos de países donde se produce el spam, pero que no producen visitas reales:

Destellos por país

¿Es tan eficaz como parece?

NO es eficaz al 100%, pero en mi caso sí es al 99,97% que no es un mal dato 🙂 e imagino que en el tuyo será parecido, porque como te dije antes, las técnicas para hacer SPAM son cada vez más sofisticadas.

El 0,03% restante me viene de tráfico de referencia de Hubspot (competencia de Google Analytics) y la detecto porque es estacional con picos de 10 visitas puntuales los lunes o viernes de cada semana, pero ya le pillaré ya… 😀

Lo que he conseguido es:

Visitas totales:

Sin ningún filtro = 70% de las visitas eran SPAM.
Aplicando filtros antispam = 30% de las visitas eran SPAM.
Aplicando esta técnica = 0,03% de las visitas eran SPAM.

Creo que merece la pena ¿qué opinas?…

Conclusión

Creo que esta técnica es imprescindible, por el momento para cortar el SPAM invirtiendo el mínimo tiempo posible en aplicar filtros cada poco.

Hay otras técnicas, pero desde que la descubrí esta, tengo datos en Google Analytics que, de momento, no cantan “SOY SPAM”.

1 Star2 Stars3 Stars4 Stars5 Stars (1 votes, average: 5,00 out of 5)
Cargando…

¿Y tú qué opinas de que Google no haga nada contra el SPAM?
¿Qué técnica aplicas para combatirlo?
¿Esa técnica que aplicas te resulta eficaz?
Cuéntame tu experiencia o lo que quieras :-), nos vemos en los comentarios ¡Gracias!

Artículo escrito el día 5-DIC-2016

Deja un comentario