Cómo bloquear el tráfico de spam de Google Analytics con estas herramientas
El spam analítico fue uno de los temas de análisis más candentes en 2015 (con un pico durante el verano de 2015). Parece que el tema recuperó algo de popularidad durante noviembre y parece que el problema del tráfico de spam no ha terminado todavía.
Google Trend for Analytics Spam
Google creó una página de soporte para el tráfico de spam, lo que significa que ven el problema y pueden llegar a una solución. Adam Singer de Google Analytics confirmó que Google intentará solucionar el problema, sin embargo la fecha de lanzamiento no se conoce todavía.
Analizamos 292 cuentas de Google Analytics que no tenían ninguna configuración de filtrado de spam y tenían al menos 25 visitas de referidos por día. El tráfico global de spam de referenciadores fue de alrededor del 11% y alrededor del 57% de todos los sitios web tenían tráfico de spam de al menos uno de los 500 dominios de spam.
Image Source
No entraré en detalles sobre los tipos de spam, ya que se ha discutido muchas veces. Sin embargo, deberías ver la presentación de Scott Hendison en PubCon sobre Google Spamalytics
Manteniendo el nuevo tráfico limpio con herramientas automatizadas
La mayoría de las soluciones que te ayudan a mantener tus estadísticas de Analytics limpias de spam requieren algún tipo de filtrado (manual) de los dominios de spam, así como algún tipo de filtrado más genérico dentro de Google Analytics.
Actualmente, hay unos 550 dominios que causan el problema del spam (la lista más reciente de dominios de spam se puede encontrar en GitHub, que es de código abierto).
Debido al gran número de dominios de spam, la aplicación de filtros a mano se ha convertido en un proceso muy lento y, debido a que cada mes aparecen nuevos dominios de spam de la nada, es difícil llevar un seguimiento.
Para seguir el ritmo del crecimiento del spam, se han creado herramientas. Hay varias herramientas en el mercado hoy en día, la mayoría de las cuales son gratuitas.
A continuación voy a resumir varias herramientas. *Nota: La mayoría de las herramientas están limitadas por los límites de cuota de Google, así que si una herramienta da un error de cuota, prueba otra o espera 24 horas.
Analytics Referrer/Ghost Spam Blocker
Este bloqueador de spam está siempre actualizado. En el momento de la redacción de este documento, contiene más de 550 dominios de la lista negra en su lista.
- Url: https://www.adwordsrobot.com/en/tools/ga-referrer-spam-killer
- Tipos de filtro (3): filtro de nombre de host, filtro de resolución de pantalla, filtros de dominios de la lista negra
- Precio: Gratis
Pros:
- Interfaz sencilla con opción de búsqueda (genial si tiene muchas vistas)
- Puede actualizar varias cuentas, propiedades y vistas fácilmente
- Deshaga los filtros añadidos si es necesario
- Siempre al día gracias a la ayuda de su comunidad (más de 550 dominios en la lista negra, 39 filtros)
- Han incrementado los límites de la cuota a 10000 peticiones por día
Cons:
- Necesita actualizar los filtros cada vez que se publiquen nuevos dominios
Analytics Toolkit
Analytics Toolkit no es una herramienta gratuita ($15 por mes), pero el bajo precio vale la pena el dolor de cabeza que alivia. Esta herramienta de spam forma parte de una gama más amplia de herramientas analíticas proporcionadas por Analytics Toolkit.
Info:
- Url: https://www.analytics-toolkit.com/auto-spam-filters/
- Tipos de filtro (1): filtros de dominios en la lista negra
- Precio: $15 al mes (se incluyen más herramientas relacionadas con el análisis)
Pros:
- Los filtros se actualizan automáticamente cuando se liberan nuevos dominios
- Aplicar filtros en todas las cuentas propiedades y vistas
- Interfaz de un solo clic
- Los límites de la cuota no son un problema porque los filtros se aplican en segundo plano
Cons:
- Se requiere registro
- El número de dominios filtrados es inédito (se añaden 5 filtros)
Instalador del filtro de spam
Spam Filter Installer (free & open source) by Simoa Hava es una de las primeras herramientas automatizadas de filtrado de spam. Toda la herramienta es de código abierto y puede ser descargada e implementada por cualquiera. De esta manera, usted tiene un mejor control de los límites de la cuota.
Info:
- Url: https://http://www.simoahava.com/spamfilter/
- Tipos de filtro (1): filtros de dominios de la lista negra
- Precio: Gratis
Pros:
- Código fuente abierto, puede implementar la herramienta usted mismo
- Múltiples propiedades y vistas pueden ser seleccionadas
Cons:
- Sólo se puede aplicar en una cuenta a la vez
- Cuota límite de 2000 escrituras por día
- El número de dominios filtrados está semiactualizado (400+ dominios, 26 filtros)
Bloqueador de spam de referencia
Referrer Spam Blocker es una herramienta gratuita de Stijlbreuk. Definitivamente tiene una de las interfaces de usuario más atractivas de las herramientas que existen.
Info:
- Url: https://referrerspamblocker.com/
- Tipos de filtros (1): filtros de dominios en lista negra
- Precio: Libre
Pros:
- Se pueden seleccionar múltiples propiedades y vistas
- Límites de cuota incrementados a 5000 solicitudes por día
Contras:
- El número de dominios filtrados está semielaborado (más de 203 dominios, 17 filtros).
Cómo funcionan las herramientas y qué filtros se utilizan
La mayoría de las herramientas anteriores añaden uno o más de los siguientes filtros. Veamos cómo funcionan
Excluir nombre de host vacío
La mayoría de los robots fantasmas de spam no envían el campo de nombre de host cuando envían datos falsos al análisis
Este filtro eliminará todas las peticiones que tengan un nombre de host vacío.
Excluir resolución de pantalla vacía
La mayoría de los robots fantasmas de spam no envían la resolución de pantalla cuando envían datos falsos al análisis.
Este filtro eliminará todas las solicitudes que tengan una resolución de pantalla vacía.
Incluir sólo nombres de host propios
La mayoría de los robots fantasmas de spam no establecen el nombre de host, pero algunos sí lo hacen. En la mayoría de los casos establecen el nombre de host en un dominio de spam en lugar del dominio real del sitio web.
Este filtro filtra todas las peticiones que tienen el nombre de host establecido en cualquier otra cosa que no sea la lista de nombres de host que proporcionamos (por ejemplo, su propio nombre de dominio).
PRECAUCIÓN: Porque este es un filtro de lista blanca, es decir, filtra todo excepto la lista de nombres que proporcionamos. Tiene un inconveniente: si cambias de dominio en el futuro o si utilizas varios dominios con la misma cuenta de análisis (como para cada TLD de idioma o con varios subdominios) podrías filtrar el tráfico bueno. Por lo tanto, tenga mucho cuidado con este filtro o puede que no detecte mucho tráfico real en su cuenta de análisis
CAUTION:
Aunque esto suena muy bien, este filtro no es el santo grial, algunos robots de spam están visitando su sitio web, por lo que el nombre de host se establecerá en el nombre de host correcto y no será filtrado.
Excluir dominios de la lista negra (filtro de origen de campaña)
Cuando ninguno de los filtros anteriores funcione, debe excluir a mano todos y cada uno de los dominios de spam conocidos. Actualmente, hay más de 550 dominios de spam conocidos en la lista de spam de código abierto.
La mayoría de las herramientas utilizan alguna lista de dominios que se añaden automáticamente.
Eliminar el spam del tráfico ya contaminado
Con los métodos descritos anteriormente no es posible limpiar los datos ya contaminados (en Google Analytics). Google Analytics soporta segmentos que permiten filtrar datos antiguos, pero no actualizarlos.
Usando el segmento de abajo, puedes ocultar todos los dominios de spam de datos antiguos. Es útil si has tenido mucho spam en el pasado y no lo has filtrado.
Simplemente importa el Bloqueador de Spam de Analytics (Enero 2016, 550 dominios) y podrás seleccionar el segmento en cualquier vista. Comprueba cómo usar la guía de segmentos de Kissmetrics si eres nuevo en los segmentos.
Otras soluciones (no recomendadas)
Hay otras soluciones que pueden funcionar parcialmente. La mayoría de ellas no las recomendaría porque tienden a romper las cosas más de lo que las arreglan. De hecho, la mayoría de ellas no funcionarán mejor que las soluciones automatizadas anteriores.
Adición de dimensiones personalizadas a cada visita (no mejor que los filtros anteriores)
La adición de una dimensión personalizada a cada visita le permitirá distinguir entre el spam fantasma y las visitas reales. Esta solución requiere el acceso al código de análisis del sitio web
Excluyendo los dominios que utilizan .htaccess (no recomendado)
También es necesario utilizar el servidor web Apache (u otro servidor web compatible) y tener acceso a su configuración. La actualización de estas reglas puede provocar la caída de todo el sitio web – así que tenga cuidado. También la comprobación de más de 500 regexes en cada visita necesita recursos adicionales.
Adición de parámetros adicionales El desencadenante de la vista de página (no recomendado)
Para añadir un parámetro adicional a la solicitud de vista de página necesitará acceso a su código de análisis en su sitio web. Tampoco es aconsejable jugar con eso.
Crear un nuevo ID de seguimiento (no recomendado)
Crear un nuevo ID de seguimiento de Google Analytics no es una buena idea porque perderá todos sus datos antiguos. Además, los robots de spam encontrarán su nueva cuenta y empezarán a añadir spam.
Filtrar las direcciones IP (no recomendado)
El filtrado de las IP no será muy útil porque los robots utilizan IP diferentes.
Conclusión
El spam del tráfico de Google Analytics sigue siendo un problema, pero las soluciones automatizadas están aquí para ayudar. Estas tienden a funcionar bien y son fáciles de usar. También hay muchas opciones
Google también está trabajando en una solución, que esperamos que resuelva el problema de una vez por todas. Pero por el momento, no hay ninguna versión a la vista.
¿Ha encontrado nuevos dominios de spam? Envíalos a la lista negra de la comunidad en GitHub. Otros consejos y trucos son bienvenidos en los comentarios.