Ces putains de spam référent !

Pour ouvrir le blog, j’aimerais compléter le billet de l’excellent Didier Sampaolo sur les spams de référents, ces putains de bot qui viennent pourrir vos statistiques, que vous pouvez retrouver ici :

http://www.didcode.com/code/stop-spam-referrer.html

Il y aborde le blocage par Apache, Nginx et PHP et il a également réalisé un plugin WordPress pour dégager tous ces enfoirés de spammeurs, que vous trouvez ici :

https://wordpress.org/plugins/spamreferrerblock/

A mon sens, il manquait la méthode la plus simple pour les néophytes qui n’ont pas de WordPress et qui ne souhaitent ou peuvent modifier le code de leur site : le filtre directement dans Google Analytics. Enfin, la plus simple à mettre en place, car à comprendre, pour quelqu’un qui ne touche pas au code, les regex ça peut être compliqué.

Mettons déjà les choses en place : vous avez un petit site, et depuis quelques mois, vos visiteurs journaliers ont doublés (champagne !!).
En cherchant à expliquer cette progression de trafic, vous vous dirigez vers l’onglet Acquisition -> Tout le trafic -> Sites référents

Et la vous trouvez quelques sites internet que vous ne connaissez pas :

semalt.com (absent de la capture car dégagé depuis un moment, mais le plus populaire), buttons-for-website.com , ilovevitaly.com , 7makemoneyonline.com , etc …

Aperçu des sites référents

 

Ces enfoirés spams vos statistiques dans le seul but de vous faire venir sur leur site (et de vous vendre des trucs au passage). Sympa les mecs hein ?

Supprimer les spam referrer de Google Analytics, dans le futur, et dans le passé

Alors, comment les dégager via les filtres de Google Analytics ?

Déjà, rendez vous dans l’onglet « Admin » tout en haut de Google Analytics, puis dans « Tous les filtres » (soit dans la colonne COMPTE pour créer un filtre valable sur tous les sites, soit dans la colonne VUE pour une seule vue (débile))

Ici vous créez un nouveau filtre, de type « personnalisée » (pourquoi le féminin ?).

Vous souhaitez exclure sur le champ de filtrage « Sites référents » avec cette magnifique règle regex :

(.*)[ilovevitaly|semalt|darodar|priceg\.com|buttons-for-website\.com|7makemoneyonline|bestsub\.com|civilwartheater\.com|econom\.co|entourank\.com|webstatsdomain\.org|similarpages\.com|seokicks\.de|cukwiki\.com|casinobonustips\.com|lumb\.co|seoairport\.com|ymlp\.com|blackhatworth\.com|clicksor\.com|hulfingtonpost\.com]

 

On enregistre le filtre, et on l’applique aux vues que l’on souhaite.

Ajouter un filtre anti spam référent

A partir de ce moment, toutes les visites venant des sites référents que vous pouvez voir dans la règle ne seront plus comptabilisées.

Alors c’est bien sympa, mais on aimerait bien pouvoir consulter ses statistiques non-faussées, en dégageant ces spammers du passé.

La solution ce trouve dans les segments personnalisés de Google Analytics. Vous pouvez directement importer mon segment via ce lien :

https://www.google.com/analytics/web/template?uid=TW-kVFUhQt6acQp-hNR3iA

Une fois que vous aurez ajouté le segment, vous pourrez le sélectionner dans la liste des segments personnalisés :

Ajouter un segment personnalisé à Google Analytics

Vous obtiendrez ensuite deux courbes, celle avec toutes vos sessions, et celle avec les spams référents exclus. On voit ici clairement le moment ou le filtre est entré en action :

Les deux courbes avec et sans spam référent

La liste des noms de domaine risque de s’allonger, puisque certains scripts permettant de spammer en masse commencent à se trouver facilement.

J’espère que Google maintiendra une liste noire de lui même, et que la case « Exclure tous les appels provenant de robots connus » que l’on trouve dans l’édition de la vue servira pour de bon.

 

N’hésitez pas à me signaler tout référent que j’aurais pu oublier pour compléter la liste.