Questo è un aggiornamento del precedente post sui referral spam in Google Analytics.

Google si è accorto di questo fenomeno, potenzialmente dannoso per il suo servizio di statistiche web Google Analytics, e sta prendendo le dovute contromisure.

Le visite dei crawler, in primis Semalt, possono inquinare i nostri dati. In particolare Semalt fa registrare le visite con una frequenza di rimbalzo del 100%. Questa metrica è importantissima per determinare il comportamento degli utenti e risulta falsata (in negativo) dalle viste di semalt.

Google ha recentemente pubblicato un annuncio sull’account G+ di Google Analytics, nel quale annuncia che presto sarà inserita la possibilità di filtrare il traffico di bot e spider semplicemente spuntando un box.

Google non nomina mai semalt, ma pare evidente che questa sia una mossa che serve a impedire comportamenti come quelli del crawler ucraino.

Ecco un estratto dell’annuncio:

 

You can simply select a new checkbox option which would be included in the view level of the management user interface. This option would be labeled “Exclude traffic from known bots and spiders”. Selecting this option will exclude all hits that come from bots and spiders on the IAB know bots and spiders list. The backend will exclude hits matching the User Agents named in the list as though they were subject to a profile filter. This will allow you to identify the real number of visitors that are coming to your site.

Questa opzione dovrebbe essere gia disponibile per gli account GA Italiani.

Basta andare in AMMINISTRAZIONE > IMPOSTAZIONE VISTA e spuntare il box.

Escludi semalt da Google Analytics

 

Aggiornamento al 11/09/2014.

Semalt è molto bravo ad occultarsi, camuffa il suo Ip facendo risultare le visite da paesi sempre diversi (Israle, Brasile, Russia, Olanda etc…), appare sempre come un nuovo referall, lo avrete notato (49.semalt.com – 56.semalt.com – semalt.semalt.com – 11.semalt.com – etc.).

Google Analytics filtra solo bot e spyder conosciuti, insomma pare che il filtro inserito in GA non risolva completamente il problema. Lasciatelo comunque attivo perché rimuovendolo la situazione potrebbe peggiorare.

Sono sicuro che Google risolverà il problema, prima o poi, perché Semalt mette seriamente a rischio l’affidabilità dei dati del sistema di analytics più diffuso al mondo.
Mentre aspettiamo che questo accada vi vorrei mostrare un modo per farlo fuori dalle vostre statistiche, spero in maniera definitiva.

Inseriamo un filtro manualmente per eliminare le sue visite dal conteggio:
1)    Andate nel vostro account GA, andate in Amministrazione
2)    Selezionate una vista e andate in FILTRI
3)    Nuovo filtro
4)    Assegnate un nome al filtro: “escludi semalt”
5)    Spuntate FILTRO PERSONALIZZATO
6)    Spuntate “Escludi” (dovrebbe essere quello di default)
7)    In campo filtro scegliete: Referral
8)    In Pattern filtro scrivete: semalt.com
9)    Maiuscole/minuscule lasciate su No.
10)    Salva

filtro manuale per semalt
Ho testato il filtro su diversi account GA per diversi siti web e per diversi giorni, pare funzionare perfettamente.