Všechny nás to štve. Někdo to neřeší a druzí naopak neví, jak se jej zbavit. Ano je řeč o referral spamu. V dnešním článku se podíváme na to, co je to referral spam a jak se jej zbavit a nebo jej eliminovat na možné minimum.

Co je to referral spam?

Ať se Vám to líbí nebo ne, spam je velkou součástí internetu. Všichni dobře známe pojem emailový spam, ale o tom dnešní článek nebude. Dnes si ukážeme co je referral spam – jak jej poznat a jak jej odstranit z Google Analytics.

 

Kde najít Referral spam?

Přehled referral spamu (pokud nějaký máte) naleznete v Google Analytics:

Akvizice -> Přehled -> Referral

V této sekci najdete veškerý provoz dle Google Analytics, který pochází z jiných webů (nebo to alespoň GA tak vyhodnotí) – typicky se může jednat o přístupy na web ze zpětných odkazů a nebo právě z referral spamu, který se takto navenek tváří.

 

Referral spam

Referrer spam, nebo referral spam, je technika opakovaných požadavků na web pomocí falešné URL referreru, často na stránky, které si spameři přejí propagovat.

Většinou roboti, kteří se takto využívají na referral spam, Váš web ani nenavštíví. Místo toho použijí pouze sledovací kód a zkreslí Vaše analytická data, jako je míra okamžitého opuštění, průměrnou dobu trvání relace, počet stránek na relaci a další. V nejčastějších případech se jedná o spam, který má jediný úkol a to propagaci služby, která tento druh spamu propaguje.

Většina z nás na takový odkaz určitě klikla (zadala referral URL do prohlížeče) z důvodu zvědavosti. Řada z nás tyto referral spamy blokuje, protože o nich ví = propagace pomocí referral spamu funguje.

V Google Analytics to může vypadat takto:

 

Je bottrafic.pw opravdu referral spam?

Na první pohled je v tomto případě jasné, že se jedná o referral spam. Proč? Za prvé vím, že jsem na takový web určitě neumístil žádné zpětné odkazy a za druhé vidím, dle průměrné doby trvání relace, že něco v tomto případě není v pořádku. 300 přístupů a průměrná doba na webu 5sec? To je při nejmenším podezřelé.

Samozřejmě jsem si ověřil, že pokud vložím URL bottrafic.pw do prohlížeče, tak mě přesměruje na web gammatraffic.com a tento web tyto služby referral spamu nabízí:

 

Proč to dělají a jestli to má nějaký efekt si povíme v příštím příspěvku.

 

Jak zablokovat referral spam v Google Analytics?

Zde je několik možností, jak blokovat spam v Google Analytics:

  • Vyloučení známých robotů v nastavení Google Analytics
  • Použití filtrů na výsledky v Google Analytics
  • Úprava souboru .htaccess, nebo přidáním pravidla v Nginx

 

 

Vyloučení známých robotů v nastavení Google Analytics

Před pokročilejšími způsoby blokování spamu v Google Analytics nezapomeňte využít výhod integrované funkce, kterou najdete přímo v GA:

Správce -> Nastavení výběru dat -> Filtrování robotů

A poté zaškrtnout

Filtrování robotů -> Vyloučí všechny požadavky na server od známých robotů nebo prohledávačů.

 

Použití filtrů na výsledky v Google Analytics

Filtr v Google Analytics nastavíte velmi snadno. Filtry se nachází na stejné kartě, jako v případě výše.

 

Kliknutím na tlačítko “Přidat filtr” se nám otevře okno na vytvoření nového filtru:

Zde můžete nastavit hned několik filtrů (podle počtu referral spamu) a ihned si je prohlédnout, jestli fungují – Ověření filtru. Před uložením doporučujeme tuto možnost využít, abyste případným špatným nastavením nepřišly o data.

 

Můj filtr na blokaci bottrafic.pw může vypadat takto:

 

Já v Google Analytics nechci, aby se mi v přehledu zobrazoval jakýkoliv referral z domény bottrafic.pw, takže jsem zvolil vyloučení podle domény, která obsahuje bottrafic.pw (tento filtr zahrnuje i možné subdomény a adresáře).

Náhled filtru se Vám zobrazí po otestování a uvidíte, jaký bude mít vliv:

Filtr se nám pak uloží do předešlého přehledu filtrů:

Filtr můžeme kdykoliv odebrat. Zobrazení změn na řídicím panelu v Google Analytics by mělo trvat přibližně 24 hodin.

 

Můžete rovnou zablokovat všechny známé spam URL

https://gist.github.com/iMazed/c246a63a16ccdcc4c2e4#file-spamreferrals-txt

http://www.limelightdigital.co.uk/ultimate-analytics-referral-spam-list/

 

Úprava souboru .htaccess, nebo přidáním pravidla v Nginx

Pokud se BOTi na Váš web opravdu dostanou a nejedná se pouze o využití tracking kódu z Google Analytics (můžete ověřit v logu serveru/webu), můžete využít i blokaci úpravou .htaccess souboru.

Blokace přes .htaccess

V našem případě může kód na blokaci v .htaccess vypadat takto:

Pokud si nejste jisti, co to všechno znamená, tak zde je stručný přehled toho, co se v tomto příkazu děje:

„NC“  zadaná doména je necitlivá na velká a malá písmena, takže filtr zachytí i BotTraffic nebo gammaTraffic apod.
„OR“ označuje, že má být zablokováno více odkazujících stránek.

Poslední řádek je o tom, co se stane s doménou, která se pokouší získat přístup na Váš web a je tímto příkazem odmítnuta.
„F“ se rovná selhání(fail) a znamená, že referrer dostane chybu 403.

Přidat samozřejmě můžete i další domény, které Vám vadí.

 

Přidáním pravidla v Nginx

Pokud Váš server využívá Nginx, jako webový server, namísto Apache, nebudete moci upravovat soubor .htaccess a budete muset nastavit pravidlo v Nginx pro blokování požadavku referralu:

 

Důrazně doporučuji před jakoukoliv úpravou (filtry, .htaccess, Nginx) udělat zálohu!