Was ist Referrer Spam und wie kann man diesen blockieren? Tipps und Plugins

Was ist Referrer Spam und wie kann man diesen blockieren?Referrer Spam ist vielen Website-Betreibern unbekannt, ist aber ein häufiges Problem, welches unter anderem Einfluss auf die eigenen Statistiken hat.

Was Referrer Spam genau ist und wie man diesen blockieren kann erfahrt ihr im Folgenden genauso, wie die negativen Auswirkungen von Referrer Spam.

Zudem gibt es Plugin-Tipps für WordPress Nutzer und Tipps für Google Analytics.

Was ist Referrer Spam?

In einer idealen Welt würden nur Menschen auf die eigene Website zugreifen und die Statistiken wären sauber und schön. Doch wir leben in keiner idealen Welt.

Deshalb gibt es auf jeder Website mehr oder weniger viele Zugriffe von sogenannten Crawlern, die manchmal nichts böses wollen, aber oft genug auch etwas im Schilde führen.

Es gibt automatisch generierte Zugriffe von normalen Bots, wie von Google, die sinnvoll sind und helfen. Diese tauchen in Statistiken in der Regel nicht auf und wer sie nicht will, kann sie relativ einfach mittels robots.txt blocken.

Doch darüber hinaus gibt es viele Spam-Crawler, die z.B. versuchen in Referrer-Auflistung der Websites aufzutauchen, um darüber Backlinks und Traffic zu erhalten. Oder sie versuchen Daten auszulesen, Schwachstellen an der Website zu finden oder Blog-Kommentar-Spam zu hinterlassen.

Das alles wird unter dem Begriff Referrer Spam zusammengefasst und sorgt unter anderem für eine Verfälschung der eigenen Statistiken und zusätzlichem Datenverkehr. Verlinkt man dann selber noch diese Spam-Websites, kann es sogar zu negativen Auswirkungen für die eigene Website kommen, weil Google z.B. einen Penalty verhängt.

Referrer Spam blockieren per .htaccess

Eine manuelle Methode den Referrer Spam zu blockieren ist die .htaccess Datei. Diese liegt bei eurer Website im Root-Verzeichnis, also “ganz oben”, dort wo auch eure wichtigsten CMS-Dateien liegen, wie z.B. die index.php.

Dabei handelt es sich um eine Text-Datei, die ihr mit einem Editor ganz einfach bearbeiten könnt.

Um nun Referrer Spam mittels der .htaccess Datei zu blockieren, legt ihr darin einfach eine Liste mit bekannten Spam-Websites an, die wie folgt aussieht:

RewriteCond %{HTTP_REFERER} ^http://.*200please\.com/ [NC,OR]
RewriteCond %{HTTP_REFERER} ^http://.*4webmasters\.org/ [NC,OR]
RewriteCond %{HTTP_REFERER} ^http://.*7makemoneyonline.com/ [NC,OR]
...
RewriteRule ^(.*)$ – [F,L]

Diese Liste ist recht lang und sollte hin und wieder mal aktualisiert werden. Fertige Listen für die eigene .htaccess Datei findet ihr z.B. auf dieser Website.

Das Projekt Matoma (ehemals Piwik) pflegt eine eigene Liste mit Spamdomains, die man ebenfalls dafür nutzen kann. Hier müsste ihr nur noch die ensprechenden Code-Bestandteile “RewriteCond %{HTTP_REFERER} ^http://.*” bzw. “/ [NC,OR]” in allen Zeilen ergänzen.

Dann wird diese Liste einfach in die .htacess Datei eingefügt und schon sollte der Zugriff dieser Websites auf eure Website blockiert sein.

Referer Spam Blocker Plugin

Wer WordPress nutzt, kann alternativ dieses Plugin installieren. Es greift auf die erwähnte Matoma-Blacklist zurück und blockiert Referrer Spam automatisch.

Auf Wunsch kann man weitere Domains von Hand ergänzen, wenn man das möchte. Die Matoma Spam-Liste wird hier automatisch aktualisiert, so dass man nichts machen muss.

Referrer Spam mit Statify Blacklist blockieren

Zugegeben, die manuelle Blockierung von Referrer Spam ist zwar nicht schwer, aber für Laien dennoch etwas aufwändig. Und es gibt sogar Hostinganbieter, bei denen eine Bearbeitung der .htaccess-Datei nicht möglich sein soll. Bei meisten genutzen Hostern, wie All-Inkl.com und DomainFactory ist das aber kein Problem.

Wer das WordPress-Plugin Statify nutzt, welches ich selber schon eine ganze Weile im Einsatz habe, der kann die Spammer einfacher stoppen.

Dazu müsst ihr zusätzlich das Plugin Statify Blacklist und dann die oben verlinkte Liste mit Spam-Websites dort im Punkt “Referrer Blacklist” eintragen.

Was ist Referrer Spam und wie kann man diesen blockieren?

Zudem könnt ihr auswählen, ob ihr die Spam-Crawler live aus den Statistiken filtern wollt oder regelmäßig nachträglich per Cronjob. Ersteres sorgt für mehr Serverlast, sollte aber bei den meisten Websites dennoch kein Problem sein.

Mit diesem Plugin werden die Spammer aber nicht wirklich geblockt, sondern nur aus der Statistiken herausgehalten bzw. entfernt. Datenverkehr verursachen sie dennoch. Um das zu verhindern, muss man die .htaccess Methode nutzen.

Koko Analytics

In letzter Zeit teste ich auf meiner Streaming-Website und ein paar anderen Nischenwebsites das Plugin Koko Analytics und vergleiche es mit Statify.

Ein Vorteil hat dieses Statistik Plugin auf jeden Fall, denn es hat bereits einen Spam-Filter integriert. Allerdings sorgt auch dieser hier nur dafür, dass Spam Zugriffe nicht in der Statistik auftauchen.

Referrer Spam-Filter in Google Analytics

Ich selber nutze auf Grund der DS-GVO schon länger nicht mehr Google Analytics, aber wer das tut, sollte sich ebenfalls mit dem Thema Referrer Spam beschäftigen. Schließlich beinhaltet Google Analytics standardmäßig keinen Filter diesbezüglich.

Zum einen kann man den Referrer Spam aus den Google Analytics Statistiken heraushalten, indem man diese Zugriffe schon über die .htaccess-Datei blockiert. Dann können diese gar nicht auf die Website gelangen und in den Google Analytics Statistiken auftauchen.

Allerdings rufen manche dieser Spam-Crawler direkt den Analytics Code auf und sorgen somit dafür, dass sie in den Statistiken doch auftauen (Ghost Referrer Spam), obwohl sie die Website selbst gar nicht besucht haben. Deshalb ist es sinnvoll eine bestimmte Einstellung in Google Analytics zu aktivieren und zusätzlich einen Referrer Spam Filter anzulegen.

Dazu geht ihr auf “Verwaltung” und dort auf die Datenansicht “Einstellungen der Datenansicht”. Dort könnt ihr einen Haken bei “Alle Treffer von bekannten Bots und Spiedern ausschließen” setzen. Warum das nicht die Standardeinstellung ist, erschließt sich mir nicht.

Was ist Referrer Spam und wie kann man diesen blockieren?

Zudem kann man noch spezielle eigene Filter anlegen, indem man unter “Filter” einen neuen benutzerdefinierten Filter anlegt und dort ein Filtermuster eingibt, welches ihr hier finden könnt.

Fazit

Es ist also eigentlich recht einfach Referrer Spam zu blockieren und damit nicht nur für weniger Datenverbrauch, sondern auch für realistischere Statistiken und mehr Sicherheit zu sorgen. Neben den vorgestellten Methoden gibt es noch weitere, die für Laien aber noch komplizierter und meist nicht wirklich notwendig sind.

Dabei würde ich immer empfehlen die Blockierung per .htaccess vorzunehmen, da ihr damit die Spam-Websites generell von der Website fernhaltet. Zusätzlich kann man dann noch das genutze Statistik-Tools absichern, um wirklich nur reale Besucher zu zählen. Letzteres ist aber nicht unbedingt notwendig.

Wie geht ihr mit Referrer Spam um und welche Maßnahmen setzt ihr ein, um diesen zu blockieren?

Peer Wandiger

4 Gedanken zu „Was ist Referrer Spam und wie kann man diesen blockieren? Tipps und Plugins“

  1. perfektes Timing. Ich habe vor einer halben Stunde die Statify-Blacklist aktiviert… 😉

    An die .htaccess-datei traue ich mich nicht dran.

    Ich werde im nächsten Monatsreport zur NSC20 berichten, wie sich die Blacklist auswirkt.

    Antworten
  2. Hi Peer, tausend Dank für die Erläuterungen. Ich habe woanders gelesen, dass man in der letzten Zeile der htaccess-Einträge das “OR” weglassen sollte – ist das optional oder sollte das lieber entfernt werden? VG Jasmina

    Antworten

Schreibe einen Kommentar