Abwehr von Spam in Gästebüchern, Kommentaren, Foren und Kontaktseiten

Auf Grund des ausufernden Problemes mit Spam in Gästebüchern, Kommentaren, Foren und Emails via Kontaktseiten werde ich oft gefragt, wie dieser Spam eingentlich versendet wird.

Mancher denkt sich, die Spammer wenden ganz komplizierte Methoden an denen man kaum beikommen kann. Das ist jedoch nicht richtig. Die Wahrheit ist, die übergroße der Zahl der Spammer verwendet aus wirtschaftlichen Gründen ganz primitive Skripte und man kann ihnen leicht beikommen:

1. Maßnahme: Suchmaschinenoptimierung

Der Bot sucht mit einer Suchmaschine nach Treffern für "Klassische" Bezeichnungen für Formularfelder in Gästebüchern und auf Kontaktseiten.

Das geht ganz einfach so, wie ich es hier vornehme: http://www.google.de/search?q=Kontakt+%2B%22Ihre+Nachricht%22

Diese Treffer werden ganz einfach weiterverarbeitet.

Dagegen kann man sich schützen, in dem man die betreffenden Seiten für den Abruf durch Suchmaschinen einfach sperrt. Warum sollte eine Kontaktseite von einer Suchmaschine gefunden und angeboten werden? Verhindert man genau dies, dann reduziert man die Angriffe schon wesentlich, jedenfalls so lange die betreffende Seite noch nicht von den Spammern gespeichert wurde. Erfolgsquote: weit über 90%.

2. Maßnahme: Einsatz von einfachen Java-Skript

Es ist eine gute Idee Formulare mit document.write zu schreiben oder z.B. mit Ajax nachzuladen. Die Bots können kein Javascript. Das wird nämlich teurer. Erfolgsquote: Über 90%.

3. Maßnahme: Zufällige Namen von Formularfeldern und Einsatz von Sessions

Auch hierdurch bekommen die Spammer ein kleines Problem, dessen Umgehung kostet Intelligenz und damit Geld und macht das Spammen weniger wirtschaftlich. Das bedeutet die Spammer verzichten und wenden sich ungeschützten Seiten zu. Erfolgsquote: fast 100%.

4. Maßnahme: Einsatz von versteckten Formularfeldern

Werden versteckte Formularfelder vom Programm des Spammers ausgefüllt, dann hat man den Spammer schon erkannt. Die dummen Skripte der Spammer können regelmäßig auch mit CSS nichts anfangen und diese Felder nicht erkennen, die füllen einfach alles aus... Erfolgsquote: deutlich Über 90%.

5. Maßnahme: Spamfilter

Einige der Spammer gehen recht primitiv vor. Neben zufälligen Text kommt in den Einträgen immer folgendes vor:

example.org
[url]http://example.org/sdbcc673vb[/url]
http://example.org/sdbcc673vb

Das ist oft leicht zu erkennen und mittels geeigneter Filter oder regulärer Ausdrücke kann man diese Spammer in vielen Fällen abwehren. Die Erfolgsquote hängt jedoch sehr von der Intelligenz ab, mit der die Filter erstellt werden: Bis zu 70% des Spams sind so erkennbar.

6. Maßnahme: Prüfung des Hostes

Dienste wie Spamhaus.org, Sorbs.net und Blocklist.de bieten die Möglichkeit, die (vermeintliche) IP-Adresse des Senders durch eine DNS-Abfrage zu prüfen und machen auffällige Hosts erkennbar. Rund  50% des Spams sind so erkennbar.

7. Maßnahme: Wiederholungsfilter

Ein einfacher Vergleich von bereits empfangenen Formulardaten mit den gerade abgesendeten kann, auch ohne dass man diese selbst speichert durchgeführt werden. Schützt auch davor, die selbe Nachricht mehrfach zu bekommen. Erfolg: Wirkt bei jeder Wiederholung: Sie bekommen den selben Spam definitiv nur einmal.

8. Maßnahme: Manuelle Freigabe

der Kommentare, Gästebucheinträge, Forenbeiträge ohne Freigabe durch einen Redakteur oder Administrator. Diese Maßnahme ist bei Gästebüchern oder Blog-Kommentaren zu 100% erfolgreich, bei Email von Kontaktseiten sinnlos und bei Foren nicht praktikabel. Außerdem kann es sehr viel Zeit kosten mehrere hundert (oder nach einem Urlaub: mehrere tausend(!) solcher Spameinträge zu löschen. Bietet aber eine über de Spam hinausgehende Inhaltskontrolle. Erfolgsquote: 100%, aber nur zusammen mit den anderen Schritten sinnvoll.

9. Maßnahme: Captchas

Das sind diese kleinen Grafiken mit Buchstaben oder Zahlen, die in ein Formularfeld eingegeben werden müssen. Sind recht nervig und können, wenn diese schwer zu lösen sind, Besucher abschrecken oder eine Kommunikation via Konataktformular unmöglich machen. Sind die Captchas aber zu einfach, dann können die Spammer - ein wirtschaftliches Interesse vorausgesetzt - diese auch mittels OCR-Texterkennung auslesen. Doch selbst schwierige Captchas bieten keinen 100%-igen Schutz: Google zeigt hier den prinzipiellen Weg diese zu knacken - nur knackt Google keine Captchas sondern lässt die Benutzer von Webseiten durch OCR nicht erkannte Stellen von Büchern erkennen. Erfolgsquote: Sehr hoch, mindestens 99,9%, aber nicht endgültig sicher und nervt Ihre Besucher, verhindert womöglich Kontaktaufnahme.

Angebot:

Ich biete an, Ihre Webseiten auch nachträglich gegen Spam zu schützen. Das ist, auf Dauer, deutlich billiger als das nervige Löschen vom Spam - das ja auch Ihre Arbeitszeit kostet oder gar die Rufschädigung Ihres Unternehmens, wenn auf Ihren Webseiten plötzlich Spam für Pornoseiten, Viagra oder für durch Viren verseuchte Webseiten auftaucht.


Weitere Informationen in diesem Bereich: