Analyse eines Spamprojektes 10


Anno 2005 war ich der glückliche Besitzer eines selbst programmierten Webverzeichnisses, einer Art Mini-DMOZ. Dank suchmaschinenfreundlicher Gestaltung und einiger guter Backlinks wurde die Site von Google recht gut aufgenommen. Eines Tages kam ich auf die Idee, die Inhalte des Webkatalogs mit Suchergebnissen, die ich über die Yahoo-API bezog, anzureichern. Für jeden Suchbegriff gab es per Mod-Rewrite eine eigene URL und durch eine geschickte interne Verlinkung sorgte ich dafür, dass möglichst viele dieser Suchergebnisseiten indiziert wurden. Ein Nutzwert dieser Seiten für den Besucher, das gebe ich offen zu, war kaum gegeben.

Aus Gründen, die mir bis heute nicht klar sind, befand der Google Algorithmus dann irgendwann, dass meine Pseudo-Suchmaschine eine Autorität für Gedichte, Sprüche und Zitate sein müsse. Täglich kamen tausende von Besuchern über Begriffe wie »Gedicht zur Goldenen Hochzeit«, »Sprüche zum Jubiläum« oder »Spruch 50. Geburtstag«. Bei gut 25.000 täglichen Pageviews und offensiv platzierten Adsense-Anzeigen brachte mir das Projekt eine Zeitlang ein erfreuliches Zweiteinkommen ein. Bis ich dann eines Tages auf dem Radar der Quality-Rater gelandet bin, und Google meine kompletten Suchergebnisseiten aus dem Index kickte.

Das ist jetzt gut 5 Jahre her. Googles Ranking-Algorithmus wurde erheblich weiterentwickelt und mit einem derart billigen Konzept ist heutzutage kein Blumentopf mehr zu gewinnen. Oder doch?

Die Sistrix-Toolbox weist unter den Gewinnern im Sichtbarkeitsindex diese Woche die URL germanwordsuggest.com aus. Mit einem Sichtbarkeitsindex von 36.20 liegt die Site in etwa auf einer Augenhöhe mit dem Presseportal DerWesten. Die Entwicklung der Sichtbarkeit verlief explosionsartig:

In der letzten Woche des Jahres 2010 konnte Germanwordsuggest für satte 1.098 Keywords aus dem Sistrix Index den ersten Platz bei Google belegen. Was bietet nun diese enorm erfolgreiche Website dem Besucher? Der Aufruf URL zeigt eine Startseite in schlechtem Deutsch, die mit einem kostenlosen HTML Template von Solucija realisiert wurde. Neben einigen abenteuerlichen Textabsätzen (»Instrumente der Forschung der Schluesselwoerter und Dienstleistung«) wird die Seite von einer riesigen Tagwolke willkürlich erscheinender Worte dominiert.

Jedes dieser Tags führt zu einer eigenen Unterseite für das jeweilige Wort, die nichts weiter enthält als einen großen Adsense-Block, eine Liste von etwa 100 bis 300 Wortkombinationen mit dem gewählten Begriff, sowie 20 Links zu weiteren zufälligen Wortseiten. Der Nutzen einer solchen Seite für den Besucher tendiert gegen Null.

Erfolgsfaktoren

Wie kommt nun die gewaltige Sichtbarkeit des Projektes zustande? Dem Betreiber ist es laut Sistrix gelungen, eine knappe Million Seiten in den Index zu drücken. Da die Wortseiten viele Keywords aus dem Longtail-Bereich abdecken, bei denen der Wettbewerb sehr niedrig ist, lassen sich mit einer guten Onpage-Optimierung entsprechend viele Keywords gut positionieren.

Um eine solche Masse an Seiten in Google zu bekommen benötigt es eine Menge Linkpower. Eine Linkdomain-Abfrage bei Yahoo bescheinigt der Site satte 15.782 Backlinks. Doch freiwillig wird wohl kaum ein Webmaster eine Site wie diese verlinken. Mein erster Verdacht war daher, dass hier massiv Kommentarspam betrieben wurde, um an die benötigten Links zu kommen. Eine Untersuchung einiger verlinkender Seiten fördert aber erstaunliches zutage: Es ist dort gar kein Link zu Germanwordsuggest zu finden.

Ein Linkreport von MajesticSeo bringt Licht ins Dunkel: Hier findet sich eine ganze Reihe von Sites wie minnesotaforce.org oder kakwa.org, welche tatsächlich Links zu Germanwordsuggest enthalten. Die Links wurden jedoch per CSS versteckt. Die Handschrift erinnert stark an das Vorgehen sogenannter Craphead-SEOs, wie es Dominik Wojcik in seinem Vortrag Linkbuilding – Beyond the Line auf der letzten SEOCampixx beschrieben hat. Vermutlich wurden die betroffenen Websites gehackt und die Eigentümer wissen nicht einmal, wen sie da verlinken.

Gut möglich, dass bei den Linkspendern ohne erkennbaren Link im Quelltext zusätzlich ein serverseitiger Cloaking-Mechanismus zum Einsatz kommt. Zumindest im Google-Cache dieser Seiten lassen sich die Verweise tatsächlich noch finden. Sollte meine Vermutung stimmen, dass diese dort gegen den Willen der jeweiligen Webmaster hereingehackt wurden, ist die Arbeitsweise unseres Spammers jenseits von Blackhat und definitiv im illegalen Bereich anzusiedeln.

Verdienstmöglichkeiten

Wie viel lässt sich mit so einem Spamprojekt verdienen? Die Sichtbarkeit liegt in etwa gleichauf mit DerWesten, der laut IVW im November 2010 gut 8 Millionen Besucher hatte. Geht man mal davon aus, dass DerWesten eine hohe Zahl an Stammbesuchern hat, so kommen vielleicht 4 Millionen monatliche Besucher über Google.

Optimistisch geschätzt durfte sich Germanwordsuggest dann in der letzten Woche über 1.000.000 Besucher freuen. Bei dem geringen Nutzwert des Contents und der aggressiven Platzierung des Adsense-Blocks setze ich eine sehr hohe Klickrate von 25 Prozent an. Bei einem CPC von 3 Cent hat die Site dann in dieser einen Woche satte 12.500 Euro abgeworfen.

Die extreme Sichtbarkeit von Germanwordsuggest war vermutlich nur von kurzer Dauer, für viele der in Sistrix angezeigten Top-Positionen rankt die Site schon nicht mehr. Wahrscheinlich haben bei Google dann doch mal die Alarmglocken geklingelt, und die Site wird genau so schnell verschwinden, wie sie aufgestiegen ist.

Schlussfolgerungen

Auch im Jahr 2011 ist Google offensichtlich nicht vor Spam der einfachsten Art gefeit. Zwar ist ein Spamprojekt wie das hier analysierte eine kurzlebige Angelegenheit, es ist aber doch erschreckend, dass sich mit völlig inhaltsleeren Seiten überhaupt noch eine solche Sichtbarkeit erreichen lässt.

Aufgrund der vermutlich illegalen Taktiken beim Linkaufbau würde ich von einer Nachahmung dieses Prinzips dringend abraten. Durchaus interessant kann es jedoch sein, mal die Keyphrasen zu untersuchen, mit denen Germanwordsuggest gute Platzierungen bei Google belegen konnte. Denn eine einzelne Unterseite des Projekts kann aufgrund der Masse indizierter Seiten nicht besonders stark sein. Die Tatsache, dass sie dennoch rankte, deutet auf ein vergleichsweise einfaches Keyword hin. In der Sistrix Toolbox kann man nun hingehen und alle Keys, bei denen Germanwordsuggest eine Top 10 Position erreicht hat, nach Traffic sortieren. Voilla – Keywordkombinationen mit Traffic und einem niedrigen Wettbewerb: Wirft man die Navigational Queries, Adult-Keys und Typos weg, so finden sich noch immer einige interessante Begriffe: »wer verleiht porzellan«, »blasenkontrolle training« oder »handynummernverzeichnis« sind durchaus Keywords, mit denen man eine Microsite oder ein sinnvolles Projekt aufziehen könnte. Dem wäre dann hoffentlich ein längeres Leben beschert, als der Eintagsfliege Germanwordsuggest.


Hinterlasse einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *

10 Gedanken zu “Analyse eines Spamprojektes

  • Sascha

    Wenigstens zeigen beide Geschichten eins: nur wer wirklichen Wert in den Markt bringt wird dauerhaft erfolgreich sein.
    Durch immer wieder neue SEO-Tricks zu versuchen mit minderwertigem Inhalt Geld zu verdienen ist ein ständiger Kampf gegen Google, die solche Seiten (meiner Meinung nach völlig zurecht) auf die hinteren Plätze verweisen.
    Good content is king!

  • Thomas Wagner

    Auch wenn diese Seite mit ziemlich fragwürdigen und illegalen Methoden arbeitet, scheint Sie ja (wenigstens kurzfristig) Erfolg zu haben.

    Und bei geschätzten 12.000 EUR/Woche ist es auch noch lukrativ.

    Was mir fehlt ist die Hinterfragung der Kosten. Wie schnell ist so eine seite programmiert? Wie schnell ist es möglich eine so große Zahl an Seiten zu hacken. Welcher Aufwand steckt dahinter. Lohnt es sich dann immer noch?

  • Horst

    Sehr schöner Artikel. Ich würde einen andere CPC und Klickrate annehmen, aber ungefähr auf den gleichen Verdienst kommen.
    Würde man einen Programmierer engagieren, der sowas erstellt, wäre der wohl eindeutig der Gewinner, was den Verdienst angeht. 😎

  • fiacyberz

    Eine ähnliche Seite die sehr stark gestiegen ist im Longtail Bereich ist iphpbb.com
    Hier wurde scheinbar erst jetzt das Archiv für Google freigegeben. Die Domain ist schon älter und hat eine Menge Links. Vorher rankten auf der 1 bei den Begriffen Seiten wie myvideo oder yasni

  • Thomas Frütel Beitragsautor

    @Thomas Wagner: Initiale Entwicklungskosten gibt es sicherlich, ich würde die allerdings höchstens im mittleren vierstelligen Bereich ansiedeln.

    Zudem ist das System, wenn es einmal steht, relativ einfach mit leichten Anpassungen zu clonen. Ich gehe fest davon aus, dass der Betreiber im Handumdrehen eine neue Instanz dieses Projektes am Start hat, wenn er nicht ohnehin mehrere davon parallel betreibt.

    Schwieriger ist es da sicherlich mit dem Linkaufbau. Vermutlich ist auch das irgendwie automatisiert, aber es wird nur eine begrenzte Anzahl an potenziellen Linkopfern geben. Wenn die alle verbrannt sind, wird es schwierig, ein weiteres Germanwordsuggest zu positionieren.

  • Max

    Interessanter Einblick. Soviele Links zu erzeugen kostet jedoch sicherlich auch einiges an Zeit. Aber über 12k sind natürlich trotzdem nicht zu verachten in der kurzen Zeit, zumal vermutlich das Spielchen mit verschiedenen Seiten betrieben wurde und dann skaliert werden kann.

    Einen Blog von uns hat es auch mal getroffen mit versteckten CSS-Links und da waren immer gleich mehrere drin.