Mensch vs. Maschine: Human Powered Search 15


Google ist ein Gigant. Wenn es um automatisches Indizieren und algorithmisches Bewerten von Web-Inhalten geht, so kann dem unangefochtenen Marktführer kein Mitbewerber auch nur annähernd das Wasser reichen. Kandidaten wie Yahoo, MSN, Ask oder Exalead, die versucht haben, Google auf dem eigenen Schlachtfeld zu schlagen, haben bisher auf ganzer Linie versagt. Was auch soll man der Infrastruktur dieses Monstrums, das seine zigtausend Server umfassenden Rechenzentren mittlerweile direkt neben Kraftwerken baut, um überhaupt ausreichend Strom für die benötigte Rechenpower zu haben, entgegensetzen? Vermutlich wäre Microsoft der einzige Konzern, der auch nur annähernd die Mittel dazu hätte, aber der scheitert an Innovationsarmut und festgefahrenen Ideologien.

Und doch, es gibt nicht nur Google. In Südkorea, einem Land mit einer hoch entwickelten Internetkultur, kann Google gerade einmal einen Anteil von 1,7% der Suchanfragen für sich vereinnahmen. Wie bei @web zu lesen ist, hält Naver.com dort 77% der Marktanteile im Suchmaschinenmarkt. Und Naver arbeitet völlig anders, als Google, Yahoo oder die MSN Suche: Die meisten Suchanfragen werden dort durch andere Nutzer des Dienstes beantwortet, ähnlich wie man es von Sites wie wer-weiss-was.de, Lycos IQ oder Fragr kennt. Dies allerdings in einer gewaltigen Dimension: Etwa 70 Millionen Antworten sind bei Naver bereits verzeichnet, die bei einer Suchanfrage mit Nachrichtenartikeln und Weblinks angereichert werden. In westlichen Ländern konnten diese Dienste bisher nicht annähernd diese Bedeutung erlangen. Ob das durch kulturelle Unterschiede bedingt ist, oder ob Naver es einfach besser macht, vermag ich mangels koreanischer Sprachkenntnisse nicht zu beurteilen.

Auf jeden Fall scheint der Ansatz, Algorithmen bei der Websuche durch menschlichen Verstand zu ergänzen, vielversprechend zu sein. Ein weiteres sehr interessanntes Projekt, dass auf diesem Pfad wandelt, ist Mahalo von Jason Calacanis. Mahalo hatte sich zum Ziel gesetzt, handgeschriebene Ergebisseiten für die 10.000 wichtigsten Suchanfragen zu erstellen. Das mag sich zunächst nach Irrsinn anhören. Da die Verteilung von Suchbegriffen aber nach dem Pareto-Prinzip stattfinden dürfte, sich also 80 Prozent der Anfragen um 20 Prozent der Suchbegriffe drehen, kann man mit 10.000 Begriffen schon einen beachtlichen Teil des Informationsbedürfnisses des typischen Suchmaschinennutzers abdecken. Mahalo beschäftigt ein Team von Redakteuren, die sich der Erstellung der Suchergebnisseiten widmen. Aufgrund dieser redaktionellen Erstellung sind die Ergebnisse typischerweise deutlich hochwertiger, als solche, die von einem Algorithmus ermittelt werden. Als Beispiel sei hier die Mahalo Seite zum Thema Poker aufgeführt. Seit einigen Wochen kann man auch als freiwilliger Helfer Ergebisseiten für Mahalo erstellen. Das Angebot scheint gut aufgenommen zu werden, und die Zielvorgabe wurde kürzlich von den 10.000 wichtigsten Suchbegriffen auf 20.000 Begriffe hochgeschraubt.
Visionär Robert Scoble hat sich kürzlich ziemlich weit aus dem Fenster gelegt, als er seinen Post Why Mahalo, TechMeme, and Facebook are going to kick Google’s butt in four years veröffentlichte. Nach teils heftiger Kritik hat er zwar inzwischen eingelenkt, aber im Grundgedanken liegt er meiner Meinung nach richtig: Dienste, die zumindest in Teilen auf menschliche Brainpower setzen, werden den rein algorithmischen Systemen schon bald einen beachtlichen Teil des Kuchens wegschnappen. Natürlich kann es gut sein, dass man das auch bei Google erkannt hat, und schon bald mit ähnlichen Ideen am Start ist. Bereits jetzt werden Suchergebnisse für kommerziell relevante Suchbegriffe ja auch bei Google durch Mitarbeiter überarbeitet.

Ich selbst arbeite derzeit an einem Projekt, das den Grundgedanken von Mahalo aufgreift. Meines Wissens gibt es im deutschen Web derzeit noch keine vergleichbare Plattform, und Mahalo scheint sich bis auf weiteres ausschliesslich auf den englischsprachigen Raum zu konzentrieren. Anfang Oktober soll es losgehen, ich bin gespannt, wie die deutsche Weblandschaft die Idee der Menschengetriebenen Suche aufnehmen wird.


Hinterlasse einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *

15 Gedanken zu “Mensch vs. Maschine: Human Powered Search

  • Andy

    Klingt sehr interessant und erinnert mich an das Wiki-Prinzip. Zu Begriff xy können Nutzer Ergebnisseiten eintragen, die von anderen aber editiert werden.
    Problematisch wird es nur alle Begriffe zu erfassen, aber Wikipedia hat ja mittlerweile auch sehr viele von Einträgen.
    Viel Erfolg!

  • oliver gassner

    Ich hab sowas (social search) im Jahr 2000 mal für ne Firma skizziert, die es nicht haben wollte 😉
    Ich könnte mal versuchen dei Gedabken dazu zusammenzukranzen, ping me 😉

  • Alexander Greisle

    Sehr spannend, gerade für Themen-Recherchen. Wie grenzen sich diese bzw. Dein Projekt gegen Suchkataloge wie z.B. dmoz ab? Nur in der Orientierung an den Suchbegriffen (wenn man mal die Top 50 % der Suchen nach irgendwas mit Sex und nackten Frauen weg lässt, dürfte es ziemlich diffundieren)? Ich nehme mal an, dass einige Elemente des Social Web enthalten sein werden. Was mich zur Frage bringt: Warum solche Dienste nutzen und nicht gleich bei del.icio.us und Konsorten recherchieren?

  • Webmaster Beitragsautor

    del.icio.us und vergleichbare Social Bookmarking Dienste sind völlig unmoderiert. Bei Mahalo können zwar auch Nutzer Ergebnisseiten erstellen, diese werden aber vor Veröffentlichung noch von einem Mitarbeiter kontrolliert.
    Ein wesentlicher Vorteil einer derartigen Suche gegenüber Google ist ja die weitgehende Immunität vor Spam. Dies ist bei den Bookmark Diensten definitiv nicht gegeben.
    Eine wesentliche Abgrenzung gegenüber DMOZ ist die Strukturierung der Linkseiten. Bei DMOZ werden alle Links zu einer Kategorie relativ undifferenziert aufgelistet. Mahalo bietet zum Beispiel auf der Pokerseite Links gruppiert nach “News und Artikel”, “Regeln”, “Tipps”, etc. an. Gib mal bei DMOZ Poker in die Suchmaske ein und vergleiche die Ergebnisseite mit der von Mahalo. Struktur in die Linkwüste bekommt man bei DMOZ erst, wenn man sich durch die passenden Kategorien hangelt.
    Mahalo und auch mein Projekt erlauben auch die Gestaltung von Ergebnisseiten, die contentlastiger sind, eher wie Wikipedia Einträge. Als Beispiel sei hier

  • Mirko

    Ich finde das sehr interessant… Die möglichkeit das mehrer Millionennutzer direkt müber und mit der Maschine kommunizieren verleiht Ihr quasi eine Vorstufe zur KI.

  • free sms

    sehr interessanter Bericht bin ich mal gespannt ob und ab wann das umgesetzt und verwirklicht wird nur wenn google das auch schon manuell macht wird es auch in dem Bereich wieder relativ schwierig google das wasser zu reichen?

  • Markus

    Kann man mal von ausgehen, dass Google da nicht schläft. Wenn ja, übernehmen die einen erfolgreichen Mitarbeiter. Fertig.
    Der Grundgedanke ist verblüffend einfach: Mitmach-Web für Suchmaschinen. Ob es ein Erfolg wird, mag man bezweifeln – wie lässt sich zB eine google-news-Suche mit dem Gedanken vereinbaren? Wer-weiss-was existiert auch schon länger und hat google in D noch nicht nennenswert geschadet.

  • Stefan Fischerländer

    Eine “menschengetriebene Suche” finde ich zwar höchst spannend, die Umsetzung aber ist äußerst schwierig, denn:
    [i]Da die Verteilung von Suchbegriffen aber nach dem Pareto-Prinzip stattfinden dürfte, sich also 80 Prozent der Anfragen um 20 Prozent der Suchbegriffe drehen[i]
    Diese Annahme ist leider nicht korrekt. Die Verteilung ist weit davon entfernt, es geht vielmehr dahin, dass 50 Prozent der Suchanfragen Woche für Woche komplett neu sind, also bisher noch nicht gestellt wurden. Das ist der Long Tail in Reinform.
    Trotzdem bin ich auf ein solches Projekt immer gespannt und drück‘ ganz fest die Daumen.

  • Webmaster Beitragsautor

    @Stefan: Ok, wenn jemand um die Verteilung von Suchbegriffen Bescheid weiss, dann vermutlich Du – I stand corrected.
    Dennoch glaube ich, dass man dem Nutzer für viele der ’neuen‘ Suchbegriffe sinnvolle Ergebnisse vorschlagen kann, wenn die Datenbasis einmal da ist. Siehe auch ‚Related Result Pages from Mahalo‘.
    Und wenn Mahalo für eine Anfrage nichts liefern kann, bekommt der Nutzer immer noch Google Suchergebnisse, er hat also gegenüber einer Suche direkt bei Google nichts verloren.

  • Hansi

    1) auch in russland und china kommt google nur auf einen kleinen marktanteil
    2) wie schon oben gesagt, sind ein grossteil der suchanfragen unique
    3) der erfolg einer suchmaschine hängt nicht nur davon ab, zu den wichtigsten 10000 suchergebnissen gute ergebnisse zu liefern sondern auch in der tiefe (siehe punkt 2) – das kann man mit human powered search nicht gewährleisten
    4) google kann beides und besser als alle anderen wie live oder yahoo (siehe punkt 3)
    5) google ist nach heutigem stand der technik nicht mehr einzuholen (siehe punkt 4 ivm. punkt 3 & 2) – microsoft pumpt milliarden in live und kommt trotzdem nicht vorwärts

    viel erfolg wünsch ich euch trotzdem

  • Handymailen

    Hallo, das klingt ja ganz gut das Projekt aber ich bin da ein wenig pessimistisch. Google ist einfach zu groß und selbst wenn dein Projekt Top wäre würde es sicher in der Masse untergehen. Was man braucht ist ein neues Konzept von Suchmaschine.

  • Kathrin

    Hi, also ich finde das Projekt klingt super und ich bin ebenfalls der Meinung dass eine „Menschen“ hinterlegte Suchmaschine den Nutzern bessere Ergebnisse bringen könnte. So wie auch das von dir beschriebene Portal werweisswas arbeiten mittlerweile schon viele Portale im Internet. Ein von mir persönlich gern genutztes ist beispielsweise experto.de. Halt uns mal auf dem Laufenden wie dein Projekt vorankommt..

    Grüße K.