Eine Woche Blogsearch
Seit einer Woche ist meine Blog Suchmaschine jetzt am Start – Zeit für ein kleines Fazit. Das Interesse an dem Projekt war erfreulich hoch, und zeigt deutlich, dass die deutsche Bloglandschaft hier noch Bedarf hat. Die Anzahl der durchsuchten Blogs ist inzwischen von 60 auf knapp über 200 angewachsen – danke hier an alle, die ihre Feeds bei mir eingetragen haben. Die indizierten Postings belaufen sich im Moment auf genau 4400.
Was steht als nächstes an? Der Spider, also das Script, welches die Daten aus den Blogs sammelt und in der Datenbank ablegt, arbeitet nicht effizient, wenn er regelmässig ALLE verzeichneten Blogs abklappern muss. Hier werde ich zunächst ansetzen und ihn so anpassen, dass er Blogs mit hoher Postingfrequenz häufiger besucht, solche mit niedriger Frequenz seltener. Bei der Gelegenheit kann ich dem Spinnentier dann gleich auch Atom Feeds beibringen, da habe ich noch einen ganzen Batzen Feeds in der Anmeldequeue stehen, weil diese derzeit noch nicht unterstützt werden. Die Linksuche nach einer URL ist ebenfalls ein Feature, welches ich in der nächsten Woche erschlagen möchte.
Mehrfache Kritik hat es am Namen des Projektes gegeben, eine deutschsprachige Blogsuche solle keinen englischen Namen wie Blogsearch tragen. Ich werde mir da sicher noch einen griffigen Namen ausdenken, wahrscheinlich wird es aber eher auf ein Web 2.0 typisches Fantasiekonstrukt hinauslaufen als auf Blogsuche, Weblog Suchmaschine, Blogschnüffler oder ähnliches. Dann wird die Suchmaschine auch ihre eigene Domain bekommen, aber damit werde ich noch warten, bis ein akzeptabel hoher Nutzwert gegeben ist.






März 19th, 2006 at 12:23
Zwei Anmerkungen:
1) Für die schweiz gibt es ein Zentrales Blogverzeichnis (Alles CC Lizenziert), welches sämtliche Weblogs enthält, die sich bei einem der drei grössten Aggregatoren eingetragen haben: blogug.ch
2) Pingen wäre wohl ressourcenschonender als spidern. Wobei man auch hier überlegen könnte, auf bestehende Ressourcen wie wordpress.de oder ähnliches (planet.blogug.ch für die CH) anzuzapfen.
März 19th, 2006 at 12:54
Wie funktioniert denn der Spider? Was für ein Betriebssystem?
März 19th, 2006 at 15:38
Würde es sich bei Blogs nicht anbieten, dass die Blogs deine Suchmaschine anpingen, wenn es ein neues Posting gibt? Warum einen Spider verwenden?
März 19th, 2006 at 20:37
@David: Läuft unter Linux, derzeit ist es ein PHP Script, welches in regelmässigen Abständen per Cronjob gestartet wird. Wie er funktioniert? Feeds aus Datenbank holen, Feeds einlesen, Parsen, und Posts in die Datenbank zurückschreiben.
Bezüglich Pingen: So eine Möglichkeit werde ich auch beizeiten anbieten, allerdings wird es auch immer ein automatisiertes Spidern geben.
September 8th, 2009 at 22:02
Hi Thomas,
kann man sich bei Dir hier noch einbringen um des Deutschsprachliche Netz zu fördern ?
Grüße Martin!-)
September 9th, 2009 at 8:28
Hallo Martin,
das Blogsearch Projekt ist leider weitgehend auf Eis gelegt, mangels Zeit. In welcher Form würdest Du Dich denn einbringen wollen?