Film und Internet: Kleine Geschichte der Suchmaschinen

 

Texte:
Einleitung
Geschichte des Netzes

Film und Internet

Link-Tipps:
Filmlinks
Sitewalks

Wie man in den Wald hineinruft, so schallt es heraus - Zur Geschichte der Suchmaschinen

Eine Information, die man nicht findet, ist keine Information. Und in dem Maße, wie das Internet Information und Desinformation, Meinung und Spekulation produziert, wächst das Bedürfnis dieser elektronischen Datenflut habhaft zu werden. Die Erschließung des exponentiell wachsenden Netzes kann aber keine Sache fleißiger Hände mehr sein, sondern muss Maschinen überlassen werden. Ihre Geschichte ist die Geschichte des Netzes selbst: Konzipiert in den Labors von Universitäten, Firmen und dem amerikanischen Militär, groß geworden in den Universitäten und schließlich popularisiert für alle Lebensbereiche.
Das World Wide Web (WWW) repräsentiert die Spätphase des Netzes und entsprechend entstanden die ersten Suchmaschinen schon früher in anderen Systemen. Den Anfang bildete Archie, das im Jahr 1990 von Alan Emtage an der McGill University in Montreal entwickelt wurde. Es erstellte Listen von Dateien auf den jeweiligen Servern zusammen und indexierte sie anschließend. Archie ist jedoch heute praktisch bedeutungslos. Auch für Gopher, einem Vorläufer des WWW, wurde schon kurz darauf von Mitarbeitern des Rechenzentrums der University of Nevada eine Suchmaschine konzipiert: Veronica . Die Dame dieses Namens durchsucht seit 1992 automatisch das Internet und archiviert die gefundenen Seite in einem zentralen Index. Damit ähnelt Veronica stark den aktuell verwendeten Verfahren für das Web. Sowohl Gopher als auch Veronica sind heute praktisch in das WWW integriert und mit jedem normalen Browser abrufbar. Ihre Geschichte und ihre Ästhetik, insbesondere ihre einfache Oberfläche, weisen sie als Veteranen des Netzes aus und animieren zu vereinzelten Manifesten, welche der Kommerzialisierung des Web den Gopher-Space entgegenhalten ("a call to keep Gopher alive" ).
Demgegenüber steht die Erfolgsgeschichte des World Wide Web. Anfang der 90er Jahre von Tim Berners-Lee und Robert Cailliau konzipiert und seit 1992 durch einen frei verfügbaren Browser in seiner Entwicklung derart beschleunigt, daß es inzwischen zu einem Alltagsmedium geworden ist. Die erste Suchmaschine (Robot), den World Wide Web Wanderer, schrieb der MIT-Student Matthew Gray im Frühjahr 1993, weil er die Ergebnisse für eine Studie über das Wachstum des Webs benötigte. Kurz darauf ergänzte Michael L. Mauldin von der Carnegie Mellon University den Wanderer um das Suchprogramm (Retrieval Program) Wandex, das auch die gefundenen Dateien indexierte.
Aliweb (Archie-Like Indexing of the Web) war die Antwort von Martijn Koster auf den Wanderer und entstand im Oktober 1993. Er gehörte aber nicht zu den robots, so daß die Betreiber der jeweiligen Server selbst einen Index erstellen und anmelden mußten. Im Dezember 93 folgten Jumpstation, WorldWideWebWorm und RBSE Spider, wobei erstere nicht nur den Titel, sondern auch die Meta-Informationen der HTML-Datei auswerteten. Dagegen bot der Spider als erste Search Engine ein Ranking der Ergebnisse an. Es folgten der Webcrawler (heute:Webcrawler.com) der University of Washington (April 94) und Lycos, dessen Engine wiederum von Michael Mauldin entwickelt wurde (Juli 94). Mauldin sollte sich in der Folgezeit zu den Pionieren von Retrieval-Verfahren entwickeln. ..
Das Jahr 1995 brachte die kommerziellen Suchmaschinen wie Infoseek, Excite und AltaVista auf die Bühne und besiegelte das Schicksal der universitären Pioniere. Gleichzeitig wurden sich die Suchmaschinen ihrer herausragenden Bedeutung bewußt und schrieben Lehrstücke in politischer Ökonomie: Das Unternehmen Open Text etwa kündigte im Sommer 1996 an, Anzeigenkunden bevorzugt beim Ranking zu behandeln. Daß sich daraufhin die Nutzer abwendeten, hinderte GoTo, den Nachfolger des WorldWideWebWorm, zwei Jahre später nicht daran, ganz offiziell "Pay-for-Placement" als Finanzierungsstrategie einzuführen. Inzwischen liebäugelt auch das in Geldnöte geratene AltaVista mit dieser Strategie. Hintergrund sind die gescheiterten Börsengänge der großen Search Companies, die Kurse von Yahoo und Lycos etwa brachen auf gut 10 % ihrer Höchstwerte ein. Die Krise an der Börse steht aber nicht nur für eine gescheiterte Portal-Strategie, sondern verdeutlicht neben den Umbrüchen in der Netzökonomie auch konzeptionelle Schwächen. Das traditionelle Verfahren der Suchmaschinen, die maschinengestützte Indexierung von Webseiten, stößt offenkundig an ihre Grenzen. Und die Webkataloge wie Yahoo werten nun mal nur eine äußerst reduzierte Anzahl von Seiten aus. Die Alternativen stehen bereit. Google und Direct Hit etwa setzen auf Verfahren wie etwa PageRank, welche die (benutzten) Links zu einer Seite als Maßstab für deren Qualität heranziehen; Metasuchmaschinen wie etwa MetaGer übernehmen die Abfrage und Auswertung verteilter Suchmaschinen; redaktionelle Systeme, welche für ihr Ranking Nutzer aus dem Netz selbst heranziehen (Open Directory Project) und dezentrale Suchmaschinen wie etwa Infrasearch.

Skandalös lange steht auch der Suchdialog selbst zur Disposition. Nur intelligente Systeme wie etwa Chatterbots (Infos von Simon Laven) können die Anfragen auch wirklich "verstehen". Denn: "Wie man in den Wald hineinruft, so schallt es heraus."

Jürgen Keiper, erw. Fassung von: "Kleine Geschichte der Suchmaschinen" in: ZUS., Samstag, 10.2.2001.

DIF