Perspektiven eines Open Web Index - Dirk Lewandowski* - Search Studies
←
→
Transkription von Seiteninhalten
Wenn Ihr Browser die Seite nicht korrekt rendert, bitte, lesen Sie den Inhalt der Seite unten
Information. Wissenschaft & Praxis 2016; 67(1): 15–21 DGI-Forum Wittenberg 2015 Dirk Lewandowski* Perspektiven eines Open Web Index DOI 10.1515/iwp-2016-0020 Cette situation n’est pas jugée souhaitable et des discussi- ons ont été entamées autour de solutions possibles. L’arti- Zusammenfassung: Der Suchmaschinenmarkt wird seit cle examine les différentes approches et se focalise sur vielen Jahren von nur einer einzigen Suchmaschine, Goo- l’idée d’un index du Web ouvert (OWI), qui devrait être gle, dominiert. Es wurde mittlerweile erkannt, dass diese accessible comme infrastructure publique. L’idée princi- Situation nicht wünschenswert ist. Wir sprechen nun über pale est la séparation des données (index) et des services mögliche Lösungen. Der Artikel diskutiert unterschiedliche qui s’y greffent et qui peuvent fonctionner en grand nom- Lösungsansätze und fokussiert dabei auf die Idee einen bre sur base d’initiatives privées. Le but est donc de créer Offenen Web-Index (OWI), der als öffentliche Infrastruktur une base pour la diversité. verfügbar gemacht werden soll. Die Grundidee ist die Tren- Descripteurs: moteur de recherche, index, concept, con- nung von Datenbestand (Index) und darauf aufsetzenden currence Diensten, welche in großer Zahl in privater Initiative betrie- ben werden können. Es geht also darum, die Basis für Vielfalt zu schaffen. Einleitung Deskriptoren: Suchmaschine, Index, Konzept, Wett- Seit vielen Jahren ist die Situation auf dem Suchmaschi- bewerb nenmarkt fast unverändert: Google hält in Europa einen Marktanteil von mehr als 90 Prozent; Veränderungen sind The idea of an Open Web Index nicht in Sicht. Auf dem US-amerikanischen Markt konnte Abstract: The European search engine market has been sich mit Bing zumindest eine zweite Suchmaschine etab- dominated by one single search engine, namely Google, for lieren. Andere (vermeintliche) Suchmaschinen bestehen many years. Most commentators agree that this situation is vor allem aus Suchinterfaces, die Ergebnisse einer dieser undesirable, and a discussion has started on ways to solve beiden Suchmaschinen anzeigen. this problem. This article discusses different approaches, So sehr eine Alternative zu Google zu begrüßen ist, so and then focuses on the idea of building an Open Web Index wird doch schnell klar, dass es im Hinblick auf die Vielfalt (OWI). This index should be provided in the form of a public der Meinungen oder eben Suchergebnisse bei weitem nicht infrastructure. The core idea here is to unlink the data ausreichend ist, eine oder einige weitere Suchmaschinen underlying a search engine (the index) and the (search) zu etablieren. Vielmehr ist nach Wegen zu suchen, wie es services themselves. Many such services could be built on gelingen kann, die Basis für eine Vielzahl weiterer, auch the basis of one index. Therefore, an Open Web Index would spezialisierter, Suchdienste zu schaffen, um weg von nur provide the basis for diversity on the search engine market. einer von vielen möglichen Interpretationen der Inhalte des Web hin zu einer Vielzahl von Interpretationen zu kommen, Descriptors: Search engine, Index, Project schema, Com- die letztlich den Nutzern dient. Wir befinden uns heute in petition einer Situation, in der ein Nutzer ernsthaft nur zwischen zwei Interpretationen der wählen kann – und Beschränkun- Les perspectives d’un index du Web ouvert gen der Suchmaschinen sorgen dafür, dass die Interpretati- Résumé: Le marché des moteurs de recherche est dominé onsleistung der genutzten Suchmaschine nicht ausgehe- depuis de nombreuses années par un seul outil, Google. belt werden kann: Auch wenn die Suchmaschine häufig angibt, einige Millionen Treffer zu einer Suchanfrage gefun- den zu haben, so werden doch immer nur maximal 1.000 *Kontaktperson: Prof. Dr. Dirk Lewandowski, Hochschule für Ange- Treffer ausgegeben; weitere Ergebnisse lassen sich nicht wandte Wissenschaften Hamburg, Fakultät für Design, Medien und Information, Department Information, Finkenau 35, 22081 Hamburg, abrufen. Hier wird das Ranking zum Filter: Während im E ˗ Mail: dirk.lewandowski@haw-hamburg.de, Ranking Ergebnisse nur in einer bestimmten Reihenfolge www.bui.haw-hamburg.de dargestellt werden und sich prinzipiell alle Ergebnisse auf- Bereitgestellt von | Hochschule für Angewandte Wissenschaften Hamburg Angemeldet Heruntergeladen am | 04.04.19 11:58
16 Dirk Lewandowski, Perspektiven eines Open Web Index rufen lassen, sorgt ein Filter dafür, dass nur ein Teil der rend andere Suchmaschinen keinen eigenen Datenbestand Ergebnisse überhaupt angesehen werden kann. anbieten, sondern auf den Datenbestand einer dieser bei- In diesem Artikel werden die mit der Dominanz von den Suchmaschinen zurückgreifen.1 Das Partnerindex-Mo- Google verbundenen Probleme beschrieben und Lösungs- dell hat so zu einer Ausdünnung des Suchmaschinen- ansätze diskutiert. Dabei wird insbesondere auf den vom markts beigetragen. Autor vorgeschlagenen Ansatz der Schaffung eines Offe- Dieser Blick auf den Suchmaschinenmarkt zeigt, dass nen Web Index (Open Web Index; OWI) eingegangen. es nur vermeintlich eine Vielfalt gibt, die sich tatsächlich Die folgenden Abschnitte sind wie folgt gegliedert: Zu- auf nur zwei Suchmaschinen reduziert. Weltweit existieren nächst wird die Bedeutung der Suchmaschinen beschrie- noch zwei weitere bedeutende Indexe, nämlich die von ben und auf die Situation auf dem Suchmaschinenmarkt Yandex (Russland) und Baidu (China). Weitere Indexe von eingegangen. Aus dieser Situation heraus ergibt sich „das neueren Suchmaschinen wie Duck Duck Go erreichen bei Problem Google“, welches im Folgenden in seinen unter- weitem nicht die für den Betrieb einer „echten“ weltweiten schiedlichen Bereichen beschrieben wird. Anschließend Suchmaschine notwendige Größe. Betrachtet man in die- werden Lösungsvorschläge zur Schaffung von Alternativen ser Weise die Entwicklung des Suchmaschinenmarkts zu Google vorgestellt und diskutiert. Dann wird auf die nicht in Bezug auf die Dienste (Suchmaschinen), sondern Initiative für einen „Open Web Index (OWI)“ eingegangen, in Bezug auf die Indexe, so findet sich eher eine rückläu- in der sich Wissenschaftler und Suchmaschinenpraktiker fige Tendenz. Seit 2009 wurden mehrere Indexe einge- aus unterschiedlichen Bereichen gesammelt haben, um stellt; zu nennen sind hier Yahoo, Ask.com und Cuil. einen Offenen Web-Index als Infrastrukturmaßnahme vo- Neben den genannten Suchmaschinen/Indexen wer- ranzubringen. Der Artikel schließt mit einem Fazit. den immer wieder die Initiativen CommonCrawl und Inter- net Archive als Alternativen genannt. CommonCrawl stellt einen (kleineren) Index zur allgemeinen Nutzung zur Ver- fügung. Dieser Index ist jedoch statisch und eignet sich Die Bedeutung der Suchmaschinen damit nicht zum Aufbau von Suchmaschinen, sondern nur und der Suchmaschinenmarkt für Analysezwecke. Der Index des Internet Archive speist vor allem die Wayback Machine, mit der sich alte Versio- Suchmaschinen sind der Zugang zu den Informationen im nen von Dokumenten im Web aufrufen lassen. Es gibt Web; andere Ansätze zur Erschließung dieser Inhalte ha- keine Schnittstelle, um auf diesem Index andere Dienste ben hinsichtlich der Nutzung nur eine nachgeordnete Be- aufzubauen. Dazu kommt, dass man auch hier nicht von deutung. Suchmaschinen sind noch vor E-Mail der belieb- einem vollständigen Index des Web – soweit dies möglich teste Dienst des Internet (Frees, 2015). Dem gegenüber ist – sprechen kann. steht die seit Jahren unveränderte Tatsache, dass im Grun- de nur eine einzige Suchmaschine, nämlich Google, ge- nutzt wird. Sie erreicht in Deutschland wie auch in den Das „Problem Google“ meisten anderen europäischen Ländern einen Marktanteil von über 90 Prozent. Dazu kommen Marktanteile, die Als das „Problem Google“ soll im Folgenden das Bündel an durch Partnerschaften auf dem Suchmaschinenmarkt ge- Problemen, das sich aus der Dominanz nur einer einzigen wonnen werden: Im sog. Partnerindex-Modell greift ein Suchmaschine ergibt, beschrieben werden. Dabei geht es Suchportal auf die Ergebnisse einer anderen Suchmaschi- weniger um Google als Unternehmen als um eine Situation, ne zurück. Dieses Modell ist für beide Seiten attraktiv: Der die sich ergibt, wenn ein einziger Anbieter den Zugang zu gebenden Suchmaschine entstehen durch die zusätzlichen den Inhalten des Web bestimmt. Allerdings soll auch nicht Transaktionen kaum Kosten, weil der Hauptteil der Kosten verleugnet werden, dass diese Probleme durch Googles in Aufbau und Pflege der Suchmaschine liegt, nicht in der praktisches Handeln verstärkt werden; auf diesen Sachver- Verarbeitung der Suchanfragen. Die nehmende Such- halt wird an geeigneter Stelle hingewiesen. Die hier be- maschine spart die Kosten für den Betrieb einer eigenen schriebenen Probleme beziehen sich auf die Qualität der Suchmaschine. Die Kooperationspartner teilen sich die Er- Suchergebnisse; weitere Probleme wie beispielsweise die löse, die mittels der zusätzlich zu den Suchergebnissen ausgespielten Werbetreffern erzielt werden. Der Überblick der auf dem deutschen Suchmaschinenmarkt bestehenden 1 Die Metasuchmaschine Metager bildet hier eine Ausnahme: Sie Partnerschaften (Abb. 1) zeigt, dass nur Google und Bing greift u. a. auch auf die originären Datenbestände von Yandex und als gebende Suchmaschinen eine Bedeutung haben, wäh- Exalead zurück. Bereitgestellt von | Hochschule für Angewandte Wissenschaften Hamburg Angemeldet Heruntergeladen am | 04.04.19 11:58
Dirk Lewandowski, Perspektiven eines Open Web Index 17 Abbildung 1: Partnerschaften auf dem deutschen Suchmaschinenmarkt (Lewandowski, 2015b, S. 158). Dominanz bei der Online-Werbung bleiben hier aus- wird bei jeder navigationsorientierten Suchanfrage, die geklammert. richtig beantwortet wird (die gewünschte Website steht an Das „Problem Google“ lässt sich in drei Bereiche un- erster Stelle im Ranking), ein Erfolgserlebnis haben und terteilen: die korrekte Beantwortung der Anfrage der benutzten Jede Suchmaschine bietet ihre eigene, und nur eine, Suchmaschine zuschreiben. Dies gilt ebenso für triviale Interpretation der Inhalte des Web. informationsorientierte Suchanfragen, bei denen das Ziel Nur für einen Teil der Suchanfragen lassen sich ein- nur ein einziges Dokument ist, um sich oberflächlich zu deutig richtige oder falsche Ergebnisse unterscheiden. informieren oder eine Faktenaussage zu prüfen. Es ist an- Nach Andrei Broder (2002) lassen sich Suchanfragen im zunehmen, dass sich aus der häufigen positiven Beurtei- Web nach den dahinter stehenden Intentionen in drei lung des Sucherfolgs in eindeutigen bzw. einfachen Fällen Typen einteilen: informationsorientiert, navigationsorien- eine Übertragung auf andere, auch schwierigere Fälle von tiert und transaktionsorientiert. Das Ziel informationsori- informationsorientierten Suchanfragen ergibt (Lewan- entierter Suchanfragen sind Informationen zu einem The- dowski, 2014b), d. h. Nutzer bewerten die Ergebnisse ihrer ma und damit in der Regel mehrere Dokumente. Ein bevorzugten Suchmaschine positiv, auch wenn andere Nutzer möchte sich ein Bild von einem Thema machen und Suchmaschinen evtl. relevantere Ergebnisse (oder andere, entscheidet selbst, wann seine Suche beendet ist. Im Ge- jedoch ebenso relevante Ergebnisse) liefern würden. gensatz dazu hat eine navigationsorientierte Suchanfrage Wenn es nun bei informationsorientierten Suchanfra- das Ziel, genau eine entweder bereits bekannte oder zu- gen keine klare Unterscheidung zwischen richtig und mindest vermutete Website (wieder) zu finden. In diesem falsch gibt, so ergibt sich ein Interpretationsspielraum. Fall gibt es genau ein richtiges Ergebnis. Mit einer trans- Diese Interpretation erfolgt algorithmisch, d. h. die Bewer- aktionsorientierten Suchanfrage möchte ein Nutzer eine tung der Dokumente erfolgt maschinell auf der Basis von Website finden, auf der dann die Transaktion (bspw. On- menschlichen Annahmen, die in die verwendeten Algo- line-Banking, der Kauf eines Produkts oder das Spielen rithmen eingehen. Jede Suchmaschine bietet damit eine eines Spiels im Browser) durchgeführt werden kann. eigene algorithmische Interpretation der Web-Inhalte. Mit dem Modell von Broder lässt sich auch die Zufrie- Jede Suchmaschine, die selbst Inhalte oder Spezial- denheit der Nutzer mit den Ergebnissen der von ihnen suchmaschinen anbietet, gerät in einen Interessens- bevorzugten Suchmaschine erklären: Navigationsorien- konflikt, wenn diese Inhalte in der allgemeinen Suche tierte Anfragen machen einen erheblichen Anteil an der angezeigt werden. Gesamtmenge der Suchanfragen aus und ihr Ergebnis lässt Suchmaschinenbetreiber haben bereits vor vielen Jah- sich klar nach richtig und falsch unterscheiden. Ein Nutzer ren damit begonnen, Spezialsuchmaschinen für bestimmte Bereitgestellt von | Hochschule für Angewandte Wissenschaften Hamburg Angemeldet Heruntergeladen am | 04.04.19 11:58
18 Dirk Lewandowski, Perspektiven eines Open Web Index Themen und bestimmte Bereiche des Web aufzubauen Suchmaschinenoptimierung ist mittlerweile eine etab- (sog. vertikale Suchen). Da Nutzer allerdings ihre Such- lierte Praxis im kommerziellen Bereich. Allerdings sollte anfragen weiterhin vor allem in der allgemeinen Websuche nicht vergessen werden, dass Suchmaschinenoptimierung eingaben und sich vor dem Abschicken einer Suchanfrage auch für informative Inhalte erfolgt. Vorangegangen sind kaum Gedanken über die Auswahl eines geeigneten Such- hier die Zeitungsverlage, die ihre Online-Nachrichtenange- raums machten, führten die Suchmaschinen Ergebnisse bote optimiert haben. Zunehmend werden aber auch Inhal- aus unterschiedlichen vertikalen Suchen im Rahmen der te zum Zweck der PR oder sogar im akademischen Bereich sog. Universal Search auf einer Suchergebnisseite zusam- optimiert. Im Zusammenhang mit der Verwendung von nur men (vgl. Quirmbach, 2009). Ergebnisse aus diesen ver- einer Suchmaschine durch die Nutzer ergibt sich hier eine tikalen Suchen werden anders als die regulären Ergebnisse erhebliche Manipulationsmöglichkeit. Ein aktuelles Bei- präsentiert; oft wird direkt ein Ergebnis großflächig und spiel ist die Untersuchung des Effekts von Suchmaschinen- grafisch angezeigt (Bsp. Google Maps) oder eine Auswahl rankings auf das Verhalten bei politischen Wahlen. Hier von Ergebnissen mit einem Vorschaubild präsentiert (Bsp. wird Google eine erhebliche Einflussmöglichkeit zugespro- Google News). In dieser Präsentation bevorzugt die Web- chen, die sich analog auch auf externe, entsprechend opti- suchmaschine Ergebnisse seiner eigenen vertikalen Such- mierte Inhalte übertragen lässt (Epstein & Robertson, 2015). maschinen, auch wenn es für alle Bereiche auch alternative Angebote gibt. Diese werden jedoch in die organischen Suchergebnisse verbannt, wo sie weniger auffällig präsen- Warum brauchen wir mehr als eine tiert werden. Mit dem Aufbau eigener vertikaler Kollektio- nen hat sich die Rolle der Suchmaschinen als reinen Ver- Suchmaschine? mittlern zwischen Nutzern und Dokumenten gewandelt. Zum Problem wird die Bevorzugung eigener Angebote, Abgesehen von den bisher genannten, eher grundsätzli- wenn Nutzer nicht nur vor allem in der allgemeinen Web- chen Überlegungen gibt es auch pragmatische Gründe, die suche suchen, sondern auch nur eine einzige Suchmaschi- für mehr als eine Suchmaschine sprechen bzw. die es ange- ne verwenden. Dann werden Konkurrenten benachteiligt, zeigt erscheinen lassen, sich für eine Vielfalt auf dem Such- weil es für sie aufgrund von Entscheidungen des Such- maschinenmarkt stark zu machen. Dies sind insbesondere maschinenbetreibers auch bei bessere Qualität ihrer Pro- die folgenden sieben Gründe (vgl. (Lewandowski, 2015b, dukte nicht möglich ist, gleich oder gar besser als die such- S. 179 ff.): maschineneigenen Angebote auf den Suchergebnisseiten 1. Einholen einer „zweiten Meinung“: Ein Nutzer kann gelistet zu werden. durch die Nutzung einer zweiten (zusätzlichen) Such- Suchmaschinenoptimierung hat einen Einfluss auf die maschine zu ein und derselben Suchanfrage eine an- Suchergebnisse. dere Sicht auf die Inhalte des Web erhalten. Suchmaschinenoptimierung bezeichnet Maßnahmen, 2. Mehr bzw. zusätzliche Ergebnisse: Dadurch, dass kein die bestimmten Dokumenten bzw. Websites zu einer höhe- Suchmaschinenindex ein vollständiges Abbild des ren Sichtbarkeit in den Suchmaschinen verhelfen sollen. Es Web bietet, können sich mit einer Suchmaschine Do- geht also darum, Dokumente so zu gestalten, dass sie kon- kumente finden lassen, die in von einer anderen nicht form zu den Rankingalgorithmen der Suchmaschinen sind. gefunden werden können. Zwar mag ein Nutzer nur in Je nach Grad der Suchmaschinenoptimierung kann man seltenen Fällen vor dem Problem stehen, gar nichts zu von einer Hilfestellung für die Suchmaschinen, aber auch seiner Suchanfrage zu finden, jedoch kann es durch- von einer Manipulation der Suchergebnisse sprechen (Le- aus sinnvoll sein, mehr Ergebnisse zu der selben Such- wandowski, 2015b, S. 161 ff.). Zwar lassen sich mit Such- anfrage aufzurufen. maschinenoptimierung die Ergebnisse aller Suchmaschi- 3. Andere Ergebnisse: Die Ergebnisse verschiedener nen beeinflussen, ein besonderes Problem ergibt sich aber Suchmaschinen überschneiden sich auf den vorderen gerade durch die Fokussierung auf eine einzige Such- Trefferpositionen stark (vgl. (Spink, Jansen, Blakely, & maschine, d. h. wenn es durch Suchmaschinenoptimierung Koshman, 2006). Dies bedeutet, dass schon das ein- gelingt, bestimmten Inhalten eine besonders hohe Sicht- fache Eingeben der selben Suchanfrage bei einer an- barkeit zu verschaffen, dann gelingt dies praktisch für alle deren Suchmaschine zu anderen Ergebnissen führt, Suchmaschinennutzer. Gäbe es eine größere Vielfalt – auch auch wenn es natürlich auch Überschneidungen gibt. hinsichtlich der Nutzung – auf dem Suchmaschinenmarkt, 4. Bessere Ergebnisse: In Retrievaleffektivitätstests wären die Effekte der Suchmaschinenoptimierung weit ge- schneiden Suchmaschinen zwar unterschiedlich ab ringer. (auch wenn diese Unterschiede in der Regel geringer Bereitgestellt von | Hochschule für Angewandte Wissenschaften Hamburg Angemeldet Heruntergeladen am | 04.04.19 11:58
Dirk Lewandowski, Perspektiven eines Open Web Index 19 sind als erwartet, s. (Lewandowski, 2015a), dies bedeu- festzustellen, dass es Microsoft mit erheblichen finanziel- tet jedoch nicht, dass eine Suchmaschine bei jeder len Mitteln gelungen ist, seine Suchmaschine Bing zumin- Suchanfrage den anderen überlegen wäre. Vielmehr dest in den USA zu etablieren. Letztlich bedeutet dies aber zeigt sich, dass auch eine schlechter abschneidende nicht mehr, als dass eine weitere Suchmaschine zur Ver- Suchmaschine zu manchen Anfragen bessere Ergeb- fügung steht; an der fehlenden Vielfalt auf dem Such- nisse liefert. maschinenmarkt ändert dies wenig. 5. Andere Trefferpräsentation: Selbst Suchmaschinen, Eine andere Idee beruht auf der Annahme, dass das die auf einen Partnerindex zurückgreifen (wie etwa Problem gar nicht in dem Vorhandensein nur einer Such- Yahoo), können durch eine eigene Zusammenstellung maschine läge, sondern in der (un)fairen Ergebnisanzeige. und Präsentation der Suchergebnisse zu sinnvollen Die Lösung ist dann, Google zu einer fairen Ergebnisanzei- Alternativen werden. Dies verstärkt sich insbesondere ge zu verpflichten, indem alle Dokumente nach den selben bei neueren Darstellungsformen wie direkten Antwor- Regeln behandelt werden und damit jedes Dokument zu- ten, Universal Search und Knowledge Graph. mindest potentiell die selbe Chance hat, als Ergebnis zu 6. Andere Benutzerführung: Eng verbunden mit der Tref- einer Suchanfrage angezeigt zu werden. Problematisch an ferpräsentation ist die Benutzerführung. Die Gestal- dieser Forderung ist jedoch die Überprüfbarkeit ihrer Ein- tung des Suchinterface kann eine Suchmaschine zu haltung und auf der theoretischen Ebene die Frage nach einer lohnenden Alternative machen. der Eindeutigkeit von Ergebnissets, d. h. ob es überhaupt 7. Andere Suchmöglichkeiten: Suchmaschinen sind hin- ausreichend ist, nur eine Art der Ergebnisreihung zu ha- sichtlich ihrer Recherchemöglichkeiten beschränkt. ben, oder ob nicht gerade die Vielfalt von unterschiedli- Insbesondere die eingeschränkten (und teils nicht kor- chen Ergebnisreihungen durch unterschiedliche Such- rekt funktionierenden) Suchfunktionen von Google maschinen das Ziel sein sollte. wurden immer wieder bemängelt. Eine weitere Forderung, die wiederum von der Not- wendigkeit einer fairen Ergebnisanzeige ausgeht, zielt auf Es soll nicht verleugnet werden, dass die genannten Grün- die Zerschlagung von Google durch die Trennung von all- de jeweils nur auf einen kleinen Teil der Suchanfragen gemeiner Websuchmaschine und den anderen angebote- zutreffen. Allerdings mindert dies nicht ihre Bedeutung, nen Diensten. Dies würde insbesondere dem Problem der wenn man Suchmaschinen als ernsthafte Recherchewerk- Bevorzugung eigener Angebote begegnen. Es erscheint zeuge betrachtet. jedoch mehr als fraglich, ob sich dadurch tatsächlich die Marktsituation verändern würde. Ein immer wiederkehrender Vorschlag ist der Aufbau Lösungsvorschläge einer alternativen Suchmaschine. Mehrfach wurde gefor- dert, mit öffentlicher Hilfe eine Alternative zu Google Wie nun kann man nach dem Gesagten dafür sorgen, dass (oder allgemeiner: zu den großen kommerziellen Such- alternative Suchmaschinen etabliert werden und damit maschinen) aufzubauen. Zuletzt forderten Hege & Flecken Vielfalt auf dem Suchmaschinenmarkt hergestellt wird? (2014) den Aufbau einer öffentlich-rechtlichen Such- Der Schlüssel liegt m. E. darin, attraktive Angebote zu maschine und stellten deren Aufgabe in den Kontext des schaffen, die von den Nutzern angenommen werden. Wie öffentlich-rechtlichen Rundfunks. In vielen Fällen wurde solche Angebote der allgemeinen Websuche, aber auch mit der Notwendigkeit einer europäischen Alternative zu der Spezialsuche, genau aussehen, muss den Anbietern Google argumentiert; dies vor allem im ursprünglichen und den Nutzern überlassen werden. Im Folgenden wer- Vorschlag des Aufbaus der deutsch-französischen Such- den die Strategien zur Etablierung weiterer Anbieter auf maschine Quaero. Zu dem gemeinsamen Projekt kam es dem Suchmaschinenmarkt erörtert. allerdings nie, weil sich die deutsche und die französische Zunächst einmal gibt es die Hoffnung, dass sich der Seite nicht über einen gemeinsamen Weg verständigen Markt selbst regulieren wird. Hierbei wird davon aus- konnten. Stattdessen wurde in den beiden Ländern je- gegangen, dass die aktuelle (und bereits seit vielen Jahren) weils ein einzelnes Projekt (Quaero bzw. in Deutschland bestehende Situation durch den Eintritt neuer Anbieter Theseus) verfolgt; beide Projekte hatten dann allerdings verändert werden kann. Auf der Basis dieser Annahme nicht mehr den Aufbau einer alternativen Suchmaschine stellt sich dann nur noch die Frage, wie schwierig es für zum Ziel. einen neuen Anbieter ist, sich auf dem Markt zu etablieren Aus grundlegenden Überlegungen ist der Aufbau ei- und inwieweit er von einem Monopolanbieter daran gehin- ner alternativen Suchmaschine abzulehnen: Zuerst einmal dert wird (vgl. Monopolkommission 2015). Es ist positiv würde eine weitere Suchmaschine den Suchmaschinen- Bereitgestellt von | Hochschule für Angewandte Wissenschaften Hamburg Angemeldet Heruntergeladen am | 04.04.19 11:58
20 Dirk Lewandowski, Perspektiven eines Open Web Index Abbildung 2: Entkoppelung von Infrastruktur und Diensten (auf Basis des grundlegenden Aufbaus von Suchmaschinen aus Risvik & Michelsen, 2002). markt nicht grundlegend verändern, auch wenn sie nen- maschinen (Risvik & Michelsen, 2002) dargestellt. Eine nenswerte Marktanteile erreichen würde. Es ergibt nur Suchmaschine besteht aus den Komponenten Crawler, Lo- einen geringen Unterschied, ob die Auswahl zwischen cal Store, Indexer und Searcher. Der Crawler erfasst die zwei oder drei (oder einer Handvoll) Suchmaschinen be- Dokumente des Web mittels Verfolgen von Links und spei- steht. Des Weiteren kann auch eine hochwertige Such- chert die gefundenen Dokumente im Local Store ab, der im maschine an Gründen scheitern, die der Suche nicht inhä- Idealfall eine vollständige und aktuelle Kopie des Web ist. rent sind, beispielsweise an Fragen des Marketings. Ein Der Indexer bereitet die Dokumente so auf, dass auf der solches Scheitern würde allerdings bedeuten, dass die einen Seite aussagekräftige Repräsentationen der Doku- dafür nötigen enormen Investitionen verloren wären. mente entstehen (vgl. (Lewandowski, 2015b), S. 48 ff.), auf Stärker in Richtung einer Vielfalt auf dem Such- der anderen Seite die Dokumente effizient durchsuchbar maschinenmarkt geht der Vorschlag, Google zur Öffnung werden. Der Searcher schließlich sorgt für den Abgleich seines Index zu zwingen. Die Idee hier ist, Konkurrenten zwischen Suchanfragen und Dokumenten und bringt die den Zugriff auf den Datenbestand der Google-Suchmaschi- gefundenen Ergebnisse in eine Reihenfolge (Ranking). ne zu gewähren, damit diese eigene Suchdienste aufbauen Die Entkoppelung bedeutet nun, die Bereitstellung können. Zugrunde liegt die Erkenntnis, dass eine wesentli- des Index (also das Crawling und eine grundlegende Auf- che Hürde für den Aufbau einer neuen Suchmaschine bereitung der Dokumente) als öffentliche Aufgabe zu be- gerade im Aufbau und der Pflege des Index besteht. Heuti- trachten, analog zu anderen Infrastrukturaufgaben des ge Partnermodelle (s. o.) erlauben nur einen beschränkten Staates wie den Bau eines umfassenden Straßennetzes. Zugriff auf Top-Ergebnisse der Suchmaschinen (im Gegen- Die auf diesem Index aufbauenden Dienste werden dann satz zu einem vollständigen Zugriff auf den Index) und in Eigeninitiative betrieben, gleich ob von Unternehmen, deren Anzeige (im Gegensatz zu einer umfassenden Wei- öffentlichen Einrichtungen oder Hobbyentwicklern. Die terverarbeitung). Betreiber der Dienste erhalten Zugang zur Infrastruktur Schließlich gibt es noch den Vorschlag des Aufbaus und sind weder darauf angewiesen, selbst eine Infrastruk- eines Web-Index als Infrastrukturmaßnahme (Lewan- tur aufzubauen noch sich auf den Zugang zu anderen pri- dowski, 2014a). Die Kernidee hierbei ist die Entkoppelung vatwirtschaftlichen Infrastrukturen zu verlassen. von Index und Diensten. Es geht also darum, eine von allen nutzbare Datenbasis zu schaffen, auf der dann eine Vielzahl unterschiedlicher Dienste aufgebaut werden kön- nen. Während die Suche im Web und in Teilen des Web Die Initiative „Open Web Index eine Kernanwendung eines solchen Index ist, ist sie kei- (OWI)“ neswegs auf Suchanwendungen beschränkt. Vielmehr können alle Dienste, die in irgendeiner Weise auf Web- Zur Verbreitung der Idee des Open Web Index hat sich die daten aufbauen, von einem solchen Index profitieren, also „Open Web Index Initiative“ gebildet. Diese besteht aus bspw. auch Dienste zur Analyse der Struktur des Web. Experten aus Wissenschaft und Industrie. Von Beginn an Die Entkoppelung von Index und Diensten ist in Ab- war klar, dass sich die Idee des Open Web Index nur durch- bildung 2 anhand des grundlegenden Aufbaus von Such- setzen lässt, wenn auch die Industrie beteiligt ist. Die Schaf- Bereitgestellt von | Hochschule für Angewandte Wissenschaften Hamburg Angemeldet Heruntergeladen am | 04.04.19 11:58
Dirk Lewandowski, Perspektiven eines Open Web Index 21 B. Stark, D. Dörr, & S. Aufenanger (Eds.), Die Googleisierung der fung eines offenen Web-Index erfordert erhebliche finan- Informationssuche (pp. 224–244). Berlin: De Gruyter. zielle Mittel, so dass die Sinnhaftigkeit des Vorhabens nicht Lewandowski, D. (2014a). Why we need an independent index of the nur durch die Wissenschaft und öffentliche Einrichtungen Web. In R. König & M. Rasch (Eds.), Society of the Query Reader: dargestellt werden kann, sondern auch durch die Industrie Reflections on Web Search (pp. 49–58). Information Retrieval; in den geschäftlichen Potentialen von Diensten, die auf Digital Libraries, Amsterdam: Institute of Network Culture. Lewandowski, D. (2014b). Wie lässt sich die Zufriedenheit der Such- einem solchen Index aufbauen. Die Initiative besteht seit maschinennutzer mit ihren Suchergebnissen erklären? In 2014; Sprecher sind Wolfgang Sander-Beuermann (SuMa H. Krah & R. Müller-Terpitz (Eds.), Suchmaschinen (Passauer e. V.) und Dirk Lewandowski (HAW Hamburg). Das Ziel der Schriften zur interdisziplinären Medienforschung, Band 4) Initiative ist es zunächst, Aufmerksamkeit für die Idee des (pp. 35–52). Münster: LIT. Open Web Index zu schaffen und die Überlegenheit der Lewandowski, D. (2015a). Evaluating the retrieval effectiveness of Idee gegenüber anderen Ansätzen darzustellen. Allerdings Web search engines using a representative query sample. Jour- nal of the Association of Information Science and Technology, arbeitet die Gruppe auch an Lösungen für grundsätzliche 66(9), 1763–1775. http://doi.org/10.1002/asi.23304. technische Fragen, die sich durch den Aufbau und die Lewandowski, D. (2015b). Suchmaschinen verstehen. Berlin Heidel- Bereitstellung eines solchen Index ergeben. Während viele berg: Springer Vieweg. der aktuellen Arbeiten eher im Hintergrund ablaufen, fin- Quirmbach, S. (2009). Universal Search – Kontextuelle Einbindung den sich bereits veröffentlichte Informationen auf der Web- von unterschiedlicher Quellen und Auswirkungen auf das User Interface. In D. Lewandowski (Ed.), Handbuch Internet-Such- site www.openwebindex.eu. Dort wird auch über den wei- maschinen (pp. 220–248). Heidelberg: Akademische Verlags- teren Fortschritt der Arbeiten berichtet. gesellschaft Aka GmbH. Risvik, K. M., & Michelsen, R. (2002). Search engines and web dyna- mics. Computer Networks, 39(3), 289–302. Fazit Spink, A., Jansen, B. J., Blakely, C., & Koshman, S. (2006). A study of results overlap and uniqueness among major web search engi- nes. Information Processing & Management, 42(5), 1379–1391. Zunächst einmal ist positiv, dass das „Problem Google“ endlich erkannt wurde. Nun wird über mögliche Lösungen diskutiert. Dabei ist m. E. eine konstruktive Lösung einer Prof. Dr. Dirk Lewandowski destruktiven vorzuziehen. Der Aufbau eines offenen Web- Hochschule für Angewandte Wissenschaften Index – und damit die Trennung von öffentlich finanzier- Hamburg ter Infrastruktur und privatwirtschaftlich betriebenen Fakultät für Design, Medien und Information Diensten – sorgt für mehr Vielfalt auf dem Suchmaschi- Department Information nenmarkt und darüber hinaus. Frei zugängliches Wissen Finkenau 35 22081 Hamburg ist die Quelle von kontinuierlichem Wettbewerb, Innovati- dirk.lewandowski@haw-hamburg.de on und Unternehmertum auf der einen und persönlicher www.bui.haw-hamburg.de und Meinungsfreiheit auf der anderen Seite. Der Open Web Index schafft dafür die Voraussetzung. Er kann mit Prof. Dr. Dirk Lewandowski ist Professor für Information Research & anderen Infrastrukturaufgaben des Staates verglichen Information Retrieval an der Hochschule für Angewandte Wissen- werden – in Bezug auf die Sammlung und Verfügbarma- schaften Hamburg. Zuvor war er unabhängiger Berater im Themen- chung von Wissen ist vor allem der Vergleich mit den bereich Suchmaschinen und Information Retrieval sowie Lehrbeauf- Bibliotheken zu ziehen. tragter an der Universität Düsseldorf. Seine Forschungsinteressen sind Web Information Retrieval, Qualitätsfaktoren von Suchmaschi- nen, das Rechercheverhalten der Suchmaschinen-Nutzer sowie die gesellschaftlichen Auswirkungen des Umgangs mit den Web-Such- Literatur maschinen. Zu seinen Veröffentlichen gehören neben den Büchern „Web Information Retrieval“ und „Handbuch Internet-Suchmaschi- Broder, A. (2002). A taxonomy of web search. ACM Sigir Forum, 36(2), nen“ zahlreiche Aufsätze, die in deutschen und internationalen Fach- 3–10. publikationen veröffentlicht wurden. Sein neuestes Werk „Such- Epstein, R., & Robertson, R. E. (2015). The search engine manipulation maschinen verstehen“ ist im Februar 2015 erschienen. Dirk effect (SEME) and its possible impact on the outcomes of electi- Lewandowski ist Editor in-Chief des Aslib Journal of Information Ma- ons. Proceedings of the National Academy of Sciences, 2015, nagement (früher: Aslib Proceedings) und Associate Editor der Online 201419828. http://doi.org/10.1073/pnas.1419828112. Information Review. Frees, V. B. (2015). Internetnutzung: Frequenz und Vielfalt nehmen in allen Altersgruppen zu. Media Perspektiven, (10), 366–377. Hege, H., & Flecken, E. (2014). Debattenbeitrag: Gibt es ein öffent- liches Interesse an einer alternativen Suchmaschine? In Bereitgestellt von | Hochschule für Angewandte Wissenschaften Hamburg Angemeldet Heruntergeladen am | 04.04.19 11:58
Sie können auch lesen