Perspektiven eines Open Web Index - Dirk Lewandowski* - Search Studies

Die Seite wird erstellt Nicklas Schuler
 
WEITER LESEN
Perspektiven eines Open Web Index - Dirk Lewandowski* - Search Studies
Information. Wissenschaft & Praxis 2016; 67(1): 15–21

DGI-Forum Wittenberg 2015

Dirk Lewandowski*

Perspektiven eines Open Web Index
DOI 10.1515/iwp-2016-0020                                          Cette situation n’est pas jugée souhaitable et des discussi-
                                                                   ons ont été entamées autour de solutions possibles. L’arti-
Zusammenfassung: Der Suchmaschinenmarkt wird seit                  cle examine les différentes approches et se focalise sur
vielen Jahren von nur einer einzigen Suchmaschine, Goo-            l’idée d’un index du Web ouvert (OWI), qui devrait être
gle, dominiert. Es wurde mittlerweile erkannt, dass diese          accessible comme infrastructure publique. L’idée princi-
Situation nicht wünschenswert ist. Wir sprechen nun über           pale est la séparation des données (index) et des services
mögliche Lösungen. Der Artikel diskutiert unterschiedliche         qui s’y greffent et qui peuvent fonctionner en grand nom-
Lösungsansätze und fokussiert dabei auf die Idee einen             bre sur base d’initiatives privées. Le but est donc de créer
Offenen Web-Index (OWI), der als öffentliche Infrastruktur         une base pour la diversité.
verfügbar gemacht werden soll. Die Grundidee ist die Tren-
                                                                   Descripteurs: moteur de recherche, index, concept, con-
nung von Datenbestand (Index) und darauf aufsetzenden
                                                                   currence
Diensten, welche in großer Zahl in privater Initiative betrie-
ben werden können. Es geht also darum, die Basis für
Vielfalt zu schaffen.                                              Einleitung
Deskriptoren: Suchmaschine, Index, Konzept, Wett-
                                                                   Seit vielen Jahren ist die Situation auf dem Suchmaschi-
bewerb
                                                                   nenmarkt fast unverändert: Google hält in Europa einen
                                                                   Marktanteil von mehr als 90 Prozent; Veränderungen sind
The idea of an Open Web Index
                                                                   nicht in Sicht. Auf dem US-amerikanischen Markt konnte
Abstract: The European search engine market has been               sich mit Bing zumindest eine zweite Suchmaschine etab-
dominated by one single search engine, namely Google, for          lieren. Andere (vermeintliche) Suchmaschinen bestehen
many years. Most commentators agree that this situation is         vor allem aus Suchinterfaces, die Ergebnisse einer dieser
undesirable, and a discussion has started on ways to solve         beiden Suchmaschinen anzeigen.
this problem. This article discusses different approaches,              So sehr eine Alternative zu Google zu begrüßen ist, so
and then focuses on the idea of building an Open Web Index         wird doch schnell klar, dass es im Hinblick auf die Vielfalt
(OWI). This index should be provided in the form of a public       der Meinungen oder eben Suchergebnisse bei weitem nicht
infrastructure. The core idea here is to unlink the data           ausreichend ist, eine oder einige weitere Suchmaschinen
underlying a search engine (the index) and the (search)            zu etablieren. Vielmehr ist nach Wegen zu suchen, wie es
services themselves. Many such services could be built on          gelingen kann, die Basis für eine Vielzahl weiterer, auch
the basis of one index. Therefore, an Open Web Index would         spezialisierter, Suchdienste zu schaffen, um weg von nur
provide the basis for diversity on the search engine market.       einer von vielen möglichen Interpretationen der Inhalte des
                                                                   Web hin zu einer Vielzahl von Interpretationen zu kommen,
Descriptors: Search engine, Index, Project schema, Com-
                                                                   die letztlich den Nutzern dient. Wir befinden uns heute in
petition
                                                                   einer Situation, in der ein Nutzer ernsthaft nur zwischen
                                                                   zwei Interpretationen der wählen kann – und Beschränkun-
Les perspectives d’un index du Web ouvert
                                                                   gen der Suchmaschinen sorgen dafür, dass die Interpretati-
Résumé: Le marché des moteurs de recherche est dominé              onsleistung der genutzten Suchmaschine nicht ausgehe-
depuis de nombreuses années par un seul outil, Google.             belt werden kann: Auch wenn die Suchmaschine häufig
                                                                   angibt, einige Millionen Treffer zu einer Suchanfrage gefun-
                                                                   den zu haben, so werden doch immer nur maximal 1.000
*Kontaktperson: Prof. Dr. Dirk Lewandowski, Hochschule für Ange-
                                                                   Treffer ausgegeben; weitere Ergebnisse lassen sich nicht
wandte Wissenschaften Hamburg, Fakultät für Design, Medien und
Information, Department Information, Finkenau 35, 22081 Hamburg,
                                                                   abrufen. Hier wird das Ranking zum Filter: Während im
E ˗ Mail: dirk.lewandowski@haw-hamburg.de,                         Ranking Ergebnisse nur in einer bestimmten Reihenfolge
www.bui.haw-hamburg.de                                             dargestellt werden und sich prinzipiell alle Ergebnisse auf-

                                                         Bereitgestellt von | Hochschule für Angewandte Wissenschaften Hamburg
                                                                                                                      Angemeldet
                                                                                              Heruntergeladen am | 04.04.19 11:58
Perspektiven eines Open Web Index - Dirk Lewandowski* - Search Studies
16         Dirk Lewandowski, Perspektiven eines Open Web Index

rufen lassen, sorgt ein Filter dafür, dass nur ein Teil der      rend andere Suchmaschinen keinen eigenen Datenbestand
Ergebnisse überhaupt angesehen werden kann.                      anbieten, sondern auf den Datenbestand einer dieser bei-
     In diesem Artikel werden die mit der Dominanz von           den Suchmaschinen zurückgreifen.1 Das Partnerindex-Mo-
Google verbundenen Probleme beschrieben und Lösungs-             dell hat so zu einer Ausdünnung des Suchmaschinen-
ansätze diskutiert. Dabei wird insbesondere auf den vom          markts beigetragen.
Autor vorgeschlagenen Ansatz der Schaffung eines Offe-                Dieser Blick auf den Suchmaschinenmarkt zeigt, dass
nen Web Index (Open Web Index; OWI) eingegangen.                 es nur vermeintlich eine Vielfalt gibt, die sich tatsächlich
     Die folgenden Abschnitte sind wie folgt gegliedert: Zu-     auf nur zwei Suchmaschinen reduziert. Weltweit existieren
nächst wird die Bedeutung der Suchmaschinen beschrie-            noch zwei weitere bedeutende Indexe, nämlich die von
ben und auf die Situation auf dem Suchmaschinenmarkt             Yandex (Russland) und Baidu (China). Weitere Indexe von
eingegangen. Aus dieser Situation heraus ergibt sich „das        neueren Suchmaschinen wie Duck Duck Go erreichen bei
Problem Google“, welches im Folgenden in seinen unter-           weitem nicht die für den Betrieb einer „echten“ weltweiten
schiedlichen Bereichen beschrieben wird. Anschließend            Suchmaschine notwendige Größe. Betrachtet man in die-
werden Lösungsvorschläge zur Schaffung von Alternativen          ser Weise die Entwicklung des Suchmaschinenmarkts
zu Google vorgestellt und diskutiert. Dann wird auf die          nicht in Bezug auf die Dienste (Suchmaschinen), sondern
Initiative für einen „Open Web Index (OWI)“ eingegangen,         in Bezug auf die Indexe, so findet sich eher eine rückläu-
in der sich Wissenschaftler und Suchmaschinenpraktiker           fige Tendenz. Seit 2009 wurden mehrere Indexe einge-
aus unterschiedlichen Bereichen gesammelt haben, um              stellt; zu nennen sind hier Yahoo, Ask.com und Cuil.
einen Offenen Web-Index als Infrastrukturmaßnahme vo-                 Neben den genannten Suchmaschinen/Indexen wer-
ranzubringen. Der Artikel schließt mit einem Fazit.              den immer wieder die Initiativen CommonCrawl und Inter-
                                                                 net Archive als Alternativen genannt. CommonCrawl stellt
                                                                 einen (kleineren) Index zur allgemeinen Nutzung zur Ver-
                                                                 fügung. Dieser Index ist jedoch statisch und eignet sich
Die Bedeutung der Suchmaschinen                                  damit nicht zum Aufbau von Suchmaschinen, sondern nur
und der Suchmaschinenmarkt                                       für Analysezwecke. Der Index des Internet Archive speist
                                                                 vor allem die Wayback Machine, mit der sich alte Versio-
Suchmaschinen sind der Zugang zu den Informationen im            nen von Dokumenten im Web aufrufen lassen. Es gibt
Web; andere Ansätze zur Erschließung dieser Inhalte ha-          keine Schnittstelle, um auf diesem Index andere Dienste
ben hinsichtlich der Nutzung nur eine nachgeordnete Be-          aufzubauen. Dazu kommt, dass man auch hier nicht von
deutung. Suchmaschinen sind noch vor E-Mail der belieb-          einem vollständigen Index des Web – soweit dies möglich
teste Dienst des Internet (Frees, 2015). Dem gegenüber           ist – sprechen kann.
steht die seit Jahren unveränderte Tatsache, dass im Grun-
de nur eine einzige Suchmaschine, nämlich Google, ge-
nutzt wird. Sie erreicht in Deutschland wie auch in den          Das „Problem Google“
meisten anderen europäischen Ländern einen Marktanteil
von über 90 Prozent. Dazu kommen Marktanteile, die               Als das „Problem Google“ soll im Folgenden das Bündel an
durch Partnerschaften auf dem Suchmaschinenmarkt ge-             Problemen, das sich aus der Dominanz nur einer einzigen
wonnen werden: Im sog. Partnerindex-Modell greift ein            Suchmaschine ergibt, beschrieben werden. Dabei geht es
Suchportal auf die Ergebnisse einer anderen Suchmaschi-          weniger um Google als Unternehmen als um eine Situation,
ne zurück. Dieses Modell ist für beide Seiten attraktiv: Der     die sich ergibt, wenn ein einziger Anbieter den Zugang zu
gebenden Suchmaschine entstehen durch die zusätzlichen           den Inhalten des Web bestimmt. Allerdings soll auch nicht
Transaktionen kaum Kosten, weil der Hauptteil der Kosten         verleugnet werden, dass diese Probleme durch Googles
in Aufbau und Pflege der Suchmaschine liegt, nicht in der        praktisches Handeln verstärkt werden; auf diesen Sachver-
Verarbeitung der Suchanfragen. Die nehmende Such-                halt wird an geeigneter Stelle hingewiesen. Die hier be-
maschine spart die Kosten für den Betrieb einer eigenen          schriebenen Probleme beziehen sich auf die Qualität der
Suchmaschine. Die Kooperationspartner teilen sich die Er-        Suchergebnisse; weitere Probleme wie beispielsweise die
löse, die mittels der zusätzlich zu den Suchergebnissen
ausgespielten Werbetreffern erzielt werden. Der Überblick
der auf dem deutschen Suchmaschinenmarkt bestehenden             1 Die Metasuchmaschine Metager bildet hier eine Ausnahme: Sie
Partnerschaften (Abb. 1) zeigt, dass nur Google und Bing         greift u. a. auch auf die originären Datenbestände von Yandex und
als gebende Suchmaschinen eine Bedeutung haben, wäh-             Exalead zurück.

                                                    Bereitgestellt von | Hochschule für Angewandte Wissenschaften Hamburg
                                                                                                                 Angemeldet
                                                                                         Heruntergeladen am | 04.04.19 11:58
Dirk Lewandowski, Perspektiven eines Open Web Index           17

Abbildung 1: Partnerschaften auf dem deutschen Suchmaschinenmarkt (Lewandowski, 2015b, S. 158).

Dominanz bei der Online-Werbung bleiben hier aus-                   wird bei jeder navigationsorientierten Suchanfrage, die
geklammert.                                                         richtig beantwortet wird (die gewünschte Website steht an
     Das „Problem Google“ lässt sich in drei Bereiche un-           erster Stelle im Ranking), ein Erfolgserlebnis haben und
terteilen:                                                          die korrekte Beantwortung der Anfrage der benutzten
Jede Suchmaschine bietet ihre eigene, und nur eine,                 Suchmaschine zuschreiben. Dies gilt ebenso für triviale
Interpretation der Inhalte des Web.                                 informationsorientierte Suchanfragen, bei denen das Ziel
     Nur für einen Teil der Suchanfragen lassen sich ein-           nur ein einziges Dokument ist, um sich oberflächlich zu
deutig richtige oder falsche Ergebnisse unterscheiden.              informieren oder eine Faktenaussage zu prüfen. Es ist an-
Nach Andrei Broder (2002) lassen sich Suchanfragen im               zunehmen, dass sich aus der häufigen positiven Beurtei-
Web nach den dahinter stehenden Intentionen in drei                 lung des Sucherfolgs in eindeutigen bzw. einfachen Fällen
Typen einteilen: informationsorientiert, navigationsorien-          eine Übertragung auf andere, auch schwierigere Fälle von
tiert und transaktionsorientiert. Das Ziel informationsori-         informationsorientierten Suchanfragen ergibt (Lewan-
entierter Suchanfragen sind Informationen zu einem The-             dowski, 2014b), d. h. Nutzer bewerten die Ergebnisse ihrer
ma und damit in der Regel mehrere Dokumente. Ein                    bevorzugten Suchmaschine positiv, auch wenn andere
Nutzer möchte sich ein Bild von einem Thema machen und              Suchmaschinen evtl. relevantere Ergebnisse (oder andere,
entscheidet selbst, wann seine Suche beendet ist. Im Ge-            jedoch ebenso relevante Ergebnisse) liefern würden.
gensatz dazu hat eine navigationsorientierte Suchanfrage                 Wenn es nun bei informationsorientierten Suchanfra-
das Ziel, genau eine entweder bereits bekannte oder zu-             gen keine klare Unterscheidung zwischen richtig und
mindest vermutete Website (wieder) zu finden. In diesem             falsch gibt, so ergibt sich ein Interpretationsspielraum.
Fall gibt es genau ein richtiges Ergebnis. Mit einer trans-         Diese Interpretation erfolgt algorithmisch, d. h. die Bewer-
aktionsorientierten Suchanfrage möchte ein Nutzer eine              tung der Dokumente erfolgt maschinell auf der Basis von
Website finden, auf der dann die Transaktion (bspw. On-             menschlichen Annahmen, die in die verwendeten Algo-
line-Banking, der Kauf eines Produkts oder das Spielen              rithmen eingehen. Jede Suchmaschine bietet damit eine
eines Spiels im Browser) durchgeführt werden kann.                  eigene algorithmische Interpretation der Web-Inhalte.
     Mit dem Modell von Broder lässt sich auch die Zufrie-          Jede Suchmaschine, die selbst Inhalte oder Spezial-
denheit der Nutzer mit den Ergebnissen der von ihnen                suchmaschinen anbietet, gerät in einen Interessens-
bevorzugten Suchmaschine erklären: Navigationsorien-                konflikt, wenn diese Inhalte in der allgemeinen Suche
tierte Anfragen machen einen erheblichen Anteil an der              angezeigt werden.
Gesamtmenge der Suchanfragen aus und ihr Ergebnis lässt                  Suchmaschinenbetreiber haben bereits vor vielen Jah-
sich klar nach richtig und falsch unterscheiden. Ein Nutzer         ren damit begonnen, Spezialsuchmaschinen für bestimmte

                                                         Bereitgestellt von | Hochschule für Angewandte Wissenschaften Hamburg
                                                                                                                      Angemeldet
                                                                                              Heruntergeladen am | 04.04.19 11:58
18         Dirk Lewandowski, Perspektiven eines Open Web Index

Themen und bestimmte Bereiche des Web aufzubauen                      Suchmaschinenoptimierung ist mittlerweile eine etab-
(sog. vertikale Suchen). Da Nutzer allerdings ihre Such-         lierte Praxis im kommerziellen Bereich. Allerdings sollte
anfragen weiterhin vor allem in der allgemeinen Websuche         nicht vergessen werden, dass Suchmaschinenoptimierung
eingaben und sich vor dem Abschicken einer Suchanfrage           auch für informative Inhalte erfolgt. Vorangegangen sind
kaum Gedanken über die Auswahl eines geeigneten Such-            hier die Zeitungsverlage, die ihre Online-Nachrichtenange-
raums machten, führten die Suchmaschinen Ergebnisse              bote optimiert haben. Zunehmend werden aber auch Inhal-
aus unterschiedlichen vertikalen Suchen im Rahmen der            te zum Zweck der PR oder sogar im akademischen Bereich
sog. Universal Search auf einer Suchergebnisseite zusam-         optimiert. Im Zusammenhang mit der Verwendung von nur
men (vgl. Quirmbach, 2009). Ergebnisse aus diesen ver-           einer Suchmaschine durch die Nutzer ergibt sich hier eine
tikalen Suchen werden anders als die regulären Ergebnisse        erhebliche Manipulationsmöglichkeit. Ein aktuelles Bei-
präsentiert; oft wird direkt ein Ergebnis großflächig und        spiel ist die Untersuchung des Effekts von Suchmaschinen-
grafisch angezeigt (Bsp. Google Maps) oder eine Auswahl          rankings auf das Verhalten bei politischen Wahlen. Hier
von Ergebnissen mit einem Vorschaubild präsentiert (Bsp.         wird Google eine erhebliche Einflussmöglichkeit zugespro-
Google News). In dieser Präsentation bevorzugt die Web-          chen, die sich analog auch auf externe, entsprechend opti-
suchmaschine Ergebnisse seiner eigenen vertikalen Such-          mierte Inhalte übertragen lässt (Epstein & Robertson, 2015).
maschinen, auch wenn es für alle Bereiche auch alternative
Angebote gibt. Diese werden jedoch in die organischen
Suchergebnisse verbannt, wo sie weniger auffällig präsen-
                                                                 Warum brauchen wir mehr als eine
tiert werden. Mit dem Aufbau eigener vertikaler Kollektio-
nen hat sich die Rolle der Suchmaschinen als reinen Ver-         Suchmaschine?
mittlern zwischen Nutzern und Dokumenten gewandelt.
Zum Problem wird die Bevorzugung eigener Angebote,               Abgesehen von den bisher genannten, eher grundsätzli-
wenn Nutzer nicht nur vor allem in der allgemeinen Web-          chen Überlegungen gibt es auch pragmatische Gründe, die
suche suchen, sondern auch nur eine einzige Suchmaschi-          für mehr als eine Suchmaschine sprechen bzw. die es ange-
ne verwenden. Dann werden Konkurrenten benachteiligt,            zeigt erscheinen lassen, sich für eine Vielfalt auf dem Such-
weil es für sie aufgrund von Entscheidungen des Such-            maschinenmarkt stark zu machen. Dies sind insbesondere
maschinenbetreibers auch bei bessere Qualität ihrer Pro-         die folgenden sieben Gründe (vgl. (Lewandowski, 2015b,
dukte nicht möglich ist, gleich oder gar besser als die such-    S. 179 ff.):
maschineneigenen Angebote auf den Suchergebnisseiten             1. Einholen einer „zweiten Meinung“: Ein Nutzer kann
gelistet zu werden.                                                   durch die Nutzung einer zweiten (zusätzlichen) Such-
Suchmaschinenoptimierung hat einen Einfluss auf die                   maschine zu ein und derselben Suchanfrage eine an-
Suchergebnisse.                                                       dere Sicht auf die Inhalte des Web erhalten.
     Suchmaschinenoptimierung bezeichnet Maßnahmen,              2. Mehr bzw. zusätzliche Ergebnisse: Dadurch, dass kein
die bestimmten Dokumenten bzw. Websites zu einer höhe-                Suchmaschinenindex ein vollständiges Abbild des
ren Sichtbarkeit in den Suchmaschinen verhelfen sollen. Es            Web bietet, können sich mit einer Suchmaschine Do-
geht also darum, Dokumente so zu gestalten, dass sie kon-             kumente finden lassen, die in von einer anderen nicht
form zu den Rankingalgorithmen der Suchmaschinen sind.                gefunden werden können. Zwar mag ein Nutzer nur in
Je nach Grad der Suchmaschinenoptimierung kann man                    seltenen Fällen vor dem Problem stehen, gar nichts zu
von einer Hilfestellung für die Suchmaschinen, aber auch              seiner Suchanfrage zu finden, jedoch kann es durch-
von einer Manipulation der Suchergebnisse sprechen (Le-               aus sinnvoll sein, mehr Ergebnisse zu der selben Such-
wandowski, 2015b, S. 161 ff.). Zwar lassen sich mit Such-             anfrage aufzurufen.
maschinenoptimierung die Ergebnisse aller Suchmaschi-            3. Andere Ergebnisse: Die Ergebnisse verschiedener
nen beeinflussen, ein besonderes Problem ergibt sich aber             Suchmaschinen überschneiden sich auf den vorderen
gerade durch die Fokussierung auf eine einzige Such-                  Trefferpositionen stark (vgl. (Spink, Jansen, Blakely, &
maschine, d. h. wenn es durch Suchmaschinenoptimierung                Koshman, 2006). Dies bedeutet, dass schon das ein-
gelingt, bestimmten Inhalten eine besonders hohe Sicht-               fache Eingeben der selben Suchanfrage bei einer an-
barkeit zu verschaffen, dann gelingt dies praktisch für alle          deren Suchmaschine zu anderen Ergebnissen führt,
Suchmaschinennutzer. Gäbe es eine größere Vielfalt – auch             auch wenn es natürlich auch Überschneidungen gibt.
hinsichtlich der Nutzung – auf dem Suchmaschinenmarkt,           4. Bessere Ergebnisse: In Retrievaleffektivitätstests
wären die Effekte der Suchmaschinenoptimierung weit ge-               schneiden Suchmaschinen zwar unterschiedlich ab
ringer.                                                               (auch wenn diese Unterschiede in der Regel geringer

                                                    Bereitgestellt von | Hochschule für Angewandte Wissenschaften Hamburg
                                                                                                                 Angemeldet
                                                                                         Heruntergeladen am | 04.04.19 11:58
Dirk Lewandowski, Perspektiven eines Open Web Index           19

     sind als erwartet, s. (Lewandowski, 2015a), dies bedeu-   festzustellen, dass es Microsoft mit erheblichen finanziel-
     tet jedoch nicht, dass eine Suchmaschine bei jeder        len Mitteln gelungen ist, seine Suchmaschine Bing zumin-
     Suchanfrage den anderen überlegen wäre. Vielmehr          dest in den USA zu etablieren. Letztlich bedeutet dies aber
     zeigt sich, dass auch eine schlechter abschneidende       nicht mehr, als dass eine weitere Suchmaschine zur Ver-
     Suchmaschine zu manchen Anfragen bessere Ergeb-           fügung steht; an der fehlenden Vielfalt auf dem Such-
     nisse liefert.                                            maschinenmarkt ändert dies wenig.
5.   Andere Trefferpräsentation: Selbst Suchmaschinen,              Eine andere Idee beruht auf der Annahme, dass das
     die auf einen Partnerindex zurückgreifen (wie etwa        Problem gar nicht in dem Vorhandensein nur einer Such-
     Yahoo), können durch eine eigene Zusammenstellung         maschine läge, sondern in der (un)fairen Ergebnisanzeige.
     und Präsentation der Suchergebnisse zu sinnvollen         Die Lösung ist dann, Google zu einer fairen Ergebnisanzei-
     Alternativen werden. Dies verstärkt sich insbesondere     ge zu verpflichten, indem alle Dokumente nach den selben
     bei neueren Darstellungsformen wie direkten Antwor-       Regeln behandelt werden und damit jedes Dokument zu-
     ten, Universal Search und Knowledge Graph.                mindest potentiell die selbe Chance hat, als Ergebnis zu
6.   Andere Benutzerführung: Eng verbunden mit der Tref-       einer Suchanfrage angezeigt zu werden. Problematisch an
     ferpräsentation ist die Benutzerführung. Die Gestal-      dieser Forderung ist jedoch die Überprüfbarkeit ihrer Ein-
     tung des Suchinterface kann eine Suchmaschine zu          haltung und auf der theoretischen Ebene die Frage nach
     einer lohnenden Alternative machen.                       der Eindeutigkeit von Ergebnissets, d. h. ob es überhaupt
7.   Andere Suchmöglichkeiten: Suchmaschinen sind hin-         ausreichend ist, nur eine Art der Ergebnisreihung zu ha-
     sichtlich ihrer Recherchemöglichkeiten beschränkt.        ben, oder ob nicht gerade die Vielfalt von unterschiedli-
     Insbesondere die eingeschränkten (und teils nicht kor-    chen Ergebnisreihungen durch unterschiedliche Such-
     rekt funktionierenden) Suchfunktionen von Google          maschinen das Ziel sein sollte.
     wurden immer wieder bemängelt.                                 Eine weitere Forderung, die wiederum von der Not-
                                                               wendigkeit einer fairen Ergebnisanzeige ausgeht, zielt auf
Es soll nicht verleugnet werden, dass die genannten Grün-      die Zerschlagung von Google durch die Trennung von all-
de jeweils nur auf einen kleinen Teil der Suchanfragen         gemeiner Websuchmaschine und den anderen angebote-
zutreffen. Allerdings mindert dies nicht ihre Bedeutung,       nen Diensten. Dies würde insbesondere dem Problem der
wenn man Suchmaschinen als ernsthafte Recherchewerk-           Bevorzugung eigener Angebote begegnen. Es erscheint
zeuge betrachtet.                                              jedoch mehr als fraglich, ob sich dadurch tatsächlich die
                                                               Marktsituation verändern würde.
                                                                    Ein immer wiederkehrender Vorschlag ist der Aufbau
Lösungsvorschläge                                              einer alternativen Suchmaschine. Mehrfach wurde gefor-
                                                               dert, mit öffentlicher Hilfe eine Alternative zu Google
Wie nun kann man nach dem Gesagten dafür sorgen, dass          (oder allgemeiner: zu den großen kommerziellen Such-
alternative Suchmaschinen etabliert werden und damit           maschinen) aufzubauen. Zuletzt forderten Hege & Flecken
Vielfalt auf dem Suchmaschinenmarkt hergestellt wird?          (2014) den Aufbau einer öffentlich-rechtlichen Such-
Der Schlüssel liegt m. E. darin, attraktive Angebote zu        maschine und stellten deren Aufgabe in den Kontext des
schaffen, die von den Nutzern angenommen werden. Wie           öffentlich-rechtlichen Rundfunks. In vielen Fällen wurde
solche Angebote der allgemeinen Websuche, aber auch            mit der Notwendigkeit einer europäischen Alternative zu
der Spezialsuche, genau aussehen, muss den Anbietern           Google argumentiert; dies vor allem im ursprünglichen
und den Nutzern überlassen werden. Im Folgenden wer-           Vorschlag des Aufbaus der deutsch-französischen Such-
den die Strategien zur Etablierung weiterer Anbieter auf       maschine Quaero. Zu dem gemeinsamen Projekt kam es
dem Suchmaschinenmarkt erörtert.                               allerdings nie, weil sich die deutsche und die französische
     Zunächst einmal gibt es die Hoffnung, dass sich der       Seite nicht über einen gemeinsamen Weg verständigen
Markt selbst regulieren wird. Hierbei wird davon aus-          konnten. Stattdessen wurde in den beiden Ländern je-
gegangen, dass die aktuelle (und bereits seit vielen Jahren)   weils ein einzelnes Projekt (Quaero bzw. in Deutschland
bestehende Situation durch den Eintritt neuer Anbieter         Theseus) verfolgt; beide Projekte hatten dann allerdings
verändert werden kann. Auf der Basis dieser Annahme            nicht mehr den Aufbau einer alternativen Suchmaschine
stellt sich dann nur noch die Frage, wie schwierig es für      zum Ziel.
einen neuen Anbieter ist, sich auf dem Markt zu etablieren          Aus grundlegenden Überlegungen ist der Aufbau ei-
und inwieweit er von einem Monopolanbieter daran gehin-        ner alternativen Suchmaschine abzulehnen: Zuerst einmal
dert wird (vgl. Monopolkommission 2015). Es ist positiv        würde eine weitere Suchmaschine den Suchmaschinen-

                                                     Bereitgestellt von | Hochschule für Angewandte Wissenschaften Hamburg
                                                                                                                  Angemeldet
                                                                                          Heruntergeladen am | 04.04.19 11:58
20          Dirk Lewandowski, Perspektiven eines Open Web Index

Abbildung 2: Entkoppelung von Infrastruktur und Diensten (auf Basis des grundlegenden Aufbaus von Suchmaschinen aus Risvik & Michelsen,
2002).

markt nicht grundlegend verändern, auch wenn sie nen-                maschinen (Risvik & Michelsen, 2002) dargestellt. Eine
nenswerte Marktanteile erreichen würde. Es ergibt nur                Suchmaschine besteht aus den Komponenten Crawler, Lo-
einen geringen Unterschied, ob die Auswahl zwischen                  cal Store, Indexer und Searcher. Der Crawler erfasst die
zwei oder drei (oder einer Handvoll) Suchmaschinen be-               Dokumente des Web mittels Verfolgen von Links und spei-
steht. Des Weiteren kann auch eine hochwertige Such-                 chert die gefundenen Dokumente im Local Store ab, der im
maschine an Gründen scheitern, die der Suche nicht inhä-             Idealfall eine vollständige und aktuelle Kopie des Web ist.
rent sind, beispielsweise an Fragen des Marketings. Ein              Der Indexer bereitet die Dokumente so auf, dass auf der
solches Scheitern würde allerdings bedeuten, dass die                einen Seite aussagekräftige Repräsentationen der Doku-
dafür nötigen enormen Investitionen verloren wären.                  mente entstehen (vgl. (Lewandowski, 2015b), S. 48 ff.), auf
    Stärker in Richtung einer Vielfalt auf dem Such-                 der anderen Seite die Dokumente effizient durchsuchbar
maschinenmarkt geht der Vorschlag, Google zur Öffnung                werden. Der Searcher schließlich sorgt für den Abgleich
seines Index zu zwingen. Die Idee hier ist, Konkurrenten             zwischen Suchanfragen und Dokumenten und bringt die
den Zugriff auf den Datenbestand der Google-Suchmaschi-              gefundenen Ergebnisse in eine Reihenfolge (Ranking).
ne zu gewähren, damit diese eigene Suchdienste aufbauen                   Die Entkoppelung bedeutet nun, die Bereitstellung
können. Zugrunde liegt die Erkenntnis, dass eine wesentli-           des Index (also das Crawling und eine grundlegende Auf-
che Hürde für den Aufbau einer neuen Suchmaschine                    bereitung der Dokumente) als öffentliche Aufgabe zu be-
gerade im Aufbau und der Pflege des Index besteht. Heuti-            trachten, analog zu anderen Infrastrukturaufgaben des
ge Partnermodelle (s. o.) erlauben nur einen beschränkten            Staates wie den Bau eines umfassenden Straßennetzes.
Zugriff auf Top-Ergebnisse der Suchmaschinen (im Gegen-              Die auf diesem Index aufbauenden Dienste werden dann
satz zu einem vollständigen Zugriff auf den Index) und               in Eigeninitiative betrieben, gleich ob von Unternehmen,
deren Anzeige (im Gegensatz zu einer umfassenden Wei-                öffentlichen Einrichtungen oder Hobbyentwicklern. Die
terverarbeitung).                                                    Betreiber der Dienste erhalten Zugang zur Infrastruktur
    Schließlich gibt es noch den Vorschlag des Aufbaus               und sind weder darauf angewiesen, selbst eine Infrastruk-
eines Web-Index als Infrastrukturmaßnahme (Lewan-                    tur aufzubauen noch sich auf den Zugang zu anderen pri-
dowski, 2014a). Die Kernidee hierbei ist die Entkoppelung            vatwirtschaftlichen Infrastrukturen zu verlassen.
von Index und Diensten. Es geht also darum, eine von
allen nutzbare Datenbasis zu schaffen, auf der dann eine
Vielzahl unterschiedlicher Dienste aufgebaut werden kön-
nen. Während die Suche im Web und in Teilen des Web
                                                                     Die Initiative „Open Web Index
eine Kernanwendung eines solchen Index ist, ist sie kei-             (OWI)“
neswegs auf Suchanwendungen beschränkt. Vielmehr
können alle Dienste, die in irgendeiner Weise auf Web-               Zur Verbreitung der Idee des Open Web Index hat sich die
daten aufbauen, von einem solchen Index profitieren, also            „Open Web Index Initiative“ gebildet. Diese besteht aus
bspw. auch Dienste zur Analyse der Struktur des Web.                 Experten aus Wissenschaft und Industrie. Von Beginn an
    Die Entkoppelung von Index und Diensten ist in Ab-               war klar, dass sich die Idee des Open Web Index nur durch-
bildung 2 anhand des grundlegenden Aufbaus von Such-                 setzen lässt, wenn auch die Industrie beteiligt ist. Die Schaf-

                                                       Bereitgestellt von | Hochschule für Angewandte Wissenschaften Hamburg
                                                                                                                    Angemeldet
                                                                                            Heruntergeladen am | 04.04.19 11:58
Dirk Lewandowski, Perspektiven eines Open Web Index               21

                                                                              B. Stark, D. Dörr, & S. Aufenanger (Eds.), Die Googleisierung der
fung eines offenen Web-Index erfordert erhebliche finan-
                                                                              Informationssuche (pp. 224–244). Berlin: De Gruyter.
zielle Mittel, so dass die Sinnhaftigkeit des Vorhabens nicht            Lewandowski, D. (2014a). Why we need an independent index of the
nur durch die Wissenschaft und öffentliche Einrichtungen                      Web. In R. König & M. Rasch (Eds.), Society of the Query Reader:
dargestellt werden kann, sondern auch durch die Industrie                     Reflections on Web Search (pp. 49–58). Information Retrieval;
in den geschäftlichen Potentialen von Diensten, die auf                       Digital Libraries, Amsterdam: Institute of Network Culture.
                                                                         Lewandowski, D. (2014b). Wie lässt sich die Zufriedenheit der Such-
einem solchen Index aufbauen. Die Initiative besteht seit
                                                                              maschinennutzer mit ihren Suchergebnissen erklären? In
2014; Sprecher sind Wolfgang Sander-Beuermann (SuMa                           H. Krah & R. Müller-Terpitz (Eds.), Suchmaschinen (Passauer
e. V.) und Dirk Lewandowski (HAW Hamburg). Das Ziel der                       Schriften zur interdisziplinären Medienforschung, Band 4)
Initiative ist es zunächst, Aufmerksamkeit für die Idee des                   (pp. 35–52). Münster: LIT.
Open Web Index zu schaffen und die Überlegenheit der                     Lewandowski, D. (2015a). Evaluating the retrieval effectiveness of
Idee gegenüber anderen Ansätzen darzustellen. Allerdings                      Web search engines using a representative query sample. Jour-
                                                                              nal of the Association of Information Science and Technology,
arbeitet die Gruppe auch an Lösungen für grundsätzliche
                                                                              66(9), 1763–1775. http://doi.org/10.1002/asi.23304.
technische Fragen, die sich durch den Aufbau und die                     Lewandowski, D. (2015b). Suchmaschinen verstehen. Berlin Heidel-
Bereitstellung eines solchen Index ergeben. Während viele                     berg: Springer Vieweg.
der aktuellen Arbeiten eher im Hintergrund ablaufen, fin-                Quirmbach, S. (2009). Universal Search – Kontextuelle Einbindung
den sich bereits veröffentlichte Informationen auf der Web-                   von unterschiedlicher Quellen und Auswirkungen auf das User
                                                                              Interface. In D. Lewandowski (Ed.), Handbuch Internet-Such-
site www.openwebindex.eu. Dort wird auch über den wei-
                                                                              maschinen (pp. 220–248). Heidelberg: Akademische Verlags-
teren Fortschritt der Arbeiten berichtet.                                     gesellschaft Aka GmbH.
                                                                         Risvik, K. M., & Michelsen, R. (2002). Search engines and web dyna-
                                                                              mics. Computer Networks, 39(3), 289–302.
Fazit                                                                    Spink, A., Jansen, B. J., Blakely, C., & Koshman, S. (2006). A study of
                                                                              results overlap and uniqueness among major web search engi-
                                                                              nes. Information Processing & Management, 42(5), 1379–1391.
Zunächst einmal ist positiv, dass das „Problem Google“
endlich erkannt wurde. Nun wird über mögliche Lösungen
diskutiert. Dabei ist m. E. eine konstruktive Lösung einer
                                                                                                  Prof. Dr. Dirk Lewandowski
destruktiven vorzuziehen. Der Aufbau eines offenen Web-
                                                                                                  Hochschule für Angewandte Wissenschaften
Index – und damit die Trennung von öffentlich finanzier-                                          Hamburg
ter Infrastruktur und privatwirtschaftlich betriebenen                                            Fakultät für Design, Medien und Information
Diensten – sorgt für mehr Vielfalt auf dem Suchmaschi-                                            Department Information
nenmarkt und darüber hinaus. Frei zugängliches Wissen                                             Finkenau 35
                                                                                                  22081 Hamburg
ist die Quelle von kontinuierlichem Wettbewerb, Innovati-
                                                                                                  dirk.lewandowski@haw-hamburg.de
on und Unternehmertum auf der einen und persönlicher                                              www.bui.haw-hamburg.de
und Meinungsfreiheit auf der anderen Seite. Der Open
Web Index schafft dafür die Voraussetzung. Er kann mit
                                                                         Prof. Dr. Dirk Lewandowski ist Professor für Information Research &
anderen Infrastrukturaufgaben des Staates verglichen                     Information Retrieval an der Hochschule für Angewandte Wissen-
werden – in Bezug auf die Sammlung und Verfügbarma-                      schaften Hamburg. Zuvor war er unabhängiger Berater im Themen-
chung von Wissen ist vor allem der Vergleich mit den                     bereich Suchmaschinen und Information Retrieval sowie Lehrbeauf-
Bibliotheken zu ziehen.                                                  tragter an der Universität Düsseldorf. Seine Forschungsinteressen
                                                                         sind Web Information Retrieval, Qualitätsfaktoren von Suchmaschi-
                                                                         nen, das Rechercheverhalten der Suchmaschinen-Nutzer sowie die
                                                                         gesellschaftlichen Auswirkungen des Umgangs mit den Web-Such-
Literatur                                                                maschinen. Zu seinen Veröffentlichen gehören neben den Büchern
                                                                         „Web Information Retrieval“ und „Handbuch Internet-Suchmaschi-
Broder, A. (2002). A taxonomy of web search. ACM Sigir Forum, 36(2),     nen“ zahlreiche Aufsätze, die in deutschen und internationalen Fach-
     3–10.                                                               publikationen veröffentlicht wurden. Sein neuestes Werk „Such-
Epstein, R., & Robertson, R. E. (2015). The search engine manipulation   maschinen verstehen“ ist im Februar 2015 erschienen. Dirk
     effect (SEME) and its possible impact on the outcomes of electi-    Lewandowski ist Editor in-Chief des Aslib Journal of Information Ma-
     ons. Proceedings of the National Academy of Sciences, 2015,         nagement (früher: Aslib Proceedings) und Associate Editor der Online
     201419828. http://doi.org/10.1073/pnas.1419828112.                  Information Review.
Frees, V. B. (2015). Internetnutzung: Frequenz und Vielfalt nehmen in
     allen Altersgruppen zu. Media Perspektiven, (10), 366–377.
Hege, H., & Flecken, E. (2014). Debattenbeitrag: Gibt es ein öffent-
     liches Interesse an einer alternativen Suchmaschine? In

                                                             Bereitgestellt von | Hochschule für Angewandte Wissenschaften Hamburg
                                                                                                                          Angemeldet
                                                                                                  Heruntergeladen am | 04.04.19 11:58
Sie können auch lesen