FOAF - Friend of a friend - Kurzübersicht Andreas Czink Student TU Wien Studienrichtung Technische Informatik - E535 E-Mail: ...

Die Seite wird erstellt Marvin Gärtner
 
WEITER LESEN
FOAF – Friend of a friend
                Kurzübersicht

                Andreas Czink
               Student TU Wien
 Studienrichtung Technische Informatik – E535
    E-Mail: e0427547@student.tuwien.ac.at

                   Seite 1 von 8
0. Inhaltsverzeichnis

0.     Inhaltsverzeichnis
1.     Vorwort
1.1.   Entwicklung des WWW
1.2.   Verbesserungen am WWW
1.3.   Wunsch nach maschinenlesbarem Code
2.     Möglichkeiten von Friend of a friend
3.     Implementierung von Friend of a friend
3.1.   Zugrunde liegende Technologien
3.2.   Konkretes Beispiel
4.     Statistische Daten über die Verwendung
5.     Vor- und Nachteile von Friend of a friend
5.1.   Vorteil – Einfaches Suchen nach Personen
5.2.   Nachteil – Der gläserne Mensch
6.     Ausblick in die Zukunft
7.     Literaturverzeichnis

                                         Seite 2 von 8
1. Vorwort
Das Internet nimmt in unserem Leben einen immer wichtigeren Platz ein. Gleichzeitig steigen
aber auch die Anforderungen an das Internet. Daher werden ständig neue Technologien, die in
Computernetzwerken einsetzbar sind, entwickelt. Wir wollen hier auf Friend of a friend
eingehen, das eine solche Technologie darstellt.

1.1. Entwicklung des WWW
Das Internet in seiner Urform wurde bekanntlich vor allem im militärischen und universitären
Bereich genutzt. Doch das Internet hatte einen Mangel: Es war praktisch nicht möglich, Texte
in einer formatierten Form darzustellen. Außerdem war es nicht möglich, von einer
Informationsquelle direkt zur nächsten zu gelangen, da es keine Hyperlinks gab. Das führte
zur Entwicklung des WWW. Durch die dadurch entstandene einfache Bedienbarkeit und die
Anzeige formatierter Texte setzte sich das Internet in den 90erJahren durch und erreichte
erstmals große Bevölkerungsschichten.

1.2. Verbesserungen am WWW
Das WWW war damals eine revolutionäre Technologie. Doch der Fortschritt hat nicht halt
gemacht. Es wurden immer bessere Funktionen hinzugefügt. Man kann dabei z.B. an
JavaScript oder an die Möglichkeit, Applets in Webseiten einzubinden, denken. Außerdem
war und ist es extrem wichtig, die im Internet (und dort vor allem im WWW) dargestellte
Information schnell und effizient finden zu können. Daher nahm die Verwendung von
Suchmaschinen zu. Das alles sind heute kaum noch wegzudenkende Features des WWW.

1.3. Wunsch nach maschinenlesbarem Code
Wir müssen uns jedoch darüber im Klaren sein, dass die Inhalte im WWW zwar für einem
Menschen gut lesbar sind, aber Computer die Information nur schwer verarbeiten können.
Schließlich ist HTML nur ein Format, dass dem Computer sagt, wie er Information
anzuzeigen hat, aber nicht, welcher Art diese Information ist. Dies stellt natürlich vor allem
bei der Suche nach und Vernetzung von Information eine erhebliche Einschränkung dar.
Daher wurde das XML-Format entwickelt, mit dem es möglich ist, die dargestellte
Information näher zu spezifizieren. Friend of a friend ist nun eine Möglichkeit, Information
über Personen in einem maschinenlesbaren Format zu beschreiben.

2. Möglichkeiten von Friend of a friend
Mit Friend of a friend kann man verschiedenste Daten einer Person erfassen. Es gibt
Datenfelder für den Namen, die Adresse der Webpage, die Telefonnummern, die E-Mail-
Adresse sowie viele andere Dinge. Man kann also diverse personenbezogene Daten erfassen.
Ein einem Dokument können die Daten von beliebig vielen Personen erfasst und die Personen
anschließend miteinander in Beziehung gesetzt werden.
Information über Personen, die auf mehrere Websites verstreut ist, kann von
Computersoftware zu einem großen Ganzen zusammengefügt werden. Dadurch kann man im
Endeffekt viel Information über eine Person erhalten, auch wenn auf jeder Webseite nur
wenig Information bereitgestellt wird.
Dadurch wird gewährleistet, dass personenbezogene Information schnell und effizient
gefunden und maschinell verarbeitet werden kann. Somit wird es in Zukunft beispielsweise
möglich sein, in Suchmaschinen explizit nach Personen zu suchen.

3. Implementierung von Friend of a friend
Friend of a friend-Dokumente werden mithilfe des RDF/XML-Formates spezifiziert:

3.1. Zugrunde liegende Technologie: RDF/XML

                                         Seite 3 von 8
RDF bedeutet Resource Description Framework, XML steht für Extensible Markup
Language.
XML-Dokumente sind im Prinzip spezielle Web-Dokumente, die in der XML-Syntax
geschrieben sind. Die XML-Syntax gibt beispielsweise vor, wie Tags auszusehen haben.
XML ist dabei im Gegensatz zu anderen Dokumenten (wie z.B. HTML) um neue Tags
erweiterbar, indem neue Namespaces hinzugefügt werden. Dadurch ist XML ein
hochflexibles Dokumentenformat, dass für die verschiedensten Zwecke eingesetzt werden
kann. So kann man in XML-Dokumenten etwa XHTML-Beschreibungen, aber auch Friend of
a friend-Beschreibungen verwenden, wenn man den richtigen Namespace hinzufügt.
RDF ist eine Technik, mit der es möglich ist, verschiedene Objekte über einen Graphen auf
einer abstrakten Ebene miteinander in Verbindung zu setzen. RDF/XML ist eine konkrete
Implementation von RDF im XML-Format.

3.2. Konkretes Beispiel
Sehen wir uns jetzt ein konkretes Friend of a friend-Dokument an:

    Max Mustermann 
    Maxi 
    
    JJJJ-MM-TT 
     
      Das Proseminar mit einer moeglichst guten Note abschliessen
     
        Paul Mustermann
        
          ccc8825a2d7ede96a27e4117ef9b7d2927b4ff23
-->
    
      0-
     
Betrachten wir dieses Beispiel etwas genauer: In der ersten Zeile des Dokuments wird
festgelegt, dass es sich um ein XML-Dokument handelt. Danach werden mit dem Tag
 die Sprache des Dokumentes und die Namespaces definiert. Grob gesagt definiert
der Namespace, welche Tags verwendet werden dürfen. Dann beginnen wir mit
 den konkreten Friend of a friend-Code. Person ist dabei eine so genannte
Friend of a friend-Klasse.
      Es gibt folgende Friend of a friend-Klassen: Agent, Document, Group, Image,
      OnlineAccount,               OnlineChatAccount,             OnlineEcommerceAccount,
      OnlineGamingAccount, Organization, Person, PersonalProfileDocument, Project
Wichtig ist, dass alle weiteren Friend of a friend-Anweisungen innerhalb einer solchen Klasse
verschachtelt sein müssen. In unserem Beispiel beschreiben wir eine Person, daher verwenden
wir die Klasse Person. Jetzt folgen die Friend of a friend-Anweisungen, um diese unsere
Person näher zu beschreiben.
      Gültige Anweisungen sind: accountName, accountServiceHomepage, aimChatID,
      based_near, birthday, currentProject, depiction, depicts, dnaChecksum, family_name,
      firstName, fundedBy, geekcode, gender, givenname, holdsAccount, homepage,
      icqChatID, img, interest, jabberID, knows, logo, made, maker, mbox, mbox_sha1sum,
      member, membershipClass, msnChatID, myersBriggs, name, nick, page, pastProject,
      phone, plan, primaryTopic, publications, schoolHomepage, sha1, surname, theme,
      thumbnail, tipjar, title, topic, topic_interest, weblog, workInfoHomepage,
      workplaceHomepage, yahooChatID
Prinzipiell kann man jede beliebige aus den Friend of a friend-Anweisungen verwenden.
Besonders interessant ist jedoch der Tag : Hier trägt man die Mail-Adresse des
Objekts – in unserem Fall der Person – ein. Da man annehmen kann, dass eine Mail-Adresse
genau einem Objekt zugewiesen werden kann, wird dieses Tag von vielen Friend of a friend-
Parsern als Schlüssel verwendet. Stellen wir uns das anhand eines Beispiels vor: Eine Person
wird in drei Friend of a friend-Dokumenten beschrieben. Jedes Dokument enthält die
Anweisungen name und mbox. Allerdings ist der Name in einem der Dokumente fasch
geschrieben. Der Parser kann jedoch aufgrund der Mail-Adresse trotzdem feststellen, dass
dieselbe Person gemeint ist.
Leider ist die Verwendung der Mail-Adresse als Schlüssel mit einem Nachteil behaftet: Die
Mail-Adressen können von böswilliger Software mit Werbemails (Spam) überflutet werden.
Man kann dieses Problem jedoch lösen, indem man von der Mailadresse eine Prüfsumme
erstellt. Es ist sehr unwahrscheinlich, dass zwei Mail-Adressen die gleiche Prüfsumme
aufweisen und sehr schwer, eine Prüfsumme in eine Mailadresse zurückzuverwandeln. Daher
kann man anstatt der eigentlichen Mail-Adresse auch die Prüfsumme der Mailadresse als
Schlüssel verwenden. Dafür ist dann das Tag  zu verwenden.
Eine recht nützliche Eigenschaft von XML ist, dass man innerhalb von Tags, die einem
bestimmten Namespace zugeordnet sind, auch Tags eines anderen Namespaces verwenden
kann. So ist es z.B. möglich, mittels eines -Tags innerhalb eines
-Tags weitere rdf-Dateien anzugeben, um weitere Information einzubinden.
Im obigen Beispiel haben wir sogar einmal die Blutgruppe einer Person angegeben, obwohl
ein Tag für Blutgruppen im Friend of a friend-Namespace gar nicht existiert. Wir haben uns
daher einfach des uranai-Namespaces bedient. Daran kann man die hohe Flexibilität und
Erweiterbarkeit von XML (und damit auch von Friend of a friend) erkennen.

                                         Seite 5 von 8
An dieser Stelle sei noch darauf hingewiesen, dass man bei Friend of a friend auch Objekte
innerhalb von Objekten deklarieren kann. Dies haben wir im Beispiel mit dem Tag
 bewerkstelligt. Das erhöht die Flexibilität natürlich zusätzlich.

4. Statistische Daten über die Verwendung
Zwangsläufig stellt sich die Frage, ob Friend of a friend reine Zukunftsmusik ist oder ob es
schon heutzutage angewandt wird. Diese Frage kann – je nachdem, welche Arten von
Webpages man betrachtet – mit ja und nein beantwortet werden:

Betrachtet man Webseiten, auf denen Benutzer selbst Information publik machen (z.B. Web-
Blogs, Foren), so kann man feststellen, dass Friend of a friend sehr wohl verwendet wird.
Derzeit sind ca. 1,5 Millionen Friend of a friend-Dokumente bei dieser Art von Webseiten
online. Ein Ende dieses Friend of a friend-Booms ist nicht abzusehen.
Anders verhält es sich mit den anderen Webseiten: Hier sind lediglich fünftausend Friend of a
friend-Dokumente online abrufbar. Das bedeutet, dass man statistisch gesehen von 300 Friend
of a friend-Dokumenten 299 bei Foren und Web-Blogs, aber nur ein solches Dokument auf
den restlichen Webseiten, findet.
Doch wodurch wird dieser gewaltige Unterschied verursacht? Es kommen drei verschiedene
Gründe in Frage:
    • In Web-Blogs stehen persönliche Daten im Vordergrund, während bei anderen Seite
        Sachinformation wichtig ist. In anderen Webseiten ist daher der Bedarf nicht
        unbedingt so groß.
    • Schutz der Privatsphäre: Bei Web-Blogs hat der Benutzer oftmals keine
        Entscheidungskraft darüber, ob seine Daten über Friend of a friend weitergegeben
        werden oder nicht. Bei anderen Webseiten kann man individuell festlegen, welche
        Information preisgegeben werden soll.
    • Faulheit: Bei Web-Blogs werden die Friend of a friend-Dokumente automatisch
        erstellt. Bei den restlichen Webseiten muss die Information aber extra erfasst werden.
        Autoren sind oft einfach zu faul, um Friend of a friend-Dokumente zu schreiben, weil
        sie der Meinung sind, dass das sowieso nichts bringe.

5. Vor- und Nachteile von Friend of a friend
Wie (fast) alle Dinge, mit denen wir es in unserem Leben zu tun haben, weist auch Friend of
a friend sowohl Vor- als auch Nachteile auf. Diese wollen wir im folgenden näher betrachten:

5.1. Vorteil – Einfaches Suchen nach Personen
Friend of a friend könnte sich in naher Zukunft zu einem sehr wichtigen Instrument zum
Auffinden von Personen im Internet entwickeln. Während man bereits jetzt über
Suchmaschinen Daten auffinden kann, wird man – sollte sich Friend of a friend verbreiten –
in Zukunft gezielt nach Personen mit bestimmten Eigenschaften wie Name, Wohnort,
Geburtsdatum, Interessen, Arbeitgeber, Freunden, usw. suchen können.
Dem durchschnittlichen Anwender wird dieses Feature wahrscheinlich entgegenkommen, da
er Personen im Web noch leichter auffinden kann. Somit kann Information über Personen
relativ schnell beschafft werden.

5.2. Nachteil – Der gläserne Mensch
Genau dieser Vorteil von Friend of a friend ist auch sein Nachteil: Selbstverständlich können
auch andere Personen Friend of a friend-Dokumente lesen. Dadurch wird natürlich die eigene
Privatsphäre eingeschränkt. Während es noch einen relativ kleinen Einschnitt in unsere
Privatsphäre darstellt, wenn eine Person die Daten, die in Friend of a friend-Dokumenten
stehen, manuell mit einem Editor liest, wird dieser Einschnitt sehr viel größer, wenn die Daten

                                          Seite 6 von 8
maschinell verarbeitet werden (was ja aufgrund des XML-Formates von Friend of a friend
kein großes Problem darstellt). Wir werden dadurch quasi zu einem gläsernen Menschen.
Gerade durch die maschinelle Verarbeitung kann es zum Datenmissbrauch kommen.
Manche Personen mag es nicht stören oder es mag ihnen sogar recht sein, dass Information
über sie schnell gefunden und verarbeitet werden kann, aber ein großer Teil der Bevölkerung
ist wahrscheinlich darin bestrebt, die eigene Privatsphäre zu wahren.
An dieser Stelle könnte man versucht sein zu meinen, dass nur Friend of a friend-Dokumente
von Personen, die diese online gestellt haben, im Web zu finden sind. Personen, die nicht
gefunden werden wollen, werden ja wohl kaum Friend of a friend-Dokumente über sich
selbst online stellen. Dennoch werden Friend of a friend-Dokumente über diese Personen im
Internet zu finden sein. Sollte sich Friend of a friend wirklich im Internet durchsetzen, so wird
das sogar eher die Regel als die Ausnahme sein. Das möchte ich hier in einem kleinen
Beispiel demonstrieren:
      Herr A spielt in einem Fußballverein. Nach einem Sieg seines Vereines erscheint in der
      Lokalzeitung ein Artikel über die Mannschaft. In der Web-Ausgabe legt die Zeitung
      beim entsprechenden Artikel Friend of a friend-Dokumente über jeden Spieler im
      Verein an.
      Obwohl Herr A selbst nichts dazu beigetragen hat, sind Informationen im Web über ihn
      aufgetaucht. Nehmen wir weiters an, dass er leidenschaftlicher Extrembergsteiger und
      außerdem Motorradfahrer ist. Da er an Motorradrennen teilnimmt, werden er auch auf
      diversen Homepages erwähnt. Auch auf der Webseite der Bergsteiger wird er als
      eifriger Bergsteiger erwähnt. All diese Informationen über ihn können – wenn sie im
      Friend of a friend-Format erfasst worden sind, relativ leicht gefunden und in
      Datenbanken abgelegt werden.
      Nehmen wir an, Herr A will eine Versicherungspolizze abschließen. Da das
      Versicherungsunternehmen durch Friend of a friend sehr leicht die Information
      bekommt, welchen gefährlichen Hobbys er nachgeht, könnte es passieren, dass er einen
      Risikoaufschlag zu bezahlen hat.

6. Ausblick in die Zukunft
Eine zentrale Frage, wenn man sich mit einer neuen Entwicklung beschäftigt, ist die, ob diese
Entwicklung denn auch das Potential hat, sich durchzusetzen.
Zählen wir zunächst die Fakten auf:
    • Der Benutzer wünscht sich, Information schnell finden zu können
    • Gleichzeitig will der Benutzer seine Privatsphäre schützen.
Wir haben es hier ganz offensichtlich mit zwei Widersprüchen zu tun. Wenn man jedoch das
Internet genauer betrachtet stellt man fest, dass Internet und Privatsphäre generell in
Widerspruch zueinander stehen. Ich denke dabei daran, dass der E-Mail-Verkehr auch heute
noch größtenteils unverschlüsselt abgewickelt wird oder dass z.B. per FTP Passwörter im
Klartext übertragen werden. Sehr viele Personen – ich nehme an, der Großteil – weiß davon
wahrscheinlich gar nichts. Diese Personen werden auch kaum eine Bedrohung ihrer
Privatsphäre durch Friend of a friend, sondern nur den Nutzen dieser Technik wahrnehmen.
Das spricht klar dafür, dass es möglich ist, dass sich Friend of a friend durchsetzt. Dadurch,
dass das Datenschutzproblem von so vielen Personen ignoriert wird, werden auch die
verbleibenden Personen nichts gegen Friend of a friend ausrichten können. Im Prinzip heißt
das: Wenn die großen Konzerne wollen, dass Friend of a friend verwendet wird, so wird sich
Friend of a friend durchsetzen, andernfalls eben nicht. Diese Entwicklung wird jedoch nicht
sprunghaft von heute auf morgen vonstatten gehen, sonder langsam und kontinuierlich.

                                          Seite 7 von 8
7. Literaturverzeichnis
    • http://www.foaf-project.org/ (Referenz: Institutshomepage)
    • http://xmlns.com/foaf/0.1/ (Referenz: Wikipedia Online Lexikon)
    • Li Ding, Lina Zhou, Tim Finin, Anupam Joshi: “How the Semantic Web is Being
        Used: An Analysis of FOAF Documents”, Proceedings of the 38th Hawaii
        International Conference on System Sciences – 2005 (Referenz: IEEE Library)

                                    Seite 8 von 8
Sie können auch lesen