FOAF - Friend of a friend - Kurzübersicht Andreas Czink Student TU Wien Studienrichtung Technische Informatik - E535 E-Mail: ...
←
→
Transkription von Seiteninhalten
Wenn Ihr Browser die Seite nicht korrekt rendert, bitte, lesen Sie den Inhalt der Seite unten
FOAF – Friend of a friend Kurzübersicht Andreas Czink Student TU Wien Studienrichtung Technische Informatik – E535 E-Mail: e0427547@student.tuwien.ac.at Seite 1 von 8
0. Inhaltsverzeichnis 0. Inhaltsverzeichnis 1. Vorwort 1.1. Entwicklung des WWW 1.2. Verbesserungen am WWW 1.3. Wunsch nach maschinenlesbarem Code 2. Möglichkeiten von Friend of a friend 3. Implementierung von Friend of a friend 3.1. Zugrunde liegende Technologien 3.2. Konkretes Beispiel 4. Statistische Daten über die Verwendung 5. Vor- und Nachteile von Friend of a friend 5.1. Vorteil – Einfaches Suchen nach Personen 5.2. Nachteil – Der gläserne Mensch 6. Ausblick in die Zukunft 7. Literaturverzeichnis Seite 2 von 8
1. Vorwort Das Internet nimmt in unserem Leben einen immer wichtigeren Platz ein. Gleichzeitig steigen aber auch die Anforderungen an das Internet. Daher werden ständig neue Technologien, die in Computernetzwerken einsetzbar sind, entwickelt. Wir wollen hier auf Friend of a friend eingehen, das eine solche Technologie darstellt. 1.1. Entwicklung des WWW Das Internet in seiner Urform wurde bekanntlich vor allem im militärischen und universitären Bereich genutzt. Doch das Internet hatte einen Mangel: Es war praktisch nicht möglich, Texte in einer formatierten Form darzustellen. Außerdem war es nicht möglich, von einer Informationsquelle direkt zur nächsten zu gelangen, da es keine Hyperlinks gab. Das führte zur Entwicklung des WWW. Durch die dadurch entstandene einfache Bedienbarkeit und die Anzeige formatierter Texte setzte sich das Internet in den 90erJahren durch und erreichte erstmals große Bevölkerungsschichten. 1.2. Verbesserungen am WWW Das WWW war damals eine revolutionäre Technologie. Doch der Fortschritt hat nicht halt gemacht. Es wurden immer bessere Funktionen hinzugefügt. Man kann dabei z.B. an JavaScript oder an die Möglichkeit, Applets in Webseiten einzubinden, denken. Außerdem war und ist es extrem wichtig, die im Internet (und dort vor allem im WWW) dargestellte Information schnell und effizient finden zu können. Daher nahm die Verwendung von Suchmaschinen zu. Das alles sind heute kaum noch wegzudenkende Features des WWW. 1.3. Wunsch nach maschinenlesbarem Code Wir müssen uns jedoch darüber im Klaren sein, dass die Inhalte im WWW zwar für einem Menschen gut lesbar sind, aber Computer die Information nur schwer verarbeiten können. Schließlich ist HTML nur ein Format, dass dem Computer sagt, wie er Information anzuzeigen hat, aber nicht, welcher Art diese Information ist. Dies stellt natürlich vor allem bei der Suche nach und Vernetzung von Information eine erhebliche Einschränkung dar. Daher wurde das XML-Format entwickelt, mit dem es möglich ist, die dargestellte Information näher zu spezifizieren. Friend of a friend ist nun eine Möglichkeit, Information über Personen in einem maschinenlesbaren Format zu beschreiben. 2. Möglichkeiten von Friend of a friend Mit Friend of a friend kann man verschiedenste Daten einer Person erfassen. Es gibt Datenfelder für den Namen, die Adresse der Webpage, die Telefonnummern, die E-Mail- Adresse sowie viele andere Dinge. Man kann also diverse personenbezogene Daten erfassen. Ein einem Dokument können die Daten von beliebig vielen Personen erfasst und die Personen anschließend miteinander in Beziehung gesetzt werden. Information über Personen, die auf mehrere Websites verstreut ist, kann von Computersoftware zu einem großen Ganzen zusammengefügt werden. Dadurch kann man im Endeffekt viel Information über eine Person erhalten, auch wenn auf jeder Webseite nur wenig Information bereitgestellt wird. Dadurch wird gewährleistet, dass personenbezogene Information schnell und effizient gefunden und maschinell verarbeitet werden kann. Somit wird es in Zukunft beispielsweise möglich sein, in Suchmaschinen explizit nach Personen zu suchen. 3. Implementierung von Friend of a friend Friend of a friend-Dokumente werden mithilfe des RDF/XML-Formates spezifiziert: 3.1. Zugrunde liegende Technologie: RDF/XML Seite 3 von 8
RDF bedeutet Resource Description Framework, XML steht für Extensible Markup Language. XML-Dokumente sind im Prinzip spezielle Web-Dokumente, die in der XML-Syntax geschrieben sind. Die XML-Syntax gibt beispielsweise vor, wie Tags auszusehen haben. XML ist dabei im Gegensatz zu anderen Dokumenten (wie z.B. HTML) um neue Tags erweiterbar, indem neue Namespaces hinzugefügt werden. Dadurch ist XML ein hochflexibles Dokumentenformat, dass für die verschiedensten Zwecke eingesetzt werden kann. So kann man in XML-Dokumenten etwa XHTML-Beschreibungen, aber auch Friend of a friend-Beschreibungen verwenden, wenn man den richtigen Namespace hinzufügt. RDF ist eine Technik, mit der es möglich ist, verschiedene Objekte über einen Graphen auf einer abstrakten Ebene miteinander in Verbindung zu setzen. RDF/XML ist eine konkrete Implementation von RDF im XML-Format. 3.2. Konkretes Beispiel Sehen wir uns jetzt ein konkretes Friend of a friend-Dokument an: Max Mustermann Maxi JJJJ-MM-TT Das Proseminar mit einer moeglichst guten Note abschliessen Paul Mustermann ccc8825a2d7ede96a27e4117ef9b7d2927b4ff23
--> 0- Betrachten wir dieses Beispiel etwas genauer: In der ersten Zeile des Dokuments wird festgelegt, dass es sich um ein XML-Dokument handelt. Danach werden mit dem Tag die Sprache des Dokumentes und die Namespaces definiert. Grob gesagt definiert der Namespace, welche Tags verwendet werden dürfen. Dann beginnen wir mit den konkreten Friend of a friend-Code. Person ist dabei eine so genannte Friend of a friend-Klasse. Es gibt folgende Friend of a friend-Klassen: Agent, Document, Group, Image, OnlineAccount, OnlineChatAccount, OnlineEcommerceAccount, OnlineGamingAccount, Organization, Person, PersonalProfileDocument, Project Wichtig ist, dass alle weiteren Friend of a friend-Anweisungen innerhalb einer solchen Klasse verschachtelt sein müssen. In unserem Beispiel beschreiben wir eine Person, daher verwenden wir die Klasse Person. Jetzt folgen die Friend of a friend-Anweisungen, um diese unsere Person näher zu beschreiben. Gültige Anweisungen sind: accountName, accountServiceHomepage, aimChatID, based_near, birthday, currentProject, depiction, depicts, dnaChecksum, family_name, firstName, fundedBy, geekcode, gender, givenname, holdsAccount, homepage, icqChatID, img, interest, jabberID, knows, logo, made, maker, mbox, mbox_sha1sum, member, membershipClass, msnChatID, myersBriggs, name, nick, page, pastProject, phone, plan, primaryTopic, publications, schoolHomepage, sha1, surname, theme, thumbnail, tipjar, title, topic, topic_interest, weblog, workInfoHomepage, workplaceHomepage, yahooChatID Prinzipiell kann man jede beliebige aus den Friend of a friend-Anweisungen verwenden. Besonders interessant ist jedoch der Tag : Hier trägt man die Mail-Adresse des Objekts – in unserem Fall der Person – ein. Da man annehmen kann, dass eine Mail-Adresse genau einem Objekt zugewiesen werden kann, wird dieses Tag von vielen Friend of a friend- Parsern als Schlüssel verwendet. Stellen wir uns das anhand eines Beispiels vor: Eine Person wird in drei Friend of a friend-Dokumenten beschrieben. Jedes Dokument enthält die Anweisungen name und mbox. Allerdings ist der Name in einem der Dokumente fasch geschrieben. Der Parser kann jedoch aufgrund der Mail-Adresse trotzdem feststellen, dass dieselbe Person gemeint ist. Leider ist die Verwendung der Mail-Adresse als Schlüssel mit einem Nachteil behaftet: Die Mail-Adressen können von böswilliger Software mit Werbemails (Spam) überflutet werden. Man kann dieses Problem jedoch lösen, indem man von der Mailadresse eine Prüfsumme erstellt. Es ist sehr unwahrscheinlich, dass zwei Mail-Adressen die gleiche Prüfsumme aufweisen und sehr schwer, eine Prüfsumme in eine Mailadresse zurückzuverwandeln. Daher kann man anstatt der eigentlichen Mail-Adresse auch die Prüfsumme der Mailadresse als Schlüssel verwenden. Dafür ist dann das Tag zu verwenden. Eine recht nützliche Eigenschaft von XML ist, dass man innerhalb von Tags, die einem bestimmten Namespace zugeordnet sind, auch Tags eines anderen Namespaces verwenden kann. So ist es z.B. möglich, mittels eines -Tags innerhalb eines -Tags weitere rdf-Dateien anzugeben, um weitere Information einzubinden. Im obigen Beispiel haben wir sogar einmal die Blutgruppe einer Person angegeben, obwohl ein Tag für Blutgruppen im Friend of a friend-Namespace gar nicht existiert. Wir haben uns daher einfach des uranai-Namespaces bedient. Daran kann man die hohe Flexibilität und Erweiterbarkeit von XML (und damit auch von Friend of a friend) erkennen. Seite 5 von 8
An dieser Stelle sei noch darauf hingewiesen, dass man bei Friend of a friend auch Objekte innerhalb von Objekten deklarieren kann. Dies haben wir im Beispiel mit dem Tag bewerkstelligt. Das erhöht die Flexibilität natürlich zusätzlich. 4. Statistische Daten über die Verwendung Zwangsläufig stellt sich die Frage, ob Friend of a friend reine Zukunftsmusik ist oder ob es schon heutzutage angewandt wird. Diese Frage kann – je nachdem, welche Arten von Webpages man betrachtet – mit ja und nein beantwortet werden: Betrachtet man Webseiten, auf denen Benutzer selbst Information publik machen (z.B. Web- Blogs, Foren), so kann man feststellen, dass Friend of a friend sehr wohl verwendet wird. Derzeit sind ca. 1,5 Millionen Friend of a friend-Dokumente bei dieser Art von Webseiten online. Ein Ende dieses Friend of a friend-Booms ist nicht abzusehen. Anders verhält es sich mit den anderen Webseiten: Hier sind lediglich fünftausend Friend of a friend-Dokumente online abrufbar. Das bedeutet, dass man statistisch gesehen von 300 Friend of a friend-Dokumenten 299 bei Foren und Web-Blogs, aber nur ein solches Dokument auf den restlichen Webseiten, findet. Doch wodurch wird dieser gewaltige Unterschied verursacht? Es kommen drei verschiedene Gründe in Frage: • In Web-Blogs stehen persönliche Daten im Vordergrund, während bei anderen Seite Sachinformation wichtig ist. In anderen Webseiten ist daher der Bedarf nicht unbedingt so groß. • Schutz der Privatsphäre: Bei Web-Blogs hat der Benutzer oftmals keine Entscheidungskraft darüber, ob seine Daten über Friend of a friend weitergegeben werden oder nicht. Bei anderen Webseiten kann man individuell festlegen, welche Information preisgegeben werden soll. • Faulheit: Bei Web-Blogs werden die Friend of a friend-Dokumente automatisch erstellt. Bei den restlichen Webseiten muss die Information aber extra erfasst werden. Autoren sind oft einfach zu faul, um Friend of a friend-Dokumente zu schreiben, weil sie der Meinung sind, dass das sowieso nichts bringe. 5. Vor- und Nachteile von Friend of a friend Wie (fast) alle Dinge, mit denen wir es in unserem Leben zu tun haben, weist auch Friend of a friend sowohl Vor- als auch Nachteile auf. Diese wollen wir im folgenden näher betrachten: 5.1. Vorteil – Einfaches Suchen nach Personen Friend of a friend könnte sich in naher Zukunft zu einem sehr wichtigen Instrument zum Auffinden von Personen im Internet entwickeln. Während man bereits jetzt über Suchmaschinen Daten auffinden kann, wird man – sollte sich Friend of a friend verbreiten – in Zukunft gezielt nach Personen mit bestimmten Eigenschaften wie Name, Wohnort, Geburtsdatum, Interessen, Arbeitgeber, Freunden, usw. suchen können. Dem durchschnittlichen Anwender wird dieses Feature wahrscheinlich entgegenkommen, da er Personen im Web noch leichter auffinden kann. Somit kann Information über Personen relativ schnell beschafft werden. 5.2. Nachteil – Der gläserne Mensch Genau dieser Vorteil von Friend of a friend ist auch sein Nachteil: Selbstverständlich können auch andere Personen Friend of a friend-Dokumente lesen. Dadurch wird natürlich die eigene Privatsphäre eingeschränkt. Während es noch einen relativ kleinen Einschnitt in unsere Privatsphäre darstellt, wenn eine Person die Daten, die in Friend of a friend-Dokumenten stehen, manuell mit einem Editor liest, wird dieser Einschnitt sehr viel größer, wenn die Daten Seite 6 von 8
maschinell verarbeitet werden (was ja aufgrund des XML-Formates von Friend of a friend kein großes Problem darstellt). Wir werden dadurch quasi zu einem gläsernen Menschen. Gerade durch die maschinelle Verarbeitung kann es zum Datenmissbrauch kommen. Manche Personen mag es nicht stören oder es mag ihnen sogar recht sein, dass Information über sie schnell gefunden und verarbeitet werden kann, aber ein großer Teil der Bevölkerung ist wahrscheinlich darin bestrebt, die eigene Privatsphäre zu wahren. An dieser Stelle könnte man versucht sein zu meinen, dass nur Friend of a friend-Dokumente von Personen, die diese online gestellt haben, im Web zu finden sind. Personen, die nicht gefunden werden wollen, werden ja wohl kaum Friend of a friend-Dokumente über sich selbst online stellen. Dennoch werden Friend of a friend-Dokumente über diese Personen im Internet zu finden sein. Sollte sich Friend of a friend wirklich im Internet durchsetzen, so wird das sogar eher die Regel als die Ausnahme sein. Das möchte ich hier in einem kleinen Beispiel demonstrieren: Herr A spielt in einem Fußballverein. Nach einem Sieg seines Vereines erscheint in der Lokalzeitung ein Artikel über die Mannschaft. In der Web-Ausgabe legt die Zeitung beim entsprechenden Artikel Friend of a friend-Dokumente über jeden Spieler im Verein an. Obwohl Herr A selbst nichts dazu beigetragen hat, sind Informationen im Web über ihn aufgetaucht. Nehmen wir weiters an, dass er leidenschaftlicher Extrembergsteiger und außerdem Motorradfahrer ist. Da er an Motorradrennen teilnimmt, werden er auch auf diversen Homepages erwähnt. Auch auf der Webseite der Bergsteiger wird er als eifriger Bergsteiger erwähnt. All diese Informationen über ihn können – wenn sie im Friend of a friend-Format erfasst worden sind, relativ leicht gefunden und in Datenbanken abgelegt werden. Nehmen wir an, Herr A will eine Versicherungspolizze abschließen. Da das Versicherungsunternehmen durch Friend of a friend sehr leicht die Information bekommt, welchen gefährlichen Hobbys er nachgeht, könnte es passieren, dass er einen Risikoaufschlag zu bezahlen hat. 6. Ausblick in die Zukunft Eine zentrale Frage, wenn man sich mit einer neuen Entwicklung beschäftigt, ist die, ob diese Entwicklung denn auch das Potential hat, sich durchzusetzen. Zählen wir zunächst die Fakten auf: • Der Benutzer wünscht sich, Information schnell finden zu können • Gleichzeitig will der Benutzer seine Privatsphäre schützen. Wir haben es hier ganz offensichtlich mit zwei Widersprüchen zu tun. Wenn man jedoch das Internet genauer betrachtet stellt man fest, dass Internet und Privatsphäre generell in Widerspruch zueinander stehen. Ich denke dabei daran, dass der E-Mail-Verkehr auch heute noch größtenteils unverschlüsselt abgewickelt wird oder dass z.B. per FTP Passwörter im Klartext übertragen werden. Sehr viele Personen – ich nehme an, der Großteil – weiß davon wahrscheinlich gar nichts. Diese Personen werden auch kaum eine Bedrohung ihrer Privatsphäre durch Friend of a friend, sondern nur den Nutzen dieser Technik wahrnehmen. Das spricht klar dafür, dass es möglich ist, dass sich Friend of a friend durchsetzt. Dadurch, dass das Datenschutzproblem von so vielen Personen ignoriert wird, werden auch die verbleibenden Personen nichts gegen Friend of a friend ausrichten können. Im Prinzip heißt das: Wenn die großen Konzerne wollen, dass Friend of a friend verwendet wird, so wird sich Friend of a friend durchsetzen, andernfalls eben nicht. Diese Entwicklung wird jedoch nicht sprunghaft von heute auf morgen vonstatten gehen, sonder langsam und kontinuierlich. Seite 7 von 8
7. Literaturverzeichnis • http://www.foaf-project.org/ (Referenz: Institutshomepage) • http://xmlns.com/foaf/0.1/ (Referenz: Wikipedia Online Lexikon) • Li Ding, Lina Zhou, Tim Finin, Anupam Joshi: “How the Semantic Web is Being Used: An Analysis of FOAF Documents”, Proceedings of the 38th Hawaii International Conference on System Sciences – 2005 (Referenz: IEEE Library) Seite 8 von 8
Sie können auch lesen