Linked Open Data Big Data Alles vernetzt Tout en réseau Tutto in rete
←
→
Transkription von Seiteninhalten
Wenn Ihr Browser die Seite nicht korrekt rendert, bitte, lesen Sie den Inhalt der Seite unten
Linked Open Data Big Data Alles vernetzt Tout en réseau Tutto in rete Ausgabe 4 6. Dezember 2013 VSA Verein Schweizerischer Archivarinnen und Archivare AAS Association des Archivistes Suisses AAS Associazione degli Archivisti Svizzeri BIS Bibliothek Information Schweiz BIS Bibliothèque Information Suisse BIS Biblio teca Informazione Svizzera
Inhalt / Sommaire arbido print 4 / 13 03 Editorial D und F II. Projekte und Initiativen aus IV. Rezensionen / Recensions Bibliotheken und Archiven / 29 Impressum Projets et initiatives dans le 38 Open Linked Data in Bibliotheken – domaine archive et bibliothèque Herausforderungen beim Aufbau eines «Linked Open I. Grundlagen und Perspektiven / 19 Die Bibliographic Framework Data»-Systems Bases et perspectives Initiative (BIBFRAME) der Library Stephan Holländer of Congress – Offene, verknüpfte 04 Dimensionen und Zusammen Datensätze 39 Big Data für Anfänger – hänge grosser, verknüpfter, offener Bruno Wenk, HTW Chur ein Reiseführer für und wissenschaftlicher Daten «Nichtinformatiker» René Schneider, Haute Ecole de 22 Vom Projekt zum Produkt: Der Eliane Blumer Gestion de Genève Linked Data Service der Deutschen Nationalbibliothek 41 Eine interessante Einführung 07 Linked Open Data: quelles Julia Hauser, zu einer Vielzahl von Themen der nouvelles compétences pour les Deutsche Nationalbibliothek Informationswissenschaft professionnels de l’information? Stephan Holländer Jasmin Hügi et Nicolas Prongué, 25 opendata.admin.ch spécialistes en information Andreas Kellerhals, documentaire Schweizerisches Bundesarchiv V. Aktualitäten / Actualités 09 «Daten öffnen, weltweit kooperie 28 Inscrire les données du Service de 42 Anna Pia Maissen zum Abschied / ren» – Grosse Fragen, noch keine la culture dans le Web pour mieux Eloge de Anna Pia Maissen abschliessenden Antworten? valoriser le patrimoine Gregor Egloff Vera Munch, freie Journalistin Alain Dubois, und PR-Beraterin Archives de l’Etat du Valais 44 Bibliofreak – Freaks und Leiden schaften für Bibliotheken / 12 Les institutions patrimoniales 30 Linked Open Data in archivischen Bibliofreak – Une campagne en suisses sont favorables à l’open Fachinformationssystemen faveur des bibliothèques data Peter Sandner, Hessisches Gerhard W. Matter Beat Estermann, Haute école Hauptstaatsarchiv, Wiesbaden spécialisée bernoise 46 BIS-Kongress in Lugano / Congrès BIS à Lugano 15 Les applications basées III. Projektberichte aus der Hoch Katia Röthlin sur les LOD en bibliothèque: schulforschung / Projets de un tour d’horizon recherches universitaires 47 Umfrage arbido / Sondage arbido Jasmin Hügi et Nicolas Prongué, Herbert Staub spécialistes en information 34 swissmetric.ch – neutrale, trans documentaire parente und vergleichende Web 48 Antonio Spadafora (1942–2013) analyse nicht nur für Bibliotheken 17 Alle Bibliotheken können die Wolfgang Semar, Zukunft der Katalogisierung SII Schweiz. Institut für gestalten Informationswissenschaft Eliane Blumer, Haute Ecole de Gestion de Genève, 36 Wissensvorsprung statt Datenflut Karsten Schuldt, HTW Chur mittels Web Monitoring und Web Intelligence Anton Weichselbraun, SII Schweiz. Institut für Informationswissenschaft 1 arbido 4 2013
Inserate/Annonces • arbido newsletter • arbido print • arbido website ➔ inserate@staempfli.com ➔ 031 300 63 89 Abonnemente • arbido print ➔ abonnemente@staempfli.com • arbido newsletter ➔ www.arbido.ch 2 arbido 4 2013
Editorial Linked Open Data und Big Data Annkristin Schlichte, Stephan Holländer Linked Open Data und Big Data werden ein integraler Linked Open Data et Big Data deviendront une partie inté- Bestandteil der zukünftigen Webinfrastruktur sein, in der grante de la future infrastructure du Web, de grandes quan- grosse Datenmengen verfügbar und via Uniform Resource tités de données seront ainsi disponibles et pourront être Identifiers (URI) identifiziert und vernetzt sind. Diese identifiées et mises en réseau via Uniform Resource Iden- Entwicklung wird auch Auswirkungen auf Archive, Biblio tifiers (URI). Ce développement aura également des réper- theken und andere Informationseinrichtungen haben, cussions sur les archives, les bibliothèques et d’autres struc- selbst wenn diese bisher erst in Ansätzen erkennbar sind tures d’informations, même si ces impacts sont pour l’ins- und das Potenzial von Linked Open Data und Big Data hier tant encore peu perceptibles et que le potentiel des Linked noch längst nicht ausgeschöpft ist. Open Data et Big Data n’est de loin pas encore vraiment exploité. «Linked Data» bezeichnet wohlstrukturierte, hoch konnek- tive und syntaktisch interoperable Datensets, die über meh- Les «Linked Data» désignent des ensembles de données bien rere Repositorien innerhalb einer Organisation oder orga- structurés, reliés entre eux et présentant une inter-opérabi- nisationsübergreifend verteilt sind. In den vergangenen lité syntaxiques; ces ensembles de données sont répartis sur Jahren haben diverse kommerzielle und nichtkommerzielle plusieurs répertoires au sein d’une organisation ou entre Initiativen begonnen, Linked Open Data für die kostengüns- plusieurs organisations. Diverses initiatives commerciales tige Akquise, Anreicherung, Disambiguierung (d.h. die Auf- ou non ont été lancées ces dernières années dans le but lösung von sprachlichen Mehrdeutigkeiten) und Veröffent- d’utiliser les Linked Open Data pour l’acquisition bon mar- lichung von Daten zu nutzen und so Einsparungen bei ché, l’enrichissement et la publication de données et parve- der Datenintegration und der Verbesserung der Qualität nir ainsi à des économies au niveau de l’intégration de ces und Zugänglichkeit von Daten zu erzielen. Dies gibt auch mêmes données, d’en améliorer la qualité et l’accessibilité. Archiven und Bibliotheken neue Möglichkeiten, ihre Be- Voilà qui donne également aux archives et aux bibliothèques stände im Kontext des World Wide Webs zu erschliessen de nouvelles possibilités de mettre en valeur et de cataloguer und zu katalogisieren. leurs fonds dans le contexte du World Wide Web. In einem aktuellen Heft zur Thematik der Linked Open Ce numéro d’arbido consacré aux Linked Open Data Data darf aber auch das Thema Big Data nicht fehlen. Da- aborde également le thème des Big Data. Les Big Data sont runter werden all jene Datensets verstanden, deren Bewirt- des ensembles de données qui deviennent tellement volu- schaftung aufgrund des grossen Datenvolumens durch kon- mineux qu’il n’est plus possible de travailler au moyen des ventionelle Softwaretools und Methoden nicht bewältigt outils et des méthodes classiques de gestion des données. werden kann. Es deutet alles darauf hin, dass unter diesem Tout indique que ce concept traduit l’importance croissante Begriff die zunehmende Bedeutung von Daten als Faktor der des données comme facteurs de création de valeur ajoutée. Wertschöpfung zusammengefasst wird. Obwohl «Big Data» Bien que les «Big Data» prennent des formes différentes je nach Institution unterschiedliche Erscheinungsformen selon les institutions, la capacité d’analyser et de gérer de haben, wird die Fähigkeit zur Analyse und Verwaltung von très grandes quantités de données deviendra une compé- sehr grossen Datenmengen zu einer Schlüsselkompetenz im tence clé et un critère de concurrence. Umgang mit Daten und zu einem Wettbewerbskriterium. Familiarisez-vous donc, en lisant ce numéro, avec les Informieren Sie sich daher im vorliegenden Heft über concepts de Linked Open Data et de Big Data; peut-être que die Konzepte von Linked Open Data und Big Data und lassen les projets qui y sont présentés vous inspireront! Sie sich inspirieren von den vorgestellten Projekten! 3 arbido 4 2013
I. Grundlagen und Perspektiven Dimensionen und Zusammenhänge grosser, verknüpfter, offener und wissenschaftlicher Daten René Schneider, Haute Ecole de intensiven wissenschaftlichen Entde und die damit verbundenen Aufgaben Gestion de Genève ckung verkündet. einzustellen. Aber was heisst das eigentlich? Nachdem die Flut der Diskussionen, Sind die übrigen Paradigmen der Wis Big Data Kommentare und Prophezeiungen das senschaftsgeschichte damit bedeu Den grössten Block (im doppelten Social Web betreffend nun verebbt ist, tungslos geworden? Und wie verhält es Sinn) machen dabei die gemeinhin un bricht bereits die neue Flutwelle über die sich mit dem Kontext der Daten, durch ter Big Data subsumierten Datensätze Dämme und überspült uns mit dem, was den sie normalerweise zu Information aus, von deren Existenz und Konse im Social Web und anderswo in Massen werden? Oder sind Daten nicht mehr quenz mittlerweile auch die Normal ohne Unterlass und Überlegung produ- gleich Daten? Und was heisst dies für bürger erfahren haben, was insofern ziert wird: Daten! Bibliotheken, Archive und Dokumenta gut ist, da sie selbst zu den Hauptpro tionszentren? Sind sie oder ihre Daten duzenten, bedauerlicherweise aber Einleitung betroffen? Ergeben sich neue Arbeits nicht zu den Nutzern gehören. Big Man gewinnt nicht nur den Eindruck, aufträge für sie oder werden sie von Data wurde dabei letztlich durch zwei dass die verhältnismässig alte Bezeich einem weiteren Bedeutungsverlust be Phänomene möglich: erstens die wei nung der elektronischen Datenverar troffen sein? ter-hin exponentiell steigende Leis beitung eine ganz neue Bedeutung er Im Folgenden soll versucht wer tungsfähigkeit der Prozessoren sowie halten hat, sondern dass die Daten den, diese Fragen einzugrenzen und die damit parallel verlaufende Steige gleichsam selbst zu Information ge entsprechend dem derzeitigen Stande rung der Speicherkapazitäten der Rech worden sind, auch wenn dies auf den der Dinge zu beantworten. Dies soll ner, zweitens durch den Anstieg der ersten Blick als widersinnig erscheinen anhand dreier unterschiedlicher Da täglich bzw. sekündlich produzierten mag. Dieser paradoxe Eindruck ver tentypen illustriert werden, die derzeit und aufgezeichneten Datenmengen, stärkt sich jedoch, wenn in einflussrei unterschiedlich stark diskutiert wer die allerorts durch die Vernetzung der chen Kreisen nicht mehr vom Informa den, sich trotz ihrer Unterschiede aber Endgeräte (vom Grossrechner bis zum tionszeitalter gesprochen wird, son an einzelnen Punkten berühren bzw. in Smartphone und den darauf befindli dern vom Zeitalter der Daten. So wird unterschiedlicher Beziehung zueinan chen Apps) ins Web eingespeist und bereits ein neues und viertes wissen der stehen: Big Data, Linked Open von dort weiterverarbeitet werden. Ge schaftliches Paradigma1 heraufbeschwo Data und Research Data (d.h. grosse speichert wird dabei alles, was geht: ren und nach den wissenschaftstheore Datenmengen, verknüpfte und offene Daten, mit oder ohne Metadaten, oder tischen Vorläufern der empirischen Datenmengen sowie Forschungsda die Metadaten alleine, aus denen sich Beschreibung von Naturphänomenen ten). Diese dreifache Auffächerung von ja streng genommen der eigentliche (1. Paradigma), der theoretischen Ge Datenverarbeitungsinitiativen beant Kontext der Daten bzw. ihr Verständnis neralisierung (2. Paradigma) und der wortet bereits unmittelbar eine der wei ergibt. Entscheidend ist aber, dass aus computerbasierten Simulation (3. Para ter oben formulierten Fragen und zeigt, diesen Daten ein neuer Kontext erzeugt digma) nun das Zeitalter der daten- wird und zwar mithilfe spezieller Algo Die Informationswissenschaft und alle rithmen, genauer mit sogenannten In damit verbundenen Institutionen ste- ferenzmechanismen, also Schlussfol 1 Jim Gray on e-Science: «A transformed hen damit auch vor der Herausforde- gerungsregeln der Maschinen, die sie Scientific Method», in: Hey, Tony, Tansley, rung, sich auf diese Daten und die damit verwalten und bearbeiten. In den Stewart, Tolle, Kristin: The Fourth Paradigm: verbundenen Aufgaben einzustellen. Schlussfolgerungsregeln des Big Data Data Intensive Scientific Discovery. Microsoft werden orthogonale, d.h. prinzipiell Corporation. 2009, S. xviii http://research. voneinander unabhängige Merkmale microsoft.com/en-us/collaboration/ miteinander verknüpft, um neue oder fourthparadigm/4th_paradigm_book_com- dass Daten wirklich nicht mehr gleich bis dahin unbekannte Zusammenhän plete_lr.pdf Daten sind. Die Informationswissen ge aufzuzeigen2. Mit dieser an und für 2 Dietmar Dath, Ranga Yogeshwar (2013): schaft und alle damit verbundenen In- sich recht einfachen Vorgehensweise, «Rechnen Sie damit, lebenslang ein stitutionen stehen damit auch vor der die von Menschen täglich bewusst oder Verdächtiger zu sein», FAZ vom 12.7.2013. Herausforderung, sich auf diese Daten unbewusst ausgeführt wird, stellt sich 4 arbido 4 2013
der einfache, und von daher sehr er sie räsonieren kann. Wiederum geht es bar werden. In einigen Disziplinen gibt folgsversprechende Business Case von also nicht um kognitive Prozesse von es parallel dazu bereits «Peer Reviewed Big Data dar, der nun aber von den Ma Menschen, sondern darum, diese in Data Paper», die allein die Datensätze schinen ausgeführt wird. Damit sollte Rechnern zu repräsentieren und zu si enthalten. auch klar sein, dass hinter Big Data zu mulieren und den Maschinen zu erlau Was das spezielle Verhältnis von einem sehr grossen Teil wirtschaftliche ben, selbstständig Rückschlüsse aus Forschungsdaten zu Big und Linked oder andere Interessen stehen, die den verknüpften Daten zu ziehen. Open Data betrifft, lässt sich sagen, nicht primär im Interesse der Produ dass sie – etwa im Fall des Large Hadron zenten sind, auch wenn die ethischen Forschungsdaten Colliders – sehr gross sein können. Sie Implikationen an dieser Stelle nicht Etwas im Abseits dieser grossen Bewe können auch mit LOD verknüpft und ausgeführt werden sollen. gungen findet – auf den Bereich der angereichert werden, müssen es aber Wissenschaften beschränkt – seit eini nicht. Linked Open Data (LOD) gen Jahren eine weitere Diskussion Dabei sollte nicht ausser Acht ge Eher unabhängig davon verläuft die statt, die die sogenannten Forschungs lassen werden, dass bei den For Linked-Open-Data-Initiative3. Unab daten zum Hauptgegenstand des Inte schungsdaten eine ganz andere grund hängig in dem Sinne, dass die hier ver resses gemacht hat. sätzliche Frage im Vordergrund steht: knüpften (Linked) und veröffentlichten Die gesamten Anstrengungen las wie bewahren wir (Roh-)Daten langfris (Open) Datensätze nicht notwendiger sen sich sehr gut an zwei grundlegen tig auf, sodass sie uns zu einem späte weise eine Teilmenge der grossen (Big) den Modellen illustrieren: dem Modell ren Zeitpunkt zur Nachnutzung wieder Daten sind, im Gegenteil: Der Um des Datenlebenszyklus4, das von ersten stand, dass LOD die gemeinnützige Projektideen über die Ablage und dau Der grösste Vorteil für den Forscher er- Publikation sowie eine Verknüpfung erhafte Speicherung von Datensätzen gibt sich daraus, dass die Datensätze zur Conditio sine qua non macht, bis hin zu deren Integration in Publi selbst, d.h. die Primärdaten, zitier- und schliesst den orthogonalen Charakter kationen und deren Zitation reicht, und publizierbar werden. der grossen Datensätze aus und eröff dem Modell für das Datenkontinuum5, net eine ganz andere Sichtweise. Im das eine kontinuierliche Weitergabe Gegensatz zu Big Data beschränkt sich und den Austausch der Daten garantie LOD auf Daten, die im Web zur Verfü ren soll und zwar unabhängig davon, problemlos zur Verfügung stehen? Es gung gestellt werden, und nicht in ir ob es sich um Rohdaten, strukturierte geht also in erster Linie um ganz grund gendwelchen nichtöffentlichen Daten Daten, Metadaten oder die in späteren sätzliche Fragen der Archivierung, der banken oder Clouds gespeichert wer Publikationen eingebundenen Daten Kompatibilität und der Interoperabili den. Des Weiteren ist ihr Umfang, trotz handelt. Der Mehrwert für den For tät, im Grunde also um Fragen, die auch der an und für sich unvorstellbaren scher und die Öffentlichkeit ergibt sich die Bereiche der grossen und der ver Menge der Daten, die die LOD-Cloud daraus, dass beide quasi uneinge knüpften Datenmengen irgendwann mittlerweile enthält, vergleichsweise schränkt und über alle Soft- und Hard betreffen könnten. Man kann sich aber klein. warewechsel Zugang zu diesen Daten auch nicht des Eindrucks erwehren, Im Rahmen von Linked Open Data dass gerade in der Debatte um die For soll ein Grundproblem gelöst werden, Der eigentliche Mehrwert von Linked schungsdaten so prinzipielle Fragen das darin besteht, dass der grösste Teil Open Data besteht also darin, dass sie angegangen werden, dass den Beteilig des Wissens, das im Web publiziert die Relationen aller Datenbanken in ein ten noch gar nicht genau klar ist, wie wird, in relationalen Datenbanken ge einheitliches Format überführen, was diese gelöst werden sollen, auch wenn speichert, aber nur einem sehr flachen dazu führen kann, dass die Maschine es zumindest in einzelnen Disziplinen Format (genauer: HTML, der Hypertext über sie räsonieren kann. bereits Lösungsansätze bzw. respekta Markup Language) repräsentiert wird. ble Lösungsvorschläge gibt. Dies führt dazu, dass die ursprünglich gesetzten Relationen verloren gehen und eine direkte Kommunikation (im für eine Nachnutzung oder Überprü 3 Bizer, Christian, Tom Heath, and Tim Sinne eines reziproken Verständnis fung haben. Auch wenn man davon Berners-Lee (2009). «Linked data-the story ses) zwischen den Datenbanken nicht ausgehen kann, dass sich das Interesse so far.» International Journal on Semantic möglich ist. Dieses Problem wird nun dafür sowohl bei den meisten For Web and Information Systems (IJSWIS) 5.3, dadurch gelöst, dass eine neue Daten- schern als auch der Gesellschaft, die 1–22. ebene eingeführt wird, die Auskunft diese Forschung finanziert, in Grenzen 4 Sarah Higgins (2008): «The DCC Curation über die semantischen Relationen gibt. hält, wird eine Sicherung der For Lifecycle Model». International Journal of Der eigentliche Mehrwert von Linked schungsdaten mittlerweile zu den gu Digital Curation 3(1), 134–148. Open Data besteht also darin, dass sie ten und festen Regeln für eine transpa 5 Andrew Treloar (2011): Private Research, die Relationen aller Datenbanken in ein rente Forschung gezählt. Der grösste Shared Research, Publication, and the einheitliches Format überführen, was Vorteil für den Forscher ergibt sich Boundary Transitions. http://andrew.treloar. – genau wie im Fall von Big Data – da daraus, dass die Datensätze selbst, d.h. net/research/diagrams/data_curation_conti- zu führen kann, dass die Maschine über die Primärdaten, zitier- und publizier nuum.pdf 5 arbido 4 2013
Bibliotheken und Daten: eine neue und Ähnlich verhält es sich mit den For serweise Parallelen zu den drei Dimen notwendige Herausforderung schungsdaten, auch wenn hierbei we sionen der Zeit erkennen, die Augusti Bleibt die Frage nach der Rolle der In- niger die Katalogisierenden als viel nus im elften Buch der Confessiones in stitutionen, die traditionell mit diesen mehr die Kollegen aus dem Bereich des seiner Reflektion über das Wesen der Fragen beschäftigt waren. Zuvorderst E-Publishing sowie die Betreiber der Zeit entwickelte. Interessanterweise handelt es sich dabei um die Bibliothe Open-Access-Plattformen eine Rolle sprach er nicht allein von Praeteritum, ken, auch wenn die Archive und Doku spielen werden. Ihre Aufgabe wird es Praesens und Futurum, sondern von mentationszentren in einzelnen Berei sein, neben den Langzeitarchivaren «praesens de praeteritis memoria, pra chen ein Wort mitsprechen könnten, und im Verbund mit den Datenzentren esens de praesentibus contuitus, pra sofern ihre Expertise noch gefragt ist. die Datensätze, so gross oder (eher) esens de futuris expectatio»6, d.h., er Die grossen Datenmengen (Big Da klein sie auch sein mögen, mit einer assoziierte die Erfahrung der Zeit mit ta) können die Bibliotheken, Archive persistenten Adressierbarkeit für eine drei zentralen Begriffen: Memoria (Er und Dokumentationszentren schnell Nachnutzung, Nanopublikation oder innerung), Contuitus (Betrachtung) ausser Acht lassen, auch wenn sie tra -zitation zur Verfügung zu stellen. und Expectatio (Erwartung). ditionell damit beauftragt waren, grös- So mag es für ein grundlegendes sere Informationsmengen aufzube Erinnerung, Betrachtung, Erwartung Verständnis hilfreich sein, die unter wahren. An Big Data zeigt sich viel Festzuhalten bleibt, dass es insgesamt schiedlichen Konzepte zum Umgang mehr, wie schnelllebig die Zeitläufte sehr unterschiedliche Vorstellungen mit Daten schlussendlich mithilfe die geworden sind. Wähnten sich die Bib vom Umgang mit Daten gibt, die der ser drei Dimensionen zu begreifen: der liotheken (zumindest einige erlauchte zeit in drei unterschiedlich grossen Ini Memoria entsprechen die Bemüh- unter ihnen) bis vor Kurzem noch an tiativen angegangen und diskutiert ungen um die Archivierung und vorderster Front in der grössten Digita werden, wobei durchaus Berührungs Nachnutzung von Daten; die LOD-Ini lisierungsinitiative und durften sie sich punkte bestehen. Das gegenwärtige tiative zeigt das Bemühen, eine Daten noch als strategisch wichtige Datenlie Bild der Dateninitiativen zeigt sich so schicht für die gegenwärtige Betrach feranten der erfolgreichsten Suchma dynamisch, dass derzeit nicht antizi tung, also den Contuitus, aufzubauen; schine ansehen, müssen sie nunmehr die Bestrebungen von Big Data entspre erkennen, dass sie vom Gehilfen des Aus dieser Perspektive betrachtet, las- chen schliesslich dem Wunsch, die globalen Players zum staunenden Be sen sich kurioserweise Parallelen zu den Handlungs- und Gedankenwege ande trachter noch weitaus grösserer Daten drei Dimensionen der Zeit erkennen, die rer vorherzusagen. verwalter geworden sind. Augustinus im elften Buch der Confes- Nicht umsonst begann die Wissen Anders verhält es sich bei der siones in seiner Reflektion über das We- schaft der Daten mit Euklids Geomet Linked-Open-Data-Initiative. Sollten die sen der Zeit entwickelte. rie, in denen zum ersten Mal von «De Bibliotheken und ihre Katalogisie domena» (dem Gegebenen)7 die Rede rungsabteilungen sowie die Verbund ist, die in der ersten Übersetzung ins zentren dazu bereit sein, würde sich Lateinische eben mit dem Wort Data Linked Open Data als der notwendige, pierbar ist, ob die Dateninitiativen wei wiedergegeben wurden. Euklid sah als wenn nicht sogar zwingende kommen ter zersplittern, konvergieren oder etwa Dedomena jenes Gegebene an, aus de Schritt darstellen, um die Kataloge zu einem Schichtenmodell zueinander dem sich gesuchte, d.h. nicht bekannt in ein Format zu bringen, von dem de finden können. geometrische Zusammenhänge er ren Anbieter selbst, aber auch viele an schliessen lassen. Nichts anderes ist – dere profitieren können. Schlussend Die reine Betrachtung der Gegenwart wenn wir den geometrischen Zusam lich könnten damit – neben vielen an liefert aber noch keine Antworten auf menhang beiseitelassen – bei Big Data deren positiven Seiteneffekten und die zwei grundlegenden Fragen: Wa und Linked Open Data der Fall. Hier ist neuen Nutzungsformen der Katalogda rum heben wir die Daten eigentlich der Zusammenhang so einfach wie of ten – vor allen Dingen die Probleme der auf? Und: Warum interessieren wir uns fensichtlich. Konvergenz unterschiedlicher Ver so sehr für sie? Diese zwei Fragen las bunddaten sowie die komplizierten Be sen sich letztlich mit ganz grundsätzli Wir sollten dabei auch nicht vergessen, mühungen für die Erstellung standar chen menschlichen Bedürfnissen be dass seit Anbeginn der Wissenschafts disierter Metakataloge ein Ende haben. antworten: erstens einem eher rück geschichte praktisch alle namhaften wärtsgewandten Bedürfnis, nämlich Forscher darum bemüht waren, die Zu dem Sammeln und dem daraus resul kunft vorherzusagen, mit welchen Mit 6 Augustinus, Confessiones, XI, 20, 26, http:// tierenden Bedürfnis nach Erinnerung, teln auch immer. Auch wenn wir es www9.georgetown.edu/faculty/jod/ zweitens mit der Organisation bzw. der heute nicht mehr wahrhaben wollen, latinconf/11.html Repräsentation von Wissen, um es im schrieb Newton, der gerne als Vater der 7 Jakob Voss (2013): «Was sind eigentlich mer, d.h. gegenwärtig, zur Verfügung modernen Wissenschaften angesehen Daten?» Libreas. Library Ideas, 23, http:// zur haben, und drittens dem eher vor wird, und darauf verwies «auf den libreas.eu/ausgabe23/02voss wärtsgewandten Wunsch, Zukünftiges Schultern von Giganten» zu stehen, 8 John Freely (2009): Aladdin’s Lamp, Alfred E. vorhersagen zu können. Aus dieser Per mehrere Bücher zur Prophetie und der Knopf, New York. spektive betrachtet, lassen sich kurio Alchimie8. 6 arbido 4 2013
Diese beiden alles überragenden Interessen (Prophetie und Alchimie) ABSTRACT führten letztlich zum Entstehen der Les grandes quantités de données ouvertes, scientifiques et reliées entre elles: dimensions ungleichen Schwestern Astronomie et contextes und Astrologie sowie der Ablösung der Mais que peuvent donc signifier ces énormes quantités de données ouvertes et reliées Alchimie durch die Chemie. Wissen entre elles? Les autres paradigmes de l’histoire de la science sont-ils donc devenus schaftstheoretisch würde sich die gan obsolètes? OU bien les données ne sont-elles plus des données? Et qu’est-ce que cela ze Diskussion um Daten also als nichts signifie pour les bibliothèques, les archives et les centres de documentation? Sont-ils Weiteres herausstellen als die Suche concernés ou est-ce leurs données qui le sont? En résulte-t-il de nouvelles tâches pour nach dem Beweis, dass Prophetie nichts ces institutions ou leur importance s’en trouvera-t-il amoindrie? anderes als ein ganz rationales und be Dans cet article, l’auteur tente de cerner ces questions et d’y répondre. Il le fait en rechenbares Unterfangen ist. discutant de trois types de données qui, malgré leurs différences, ont quelques points communs qui les relient d’une certaine manière, à savoir: big data, linked open data et Kontakt: rene.schneider@hesge.ch research data (c.à.d. de grandes quantités de données ouvertes et reliées entre elles ainsi que des données de recherche). Ce triptyque d’initiatives de traitement des don- nées répond d’ores et déjà à l’une des questions formulées ci-dessus et montre que les données ne sont plus tout à fait des données. Les sciences de l’information et toutes les institutions qui y sont liées se trouvent donc face à un défi: maîtriser ces données et les tâches qu’elles induisent. (traduction: sg) Linked Open Data: quelles nouvelles compétences pour les professionnels de l’information? Jasmin Hügi et Nicolas Prongué, Concernant les LOD en biblio Offres d’emploi et avis d’experts spécialistes en information thèque, encore très peu d’études ont été Le Web des données et les LOD repré documentaire réalisées pour identifier les compé sentent un sujet très technique, avec tences qui devraient être enseignées lequel les frontières entre le métier Les LOD ne représentent pas la première aux futurs professionnels de l’informa d’informaticien et celui de profession thématique qui remet en question les tion. Deux projets méritent d’être men nel de l’information s’estompent. compétences voire la formation des pro- tionnés dans ce contexte-là. D’une part, L’étude qui est présentée dans cet article fessionnels de l’information. Ces der- un curriculum concernant les LOD en vise à identifier les compétences priori nières années, la littérature scientifique général a été développé pour le projet taires à acquérir pour qu’un profession a proposé des réflexions par rapport à EUCLID4, sans considérer les institu nel de l’information puisse travailler des programmes d’études en lien avec tions culturelles. Sur la base de ce cur les bibliothèques numériques1, la «Digi- riculum, des matériels d’apprentissage tal Curation» (gestion des actifs numé- sous forme de webinars, de tutoriels et 1 POMERANTZ, Jeffrey, et al. 2006. Curricu- riques)2 ainsi qu’avec la gestion de don- d’un cahier d’accompagnement ont été lum development for digital libraries. nées de recherche3. élaborés et mis à disposition en ligne. Proceedings of the 6th ACM/IEEE-CS joint Afin de définir les connaissances néces conference on Digital libraries. New York, NY, Des études concernant les nouvelles saires pour travailler quotidiennement USA: ACM. DOI: 10.1145/1141753.1141787. compétences des bibliothécaires avec les LOD, des experts de différentes 2 YAKEL, Elizabeth, et al. 2011. Digital Curation Les LOD ne représentent pas la pre industries ont été interrogés. D’autre for Digital Natives. Journal of Education for mière thématique qui remet en ques part, le projet Learning Linked Data5 Library & Information Science. Vol. 52, no. 1, tion les compétences voire la formation s’est focalisé spécifiquement sur les p. 23–31. des professionnels de l’information. besoins des professionnels de l’infor 3 STANTON, Jeffrey M., et al. 2011. Education Ces dernières années, la littérature mation. Ce projet, qui s’est terminé en for eScience Professionals: Job Analysis, scientifique a proposé des réflexions septembre 2012, avait pour but de faire Curriculum Guidance, and Program par rapport à des programmes d’études un répertoire des sujets d’apprentis Considerations. Journal of Education for en lien avec les bibliothèques numé sage afin de développer une plate-forme Library and Information Science. Vol. 52, no. riques, la «Digital Curation» (gestion soutenant les enseignants et les étu 2, p. 79. des actifs numériques) ainsi qu’avec la diants dans l’interprétation et la créa 4 www.euclid-project.eu/ gestion de données de recherche. tion des données. 5 http://lld.ischool.uw.edu/wp/ 7 arbido 4 2013
avec des LOD en bibliothèque. Pour ces connaissances est nécessaire afin de Programmation ceci, des offres d’emploi trouvées en savoir créer et attribuer des URIs aux Certains experts interrogés ont évoqué Suisse, en Allemagne, en Autriche et en triplets, les publier en ligne ainsi que la connaissance basique d’au moins un France ainsi que des avis d’experts in créer des interfaces web pour que les langage de programmation (Java, Ruby, ternationaux ont été analysés afin de utilisateurs puissent interagir avec. PERL, etc.) comme compétence néces dresser un premier constat. Seules les saire. Cela servirait avant tout de moyen offres d’emploi exigeant un diplôme en Triplets de communication avec les informati science de l’information, en plus des En troisième position arrivent les com ciens. Ces connaissances peuvent éga compétences liées aux LOD, ont été pétences en lien avec les triplets, c’est- lement être utiles pour la programma retenues. Quant aux experts, ils de à-dire la connaissance des spécifica tion de codes simples qui permettent la vaient, pour être sélectionnés, avoir tions RDF émises par le W3C, qui repré conversion en masse de données en étudié les sciences de l’information ou sentent la base pour la création de tri LOD. avoir travaillé en tant que bibliothé plets. Il est également important de caire, en plus de leur expérience en savoir développer et modéliser un Technologies du Web sémantique LOD6. Au final, huit offres d’emploi et graphe qui peut être appliqué aux don Les données organisées en triplets né douze réponses d’experts ont été prises nées. Puisque les triplets peuvent être cessitent une base de données spéci en compte. exprimés à travers différentes syntaxes fique (un «triple store»), un langage (RDF/XML, Notation 3, etc.), il est utile d’interrogation spécifique (SPARQL) et Huit compétences-clés de comprendre ces dernières ou de une interface d’interrogation spéci La nature technique des LOD avait une connaître des outils qui peuvent les pro fique (SPARQL Endpoint). La maîtrise certaine influence sur les réponses. duire. de ces technologies est fortement sou Ainsi, ces dernières mentionnent beau haitée pour travailler avec les LOD. coup de détails techniques, tels que des Web sémantique et Linked Data langages, des formats ou encore des Il s’agit de connaître les principes émis XML logiciels. L’analyse du contenu des par le W3C et par Tim Berners-Lee, Enfin, dernier élément mais non des offres d’emploi et des réponses a per ainsi que leurs objectifs. Cette catégorie moindres, des connaissances de XML mis d’identifier plus de 40 éléments de inclut également la compréhension et des langages annexes comme XSLT compétence différents. La figure 1 pré basique de l’inférence ou du raisonne ont été mentionnées dans les cas ana sente les compétences qui apparaissent ment, par exemple. lysés. XML est à la base de nombreux dans le nombre de cas le plus élevé7. standards du Web sémantique, et il est Standards de catalogage donc indispensable de comprendre et Ontologies et métadonnées Les compétences concernant les stan de savoir exploiter des données structu Dans cette première catégorie, il s’agit dards de catalogage sont essentielles rées en XML. de connaître des schémas de métadon dans un projet LOD, car pour transfor nées tels que Dublin Core, savoir éva mer des données en triplets, il faut bien Un monde changeant luer et choisir un élément de métadon connaître les données de base. Il s’agit Le travail avec des LOD en bibliothèque nées pour l’appliquer à ses propres donc de comprendre les règles de saisie nécessite visiblement des compétences données, savoir créer des vocabulaires des données (telles que les AACR2), le très spécifiques et au premier abord, contrôlés ainsi que des ontologies, et format d’enregistrement (tel que cela peut sembler intimidant. Néan savoir effectuer un alignement de deux MARC), ainsi que le fonctionnement moins, il est important de noter que les vocabulaires différents. du SIGB utilisé (tel que Virtua). compétences déjà existantes parmi les Développement web Cet élément englobe des connaissances concernant le fonctionnement des pro tocoles web et des serveurs, ainsi que les principes du Web design. La maîtrise de 6 La méthodologie sera expliquée en détail dans un rapport qui paraîtra à la fin de cette année. 7 Pour donner un exemple: si une compétence est mentionnée dans chacun des 20 cas, la compétence a une haute priorité. Si une compétence n’apparaît que dans un seul cas, sa priorité est basse (même si la compétence est mentionnée très souvent à l’intérieur du cas). Figure: Compétences les plus mentionnées dans les 20 cas 8 arbido 4 2013
professionnels de l’information se re ment liées au Web sémantique (prin giques. Des cours de formation conti trouvent tout à fait dans les éléments cipes, standards et technologies). Selon nue sont par ailleurs à mettre en place cités dans le diagramme. Ainsi, la pre nous, l’enseignement de ces compé pour que les professionnels sur le ter mière compétence touche aux ontolo tences devrait être inclus dans le curri rain puissent eux aussi se former aux gies et aux métadonnées, qui sont utili culum des professionnels de l’informa LOD. En effet, le Web sémantique est sées pour la description des ressources, tion. Une introduction obligatoire à la bien plus qu’une tendance, et le monde et ceci a toujours fait partie des connais thématique ainsi que des cours à choix des bibliothèques ne peut se permettre sances de base des professionnels de devraient être dispensés au niveau ba d’attendre. l’information. Concernant les standards chelor, alors que les étudiants au ni de catalogage, il est inutile d’évoquer veau master devraient atteindre une que cela appartient à la bibliothécono compréhension globale afin d’être ca Contact: nicolas.prongue@etu.hesge.ch mie. En outre, les formations de bache pables de prendre des décisions straté jasmin.hugi@hesge.ch lor en information documentaire en Suisse contiennent des modules d’en seignement de développement web et de XML. Par rapport à la programma ABSTRACT tion, la frontière entre informaticien et Linked Open Data – Welche neuen Kenntnisse brauchen I&D-Fachleute auf diesem Gebiet. professionnel de l’information se Die Linked Open Data (LOD) verbreiten sich progressiv in der kulturellen Domäne. montre fluctuante, et l’attribution de Eine wachsende Anzahl an Projekten entstehen in Institutionen und LOD-Applikationen cette compétence à l’un des deux mé halten Einzug in Bibliotheken. Dieser Einzug stellt gewisse Kompetenzen der I&D Fach- tiers représente un sujet de discussion. leute infrage, stärkt andere und erfordert neue Kenntnisse und neues Know-how. Dieser Artikel präsentiert die Resultate einer Studie, die zum Ziel hat, diese neuen Kompeten- Ce qui manque réellement en ce mo zen, die sich I&D-Fachleute angesichts LOD aneignen müssen, zu bestimmen. ment, ce sont les compétences stricte «Daten öffnen, weltweit kooperieren» Grosse Fragen, noch keine abschliessenden Antworten Vera Münch, Soll man seine Daten wirklich für die freie Journalistin und PR-Beraterin ganze Welt öffnen? Wie sichert man in einer völlig offenen Welt die nationalen Die neuen Möglichkeiten der nahezu un- Interessen, wie die des eigenen Hau begrenzten Verlinkung von Daten, die Ag- ses? Wer sorgt für eine vernünftige, gregation und Analyse riesiger Datenmen- nachhaltige Ordnung in der Datenabla gen – diskutiert unter den Überbegriffen ge, der Datenverknüpfung und der In Big Data, Linked Data und Linked Open formationspräsentation? Wie kann Data (LOD) – bieten Bibliotheken völlig man es als Bibliothek schaffen, mit dem neue Chancen, ihre Bestände und beson- atemberaubenden Forschungsfort deren Angebote international sichtbar zu schritt mitzuhalten? Viele grosse Fra machen. Die neue Technik des Cloud Com- gen, auf die es heute noch keine ab putings, also der Bereitstellung und Nut- schliessenden Antworten gibt. zung von Software, Rechen- und Speicher- kapazitäten als Onlinedienstleistung, er- Globale Clouds: Problemlösung oder möglicht es zudem, Routinearbeiten im Herstellerabhängigkeit? Portrait eigenen Haus zu reduzieren und sie statt- Als eine der ersten Bibliotheken in Eu Vera Münch (55), Hildesheim (D) begleitet als dessen durch Automatisierung, Vernet- ropa hat die Universität Tilburg Ser- freie Journalistin und PR-Beraterin für wis- zung und Abgleich von z.B. Katalogen und vices der cloudbasierten Softwareinfra senschaftliche Einrichtungen die Entwick- Metadaten auf viele Schultern in der Bib- struktur WorldShare™ Management lungen in der Fachinformation und im Biblio- liothekswelt zu verteilen. Auch die Infor- Services (WMS) von OCLC in Betrieb thekswesen. Sie berichtet für die deutsche mationsauslieferung auf mobile Compu- genommen: «Wir betreiben, historisch Bibliotheksfachzeitschrift b.i.t.online über ter und Smartphones lässt sich über Cloud gewachsen, seit Jahren mehrere Biblio Konferenzen, Messen und Trends. Services relativ problemlos organisieren. theksinformationssysteme (LIS) paral 9 arbido 4 2013
lel. Mit der Cloud ist jetzt die Techno mit öffentlichen Geldern aufgebaut griff die Diskussion mit Rémi Mathis logie da, hier etwas zu ändern», so ein sind und deshalb auch der Öffentlich als geladenem Gast und Max Klein von Mitarbeiter. keit zur Verfügung stehen müssten; sei OCLC Research3 in einem Workshop Durch die Nutzung einer Cloud- es vor Ort in der Bibliothek oder vir- auf. Mathis ist Bibliothekskurator und Plattform bindet man sich technisch tuell. «Durch die Öffnung können an Präsident der Wikimedia France. Er be eng an einen Anbieter. Entsprechende dere Bibliotheken und Interessenten richtete, dass das französische Kultur- Befürchtungen (in Fachkreisen unter die Metadaten für eigene Zwecke und und Kommunikationsministerium mit dem Begriff «Vendor Lock-In») disku Innovationen nachnutzen.» Wikimedia France kooperiert, um die tiert, begleiten die neue Technologie. Die NB hat für die Europeana den französischsprachigen Ressourcen in Anja Smit, Direktorin der niederlän- Schweizer Bibliothekskatalog Helveti Wikipedia semantisch zu erschliessen. dischen Universitätsbibliothek Utrecht cat vollumfänglich geöffnet. Alle Me Klein beschäftigt sich als «Wikipedian und amtierende Vorsitzende des OCLC tadaten sind unter der Corporate-Comm- in Residence» bei OCLC Research mit EMEA Regional Council hielt den Be ons-Lizenz CC-O für alle Interessenten allen Fragen rund um die Weiter- denken in Strassburg das Verbundar verfügbar und können angebunden entwicklung von Wikipedia als Quelle gument entgegen: «Alle Macht geht werden. Doffey erklärte: «Wir müssen für verlinkbare Daten und Informatio von den Mitgliedern aus». dort sein, wo andere Partner, andere nen. Er versuchte, in 45 Minuten die Bibliotheken auch dabei sind, damit Idee der freien, von Maschinen und Die Schweizerische Nationalbibliothek wir an der Diskussion teilnehmen kön Menschen gleichermassen lesbaren hat eine Strategie nen. Die Schweiz ist so klein, dass wir Datenbank Wikidata zu erklären – und Die Direktorin der Schweizerischen diese Öffnung auch weltweit nutzen wie die Forscher dieser Datenbank Nationalbibliothek (NB), Marie-Chris wollen und können.» Genevieve Clavel- Multilingualität beibringen wollen. tine Doffey1, hat mit ihrem Team für ihr Merrin, bei der NB verantwortlich für Haus eine klare Entscheidung getrof den Bereich «Nationale und Internati Culturomics: Kulturgeschichte aus fen. In ihrem Konferenzvortrag2 brach onale Kooperation» ergänzte, durch Digitalisaten herausrechnen te sie diese auf den Punkt: «Daten öff den Big-Data-Austausch auf Basis ver Auf diesem hohen Niveau internationa nen, weltweit kooperieren». Das bedeu linkter Metadaten würde ein Bestands ler Forschung ging es nahtlos weiter. tet, die NB kooperiert nicht nur mit den abgleich mit grossen anderen Metada Jean-Baptiste Michel erforscht in Har Schweizer Bibliotheken wie zum Bei tensammlungen möglich. Zur Veran vard «die Nutzung von Millionen digi spiel im Rahmen des Metakatalogs staltung sagte Direktorin Doffey, dass talisierter Bücher und Dokumenten, Swissbib und «den anderen etwa 900 auch «die ganze Diskussion über die um durch quantitative Analysen daraus Bibliotheksdiensten, die im Metakata Cloud» sehr wertvoll sei. «Als einzelne z.B. Rückschlüsse zur Geschichte und log sind», sondern auch mit der Euro Institution haben wir zwar nicht die Kultur zu ziehen». «Culturomics»4 ha peana, mit dem WorldCat «und allen gleichen Probleme wie Konsortien, ben er und sein Kollege Erez Lieberman anderen Möglichkeiten», so Doffey. Sie aber ich denke, es ist auch einmal ganz Aiden dieses neue, auf Digitalisaten begründete die Entscheidung vor allem interessant, Leute zu hören wie Ray aufsetzende Forschungsgebiet getauft. mit der Überzeugung, dass alle Meta mond Bérard, zu erfahren, was es da Ihre Arbeiten führten zu einer Soft daten und Informationsbestände der für Probleme gibt und welche Fragen ware, die aus grossen Datenbeständen Schweizerischen Nationalbibliothek gestellt werden.» Bérard, Direktor des in den Daten verborgene Trends be französischen staatlichen bibliogra- rechnet und grafisch als Kurven in Dia fischen Instituts ABES berichtete u.a., grammen sichtbar macht. Die For dass ABES für die französischen aka schung brachte ihnen im letzten Jahr 1 www.nb.admin.ch/org/amtsvorsteherin/ demischen Bibliotheken eine Studie Titelseiten auf «Nature and Science» index.html?lang=de zur Ablösung der bisherigen LIS durch und auf der «New York Times». Google 2 Aufzeichnungen der Konferenzbeiträge sind, ein neues, geteiltes «shared LIS» hat das Programm gekauft. soweit sie von den Referenten freigegeben durchgeführt hat. Auf Basis der ge wurde, auf der Website von OCLC bereitge- wonnenen Erkenntnisse hat ABES In Deutschland entsteht ein stellt. www.oclc.org/en-europe/events/2013/ sein Bibliothekssystem neu ausge «Culturegraph» emearc-annual-meeting-feb-26.html. Von schrieben. Die Deutsche Nationalbibliothek (DNB) einigen Präsentationen gibt es zudem baut an einer Plattform, über die Dienste Videoaufzeichnungen auf YouTube, u.a. vom Frankreich setzt stark auf Wikipedia und Projekte zu Datenvernetzung, Per Vortrag von M.-C. Doffey https://www. für Bibliotheken sistent Identifier und Linked Open youtube.com/watch?v=aONFHqMbdig Wie Wikipedia in Bibliotheken einge Data für kulturelle Entitäten zusam http://www.oclc.org/en-europe/events/2013/ bunden und von ihnen genutzt werden mengeführt werden sollen. Markus emearc-annual-meeting-feb-26.html kann, ist in Bezug auf Big Data und Geipel, Softwareingenieur bei der DNB, 3 OCLC-Research betreibt eine eigene Website, Linked Data ebenfalls ein grosses The stellte die «Culturegraph» getaufte auf der sehr interessante Forschungsprojekte ma. Die Wissenschaftlerin Titia van der Plattform vor. Sie soll zu einem globa und -ergebnisse stehen www.oclc.org/ Werf, die vom niederländischen Leiden len Kulturschatz-Netzwerk weit über research.html aus für OCLC die F&E-Aktivitäten mit die Grenzen einzelner Unternehmen 4 www.culturomics.org/ europäischen Bibliotheken koordiniert, und Einrichtungen hinaus werden. 10 arbido 4 2013
Neue Informationsdienste Dr. Klaus Ceynowa zeigte innovati Milliarden Holdings hinweisen, liefern mit offenen Daten ve Nutzungsszenarien für digitalisierte den Rohstoff für schier unendliche Wie auf Basis offener Daten mit neuen Inhalte aus Bibliotheksbeständen, die Nutzungsmöglichkeiten. Van der Werf IKT entwickelte Dienste aussehen von der BSB mithilfe von Technologien zeigte in ihrem Vortragsthema «Meta können, zeigten nach Jean-Baptiste wie GPS-gestützte Lokalisierung (Loca daten ausser Kontrolle: Metadatenag Michel zwei weitere Referenten auf tion based Services), durch virtuelle gregation auf Netzwerkebene», welche sehr beeindruckende Weise: Silver Oli Darstellung angereicherte Informa Aufgabe gute Metadaten erfüllen und ver, Informationsarchitekt mit Spe tionsbereitstellung (Augmented Real- wo die Grenzen der Technik liegen. zialgebiet strategische Ausrichtung ity) sowie gestengesteuerte Präsenta der Datennutzung für Onlinepubli tion und Informationssuche (Gesture W3C Group für LOD-Erweiterung von shing bei der britischen Unterneh based Computing and Search) entwic- Schema.org eingerichtet mensberatung Ontoba5, und Dr. Klaus kelt wurden. Last, but not least sprach OCLC Tech Ceynowa, stellvertretender Direktor nology Evangelist Richard Wallis im der Bayerischen Staatsbibliothek OCLC Research informiert letzten Vortrag über «Linked Data und (BSB). Oliver referierte über das «Zeit umfassend über Datennutzung OCLC»7. Dabei berichtete er unter an alter des Hinweisens auf Dinge, die in Nicht nur die eingeladenen Redner, derem, dass das World Wide Web Con Beziehung zum persönlichen Interes auch OCLC Research hatte Spannendes sortium (W3C) an der Weiterentwick se stehen» («The age of pointing at aus den Forschungslaboren zu berich lung des Metadatenbeschreibungsstan things»). Gemeint ist das automa- ten. Roy Tennant, Senior Programm dards Schema.org in Richtung LOD- tische Anbieten von weiterführenden Officer, führte in die «Entfesselung des Nutzung arbeitet. Dazu wurde eine Informationen direkt in den Informa Katalogisierens»6 durch Datamining in «Schema Bib Extend Community tionsraum hinein, in dem sich der LOD ein. Die über 290 Millionen Group»8 eingerichtet. Wallis leitet sie Nutzer gerade bewegt. WorldCat-Einträge, die auf rund 1,95 als Vorsitzender. Kontakt: vera-muench@kabelmail.de ABSTRACT OCLC hat sein 4. EMEA Regional Coun- Ouvrir les données et coopérer au niveau mondial cil Meeting 2013 unter das Thema «Dyna- Les nouvelles possibilités que présentent la mise en réseau pratiquement illimitée des mic Data: a World of possibilities» gestellt. données, l’agrégation et l’analyse d’énormes quantités de données (Big Data, Linked Data et Linked Open Data) offrent aux bibliothèques de nouvelles chances de valoriser leurs fonds à l’échelle internationale et de proposer des offres spécifiques. La nouvelle technique du Cloud Computing, autrement dit la mise à disposition et l’utilisation de 5 www.ontoba.com/blog/bbc-news-labs logiciels, de capacités de calcul et de stockage comme prestation en ligne, permet en 6 www.oclc.org/research/news/2013/02-27. outre de réduire les travaux de routine et de répartir ces derniers via l’automatisation html et la mise en réseau de catalogues et de métadonnées. La fourniture d’informations sur 7 Ein Interview mit Richard Wallis zu LOD des ordinateurs portables et des téléphones intelligents peut également être organisée erschien in B.I.T.-Online 15 (2012), Ausgabe sans trop de problèmes via les Cloud-Services. (traduction: sg) 6, S. 566 8 www.w3.org/community/schemabibex/ Annonces/Inserate – arbido newsletter – arbido print – arbido website inserate@staempfli.com 031 300 63 89 11 arbido 4 2013
Les institutions patrimoniales suisses sont favorables à l’open data Beat Estermann, à des bénévoles des tâches de correction Le développement spectaculaire de Wi collaborateur scientifique, et de transcription sur l’Internet, offre kipédia, Flickr et d’offres analogues Institut pour le gouvernement qui rencontre un véritable succès. Le basées sur le principe de la commu électronique de la Haute école Tropenmuseum à Amsterdam met des nauté virtuelle focalise de plus en plus spécialisée bernoise centaines de milliers de photos haute l’attention sur la constitution et la col résolution sur Wikimedia Commons, lecte collaborative de contenus sur l’In Depuis l’avènement de l’Internet, les se félicite que ses fonds soient désor ternet. De premières collaborations institutions patrimoniales connaissent mais plus faciles d’accès et en espère en s’installent entre des institutions patri des changements successifs nombreux. tirer profit par l’augmentation du moniales et des communautés en ligne, On par exemple la numérisation systé- nombre de visiteurs. Le Brooklyn Mu tandis que certaines institutions lancent matique des objets patrimoniaux, la seum s’en remet au jugement des visi des projets spécifiques en faisant appel mise en réseau accrue des organisa- teurs de son site web pour sélectionner au crowdsourcing2. tions, la coproduction de contenus par des photographies destinées à une ex les utilisatrices et les utilisateurs ainsi position. Un consortium de biblio Les communautés Wikipédia et Flickr que la mise à disposition de données et thèques européennes utilise le crowd découvrent de leur côté que les institu de contenus sur l’Internet sous des li- funding pour financer la numérisation tions partimoniales sont des parte cences «libres». Une étude de la Haute des œuvres tombant dans le domaine naires importants et cherchent depuis école spécialisée bernoise1 montre où les public. A Vienne, des chercheurs quelques années à collaborer active institutions patrimoniales suisses se si- misent sur les données libres d’accès ment avec elles. A partir de 2009, c’est tuent dans ce contexte. pour visualiser d’une nouvelle façon le mouvement pour l’ouverture des d’appréhender l’histoire de l’art. données publiques qui, depuis les Les institutions patrimoniales Ces exemples montrent les pro en pleine mutation fonds changements qui traversent le Le développement spectaculaire de Wi- Le Musée de Derby mise sur des codes champ des institutions patrimoniales kipédia, Flickr et d’offres analogues ba- QR pour enrichir via des articles de depuis l’avènement de l’Internet dans sées sur le principe de la communauté Wikipédia les explications concernant les années 1990 et les innovations qu’il virtuelle focalise de plus en plus les objets d’exposition, et ce en plu a induites. l’attention sur la constitution et la col- sieurs langues bien entendu. La Biblio lecte collaborative de contenus sur thèque nationale australienne propose On peut, concrètement, identifier plu l’Internet. sieurs tendances successives: Depuis le début des années 2000, les institutions patrimoniales en Europe conjuguent leurs efforts afin de numé Etats-Unis et la Grande-Bretagne, se 1 En allemand: Estermann Beat (2013): riser de manière coordonnée et la plus propage rapidement pour toucher Schweizer Gedächtnisinstitutionen im complète possible les objets patrimo quelque 50 Etats de par le monde. Son Internet-Zeitalter. Ergebnisse einer Pilotbefra- niaux et leurs métadonnées. Outre une exigence: les données des autorités gung zu den Themenbereichen Open Data mise en réseau renforcée qui permet publiques doivent être rendues acces und Crowdsourcing, Berner Fachhochschule, aux institutions d’échanger leur savoir- sibles sous une forme lisible par ordi E-Government-Institut. / En anglais: faire et d’éviter les doublons, sont éga nateur afin qu’elles puissent être utili Estermann Beat (2013): Swiss Heritage lement proposées dans la foulée des sées par des tiers. Si le mouvement pour Institutions in the Internet Era. Results of a offres de «single-point-of-access» sous l’ouverture des données publiques pilot survey on open data and crowdsour- la forme de systèmes de catalogues inter- trouve son origine dans une vision de cing, Bern University of Applied Sciences, organisations et de bibliothèques vir la politique étatique que l’on veut plus E-Government Institute. tuelles. transparente et plus participative, il est 2 Le concept de «crowdsourcing» désigne des également motivé par une vision tech activités participatives en ligne dans le cadre Dès 2005, on assiste à l’avènement du nico-économique: la mise en réseau du desquelles une personne ou une organisation Web social qui offre encore plus de pos plus grand nombre possible de données demande publiquement à un groupe (en sibilités d’interaction. Cette tendance «ouvertes» doit permettre l’émergence général non défini de manière précise) de se caractérise par de nouvelles formes de ce qu’il est convenu d’appeler le personnes d’horizons différents d’accomplir de personnalisation et par une implica «Web sémantique». Les données des une tâche à titre bénévole. On parle tion plus forte des utilisatrices et des autorités publiques ainsi que, le cas également de «coproduction» ou, en utilisateurs, ou des visiteuses et des échéant, celles d’entreprises privées, particulier dans le contexte de Wikipédia, de visiteurs respectivement, qui sont ap deviennent ainsi des ressources infras création collaborative de contenus. pelés à coproduire. tructurelles libres d’accès que des tiers 12 arbido 4 2013
Sie können auch lesen