Linked Open Data Big Data Alles vernetzt Tout en réseau Tutto in rete

Die Seite wird erstellt Lorenz Schuster
 
WEITER LESEN
Linked Open Data Big Data Alles vernetzt Tout en réseau Tutto in rete
Linked Open Data
Big Data
Alles vernetzt
Tout en réseau
Tutto in rete

Ausgabe 4     6. Dezember 2013

VSA   Verein Schweizerischer Archivarinnen und Archivare    AAS   Association des Archivistes Suisses    AAS   Associazione degli Archivisti Svizzeri
             BIS   Bibliothek Information Schweiz   BIS   Bibliothèque Information Suisse   BIS     Biblio­
                                                                                                          teca Informazione Svizzera
Linked Open Data Big Data Alles vernetzt Tout en réseau Tutto in rete
Linked Open Data Big Data Alles vernetzt Tout en réseau Tutto in rete
Inhalt / Sommaire
arbido print 4 / 13

03 Editorial D und F                      II.	Projekte und Initiativen aus        IV. Rezensionen / Recensions
                                               Bibliotheken und Archiven /
29 Impressum                                   Projets et initiatives dans le      38	Open Linked Data in Bibliotheken –
                                               domaine archive et bibliothèque         Herausforderungen beim
                                                                                       Aufbau eines «Linked Open
I.	Grundlagen und Perspektiven /         19	Die Bibliographic Framework              Data»-Systems
    Bases et perspectives                     Initiative (BIBFRAME) der Library        Stephan Holländer
                                              of Congress – Offene, verknüpfte
04	Dimensionen und Zusammen­                 Datensätze                           39	Big Data für Anfänger –
    hänge grosser, verknüpfter, offener       Bruno Wenk, HTW Chur                     ein Reiseführer für
    und wissenschaftlicher Daten                                                       «Nichtinformatiker»
    René Schneider, Haute Ecole de        22	Vom Projekt zum Produkt: Der             Eliane Blumer
    Gestion de Genève                         Linked Data Service der Deutschen
                                              Nationalbibliothek                   41	Eine interessante Einführung
07	Linked Open Data: quelles                 Julia Hauser,                            zu einer Vielzahl von Themen der
    ­nouvelles compétences pour les           Deutsche Nationalbibliothek              Informationswissenschaft
     professionnels de l’information?                                                  Stephan Holländer
     Jasmin Hügi et Nicolas Prongué,      25	opendata.admin.ch
    spécialistes en information                Andreas Kellerhals,
    documentaire                              ­Schweizerisches Bundesarchiv        V.	Aktualitäten / Actualités

09	«Daten öffnen, weltweit kooperie­     28	Inscrire les données du Service de   42	Anna Pia Maissen zum Abschied /
    ren» – Grosse Fragen, noch keine          la culture dans le Web pour mieux        Eloge de Anna Pia Maissen
    abschliessenden Antworten?                valoriser le patrimoine                  Gregor Egloff
    Vera Munch, freie Journalistin            Alain Dubois,
    und PR-Beraterin                          Archives de l’Etat du Valais         44	Bibliofreak – Freaks und Leiden­
                                                                                       schaften für Bibliotheken /
12	Les institutions patrimoniales        30	Linked Open Data in archivischen         ­Bibliofreak – Une campagne en
    suisses sont favorables à l’open          Fachinformationssystemen                  faveur des bibliothèques
    data                                      Peter Sandner, Hessisches                 Gerhard W. Matter
    Beat Estermann, Haute école               Hauptstaatsarchiv, Wiesbaden
    spécialisée bernoise                                                           46	BIS-Kongress in Lugano /
                                                                                       Congrès BIS à Lugano
15	Les applications basées               III.	Projektberichte aus der Hoch­          Katia Röthlin
    sur les LOD en bibliothèque:                schulforschung / Projets de
    un tour d’horizon                           recherches universitaires          47	Umfrage arbido / Sondage arbido
    Jasmin Hügi et Nicolas Prongué,                                                    Herbert Staub
    spécialistes en information           34	swissmetric.ch – neutrale, trans­
    documentaire                              parente und vergleichende Web­       48	Antonio Spadafora (1942–2013)
                                              analyse nicht nur für Bibliotheken
17	Alle Bibliotheken können die              Wolfgang Semar,
    Zukunft der Katalogisierung               SII Schweiz. Institut für
    gestalten                                 Informationswissenschaft
    Eliane Blumer, Haute Ecole
    de Gestion de Genève,                 36	Wissensvorsprung statt Datenflut
    Karsten Schuldt, HTW Chur                  mittels Web Monitoring und Web
                                               Intelligence
                                               Anton Weichselbraun,
                                               SII Schweiz. Institut für
                                              ­Informationswissenschaft

1                                         arbido 4 2013
Linked Open Data Big Data Alles vernetzt Tout en réseau Tutto in rete
Inserate/Annonces
                    • arbido newsletter
                    • arbido print
                    • arbido website
                    ➔ inserate@staempfli.com
                    ➔ 031 300 63 89

                    Abonnemente
                    • arbido print
                    ➔ abonnemente@staempfli.com
                    • arbido newsletter
                    ➔ www.arbido.ch

2   arbido 4 2013
Linked Open Data Big Data Alles vernetzt Tout en réseau Tutto in rete
Editorial
Linked Open Data und Big Data
Annkristin Schlichte, Stephan Holländer

Linked Open Data und Big Data werden ein integraler           Linked Open Data et Big Data deviendront une partie inté-
Bestandteil der zukünftigen Webinfrastruktur sein, in der     grante de la future infrastructure du Web, de grandes quan-
grosse Datenmengen verfügbar und via Uniform Resource         tités de données seront ainsi disponibles et pourront être
Identifiers (URI) identifiziert und vernetzt sind. Diese      identifiées et mises en réseau via Uniform Resource Iden-
­Entwicklung wird auch Auswirkungen auf Archive, Biblio­      tifiers (URI). Ce développement aura également des réper-
 theken und andere Informationseinrichtungen haben,           cussions sur les archives, les bibliothèques et d’autres struc-
 selbst wenn diese bisher erst in Ansätzen erkennbar sind     tures d’informations, même si ces impacts sont pour l’ins-
 und das Potenzial von Linked Open Data und Big Data hier     tant encore peu perceptibles et que le potentiel des Linked
 noch längst nicht ausgeschöpft ist.                          Open Data et Big Data n’est de loin pas encore vraiment
                                                              exploité.
«Linked Data» bezeichnet wohlstrukturierte, hoch konnek-
tive und syntaktisch interoperable Datensets, die über meh-   Les «Linked Data» désignent des ensembles de données bien
rere Repositorien innerhalb einer Organisation oder orga-     structurés, reliés entre eux et présentant une inter-opérabi-
nisationsübergreifend verteilt sind. In den vergangenen       lité syntaxiques; ces ensembles de données sont répartis sur
Jahren haben diverse kommerzielle und nichtkommerzielle       plusieurs répertoires au sein d’une organisation ou entre
Initiativen begonnen, Linked Open Data für die kostengüns-    plusieurs organisations. Diverses initiatives commerciales
tige Akquise, Anreicherung, Disambiguierung (d.h. die Auf-    ou non ont été lancées ces dernières années dans le but
lösung von sprachlichen Mehrdeutigkeiten) und Veröffent-      d’utiliser les Linked Open Data pour l’acquisition bon mar-
lichung von Daten zu nutzen und so Einsparungen bei           ché, l’enrichissement et la publication de données et parve-
der Datenintegration und der Verbesserung der Qualität        nir ainsi à des économies au niveau de l’intégration de ces
und Zugänglichkeit von Daten zu erzielen. Dies gibt auch      mêmes données, d’en améliorer la qualité et l’accessibilité.
Archiven und Bibliotheken neue Möglichkeiten, ihre Be-        Voilà qui donne également aux archives et aux bibliothèques
stände im Kontext des World Wide Webs zu erschliessen         de nouvelles possibilités de mettre en valeur et de cataloguer
und zu katalogisieren.                                        leurs fonds dans le contexte du World Wide Web.
     In einem aktuellen Heft zur Thematik der Linked Open          Ce numéro d’arbido consacré aux Linked Open Data
Data darf aber auch das Thema Big Data nicht fehlen. Da-      aborde également le thème des Big Data. Les Big Data sont
runter werden all jene Datensets verstanden, deren Bewirt-    des ensembles de données qui deviennent tellement volu-
schaftung aufgrund des grossen Datenvolumens durch kon-       mineux qu’il n’est plus possible de travailler au moyen des
ventionelle Softwaretools und Methoden nicht bewältigt        outils et des méthodes classiques de gestion des données.
werden kann. Es deutet alles darauf hin, dass unter diesem    Tout indique que ce concept traduit l’importance croissante
Begriff die zunehmende Bedeutung von Daten als Faktor der     des données comme facteurs de création de valeur ajoutée.
Wertschöpfung zusammengefasst wird. Obwohl «Big Data»         Bien que les «Big Data» prennent des formes différentes
je nach Institution unterschiedliche Erscheinungsformen       selon les institutions, la capacité d’analyser et de gérer de
haben, wird die Fähigkeit zur Analyse und Verwaltung von      très grandes quantités de données deviendra une compé-
sehr grossen Datenmengen zu einer Schlüsselkompetenz im       tence clé et un critère de concurrence.
Umgang mit Daten und zu einem Wettbewerbskriterium.                Familiarisez-vous donc, en lisant ce numéro, avec les
     Informieren Sie sich daher im vorliegenden Heft über     concepts de Linked Open Data et de Big Data; peut-être que
die Konzepte von Linked Open Data und Big Data und lassen     les projets qui y sont présentés vous inspireront!
Sie sich inspirieren von den vorgestellten Projekten!

3                                         arbido 4 2013
I. Grundlagen und Perspektiven

Dimensionen und Zusammenhänge grosser,
verknüpfter, offener und wissenschaftlicher Daten
René Schneider, Haute Ecole de                       intensiven wissenschaftlichen Entde­       und die damit verbundenen Aufgaben
Gestion de Genève                                    ckung verkündet.                           einzustellen.
                                                          Aber was heisst das eigentlich?
Nachdem die Flut der Diskussionen,                   Sind die übrigen Paradigmen der Wis­       Big Data
Kommentare und Prophezeiungen das                    senschaftsgeschichte damit bedeu­          Den grössten Block (im doppelten
Social Web betreffend nun verebbt ist,               tungslos geworden? Und wie verhält es      Sinn) machen dabei die gemeinhin un­
bricht bereits die neue Flutwelle über die           sich mit dem Kontext der Daten, durch      ter Big Data subsumierten Datensätze
Dämme und überspült uns mit dem, was                 den sie normalerweise zu Information       aus, von deren Existenz und Konse­
im Social Web und anderswo in Massen                 werden? Oder sind Daten nicht mehr         quenz mittlerweile auch die Normal­
ohne Unterlass und Überlegung produ-                 gleich Daten? Und was heisst dies für      bürger erfahren haben, was insofern
ziert wird: Daten!                                   Bibliotheken, Archive und Dokumenta­       gut ist, da sie selbst zu den Hauptpro­
                                                     tionszentren? Sind sie oder ihre Daten     duzenten, bedauerlicherweise aber
Einleitung                                           betroffen? Ergeben sich neue Arbeits­      nicht zu den Nutzern gehören. Big
Man gewinnt nicht nur den Eindruck,                  aufträge für sie oder werden sie von       Data wurde dabei letztlich durch zwei
dass die verhältnismässig alte Bezeich­              einem weiteren Bedeutungsverlust be­       Phänomene möglich: erstens die wei­
nung der elektronischen Datenverar­                  troffen sein?                              ter-hin exponentiell steigende Leis­
beitung eine ganz neue Bedeutung er­                      Im Folgenden soll versucht wer­       tungsfähigkeit der Prozessoren sowie
halten hat, sondern dass die Daten                   den, diese Fragen einzugrenzen und         die damit parallel verlaufende Steige­
gleichsam selbst zu Information ge­                  entsprechend dem derzeitigen Stande        rung der Speicherkapazitäten der Rech­
worden sind, auch wenn dies auf den                  der Dinge zu beantworten. Dies soll        ner, zweitens durch den Anstieg der
ersten Blick als widersinnig erscheinen              anhand dreier unterschiedlicher Da­        täglich bzw. sekündlich produzierten
mag. Dieser paradoxe Eindruck ver­                   tentypen illustriert werden, die derzeit   und aufgezeichneten Datenmengen,
stärkt sich jedoch, wenn in einflussrei­             unterschiedlich stark diskutiert wer­      die allerorts durch die Vernetzung der
chen Kreisen nicht mehr vom Informa­                 den, sich trotz ihrer Unterschiede aber    Endgeräte (vom Grossrechner bis zum
tionszeitalter gesprochen wird, son­                 an einzelnen Punkten berühren bzw. in      Smart­phone und den darauf befindli­
dern vom Zeitalter der Daten. So wird                unterschiedlicher Beziehung zueinan­       chen Apps) ins Web eingespeist und
bereits ein neues und viertes wissen­                der stehen: Big Data, Linked Open          von dort weiterverarbeitet werden. Ge­
schaftliches Paradigma1 heraufbeschwo­               Data und Research Data (d.h. grosse        speichert wird dabei alles, was geht:
ren und nach den wissenschaftstheore­                Datenmengen, verknüpfte und offene         Daten, mit oder ohne Metadaten, oder
tischen Vorläufern der empirischen                   Datenmengen sowie Forschungsda­            die Metadaten alleine, aus denen sich
Beschreibung von Naturphänomenen                     ten). Diese dreifache Auffächerung von     ja streng genommen der eigentliche
(1. Paradigma), der theoretischen Ge­                Datenverarbeitungsinitiativen beant­       Kontext der Daten bzw. ihr Verständnis
neralisierung (2. Paradigma) und der                 wortet bereits unmittelbar eine der wei­   ergibt. Entscheidend ist aber, dass aus
computerbasierten Simulation (3. Para­               ter oben formulierten Fragen und zeigt,    diesen Daten ein neuer Kontext erzeugt
digma) nun das Zeitalter der daten-                                                             wird und zwar mithilfe spezieller Algo­
                                                     Die Informationswissenschaft und alle      rithmen, genauer mit sogenannten In­
                                                     damit verbundenen Institutionen ste-       ferenzmechanismen, also Schlussfol­
1   Jim Gray on e-Science: «A transformed            hen damit auch vor der Herausforde-        gerungsregeln der Maschinen, die sie
    Scientific Method», in: Hey, Tony, Tansley,      rung, sich auf diese Daten und die damit   verwalten und bearbeiten. In den
    Stewart, Tolle, Kristin: The Fourth Paradigm:    verbundenen Aufgaben einzustellen.         Schlussfolgerungsregeln des Big Data
    Data Intensive Scientific Discovery. Microsoft                                              werden orthogonale, d.h. prinzipiell
    Corporation. 2009, S. xviii http://research.                                                voneinander unabhängige Merkmale
    microsoft.com/en-us/collaboration/                                                          miteinander verknüpft, um neue oder
    fourthparadigm/4th_paradigm_book_com-            dass Daten wirklich nicht mehr gleich      bis dahin unbekannte Zusammenhän­
    plete_lr.pdf                                     Daten sind. Die Informationswissen­        ge aufzuzeigen2. Mit dieser an und für
2 Dietmar Dath, Ranga Yogeshwar (2013):              schaft und alle damit verbundenen In-      sich recht einfachen Vorgehensweise,
    «Rechnen Sie damit, lebenslang ein               stitutionen stehen damit auch vor der      die von Menschen täglich bewusst oder
    Verdächtiger zu sein», FAZ vom 12.7.2013.        Herausforderung, sich auf diese Daten      unbewusst ausgeführt wird, stellt sich

4                                                    arbido 4 2013
der einfache, und von daher sehr er­       sie räsonieren kann. Wiederum geht es      bar werden. In einigen Disziplinen gibt
folgsversprechende Business Case von       also nicht um kognitive Prozesse von       es parallel dazu bereits «Peer Reviewed
Big Data dar, der nun aber von den Ma­     Menschen, sondern darum, diese in          Data Paper», die allein die Datensätze
schinen ausgeführt wird. Damit sollte      Rechnern zu repräsentieren und zu si­      enthalten.
auch klar sein, dass hinter Big Data zu    mulieren und den Maschinen zu erlau­            Was das spezielle Verhältnis von
einem sehr grossen Teil wirtschaftliche    ben, selbstständig Rückschlüsse aus        Forschungsdaten zu Big und Linked
oder andere Interessen stehen, die         den verknüpften Daten zu ziehen.           Open Data betrifft, lässt sich sagen,
nicht primär im Interesse der Produ­                                                  dass sie – etwa im Fall des Large Hadron
zenten sind, auch wenn die ethischen       Forschungsdaten                            Colliders – sehr gross sein können. Sie
Implikationen an dieser Stelle nicht       Etwas im Abseits dieser grossen Bewe­      können auch mit LOD verknüpft und
ausgeführt werden sollen.                  gungen findet – auf den Bereich der        angereichert werden, müssen es aber
                                           Wissenschaften beschränkt – seit eini­     nicht.
Linked Open Data (LOD)                     gen Jahren eine weitere Diskussion              Dabei sollte nicht ausser Acht ge­
Eher unabhängig davon verläuft die         statt, die die sogenannten Forschungs­     lassen werden, dass bei den For­
Linked-Open-Data-Initiative3. Unab­        daten zum Hauptgegenstand des Inte­        schungsdaten eine ganz andere grund­
hängig in dem Sinne, dass die hier ver­    resses gemacht hat.                        sätzliche Frage im Vordergrund steht:
knüpften (Linked) und veröffentlichten          Die gesamten Anstrengungen las­       wie bewahren wir (Roh-)Daten langfris­
(Open) Datensätze nicht notwendiger­       sen sich sehr gut an zwei grundlegen­      tig auf, sodass sie uns zu einem späte­
weise eine Teilmenge der grossen (Big)     den Modellen illustrieren: dem Modell      ren Zeitpunkt zur Nachnutzung wieder
Daten sind, im Gegenteil: Der Um­          des Datenlebenszyklus4, das von ersten
stand, dass LOD die gemeinnützige          Projektideen über die Ablage und dau­      Der grösste Vorteil für den Forscher er-
Publikation sowie eine Verknüpfung         erhafte Speicherung von Datensätzen        gibt sich daraus, dass die Datensätze
zur Conditio sine qua non macht,           bis hin zu deren Integration in Publi­     selbst, d.h. die Primärdaten, zitier- und
schliesst den orthogonalen Charakter       kationen und deren Zitation reicht, und    publizierbar werden.
der grossen Datensätze aus und eröff­      dem Modell für das Datenkontinuum5,
net eine ganz andere Sichtweise. Im        das eine kontinuierliche Weitergabe
Gegensatz zu Big Data beschränkt sich      und den Austausch der Daten garantie­
LOD auf Daten, die im Web zur Verfü­       ren soll und zwar unabhängig davon,        problemlos zur Verfügung stehen? Es
gung gestellt werden, und nicht in ir­     ob es sich um Rohdaten, strukturierte      geht also in erster Linie um ganz grund­
gendwelchen nichtöffentlichen Daten­       Daten, Metadaten oder die in späteren      sätzliche Fragen der Archivierung, der
banken oder Clouds gespeichert wer­        Publikationen eingebundenen Daten          Kompatibilität und der Interoperabili­
den. Des Weiteren ist ihr Umfang, trotz    handelt. Der Mehrwert für den For­         tät, im Grunde also um Fragen, die auch
der an und für sich unvorstellbaren        scher und die Öffentlichkeit ergibt sich   die Bereiche der grossen und der ver­
Menge der Daten, die die LOD-Cloud         daraus, dass beide quasi uneinge­          knüpften Datenmengen irgendwann
mittlerweile enthält, vergleichsweise      schränkt und über alle Soft- und Hard­     betreffen könnten. Man kann sich aber
klein.                                     warewechsel Zugang zu diesen Daten         auch nicht des Eindrucks erwehren,
     Im Rahmen von Linked Open Data                                                   dass gerade in der Debatte um die For­
soll ein Grundproblem gelöst werden,       Der eigentliche Mehrwert von Linked        schungsdaten so prinzipielle Fragen
das darin besteht, dass der grösste Teil   Open Data besteht also darin, dass sie     angegangen werden, dass den Beteilig­
des Wissens, das im Web publiziert         die Relationen aller Datenbanken in ein    ten noch gar nicht genau klar ist, wie
wird, in relationalen Datenbanken ge­      einheitliches Format überführen, was       diese gelöst werden sollen, auch wenn
speichert, aber nur einem sehr flachen     dazu führen kann, dass die Maschine        es zumindest in einzelnen Disziplinen
Format (genauer: HTML, der Hypertext       über sie räsonieren kann.                  bereits Lösungsansätze bzw. respekta­
Markup Language) repräsentiert wird.                                                  ble Lösungsvorschläge gibt.
Dies führt dazu, dass die ursprünglich
gesetzten Relationen verloren gehen
und eine direkte Kommunikation (im         für eine Nachnutzung oder Überprü­         3 Bizer, Christian, Tom Heath, and Tim
Sinne eines reziproken Verständnis­        fung haben. Auch wenn man davon               Berners-Lee (2009). «Linked data-the story
ses) zwischen den Datenbanken nicht        ausgehen kann, dass sich das Interesse        so far.» International Journal on Semantic
möglich ist. Dieses Problem wird nun       dafür sowohl bei den meisten For­             Web and Information Systems (IJSWIS) 5.3,
dadurch gelöst, dass eine neue Daten-      schern als auch der Gesellschaft, die         1–22.
ebene eingeführt wird, die Auskunft        diese Forschung finanziert, in Grenzen     4 Sarah Higgins (2008): «The DCC Curation
über die semantischen Relationen gibt.     hält, wird eine Sicherung der For­            Lifecycle Model». International Journal of
Der eigentliche Mehrwert von Linked        schungsdaten mittlerweile zu den gu­          Digital Curation 3(1), 134–148.
Open Data besteht also darin, dass sie     ten und festen Regeln für eine transpa­    5 Andrew Treloar (2011): Private Research,
die Relationen aller Datenbanken in ein    rente Forschung gezählt. Der grösste          Shared Research, Publication, and the
einheitliches Format überführen, was       Vorteil für den Forscher ergibt sich          Boundary Transitions. http://andrew.treloar.
– genau wie im Fall von Big Data – da­     daraus, dass die Datensätze selbst, d.h.      net/research/diagrams/data_curation_conti-
zu führen kann, dass die Maschine über     die Primärdaten, zitier- und publizier­       nuum.pdf

5                                          arbido 4 2013
Bibliotheken und Daten: eine neue und                  Ähnlich verhält es sich mit den For­   serweise Parallelen zu den drei Dimen­
notwendige Herausforderung                        schungsdaten, auch wenn hierbei we­         sionen der Zeit erkennen, die Augusti­
Bleibt die Frage nach der Rolle der In-           niger die Katalogisierenden als viel­       nus im elften Buch der Confessiones in
stitutionen, die traditionell mit diesen          mehr die Kollegen aus dem Bereich des       seiner Reflektion über das Wesen der
Fragen beschäftigt waren. Zuvorderst              E-Publishing sowie die Betreiber der        Zeit entwickelte. Interessanterweise
handelt es sich dabei um die Bibliothe­           Open-Access-Plattformen eine Rolle          sprach er nicht allein von Praeteritum,
ken, auch wenn die Archive und Doku­              spielen werden. Ihre Aufgabe wird es        Praesens und Futurum, sondern von
mentationszentren in einzelnen Berei­             sein, neben den Langzeitarchivaren          «praesens de praeteritis memoria, pra­
chen ein Wort mitsprechen könnten,                und im Verbund mit den Datenzentren         esens de praesentibus contuitus, pra­
sofern ihre Expertise noch gefragt ist.           die Datensätze, so gross oder (eher)        esens de futuris expectatio»6, d.h., er
     Die grossen Datenmengen (Big Da­             klein sie auch sein mögen, mit einer        assoziierte die Erfahrung der Zeit mit
ta) können die Bibliotheken, Archive              persistenten Adressierbarkeit für eine      drei zentralen Begriffen: Memoria (Er­
und Dokumentationszentren schnell                 Nachnutzung, Nanopublikation oder           innerung), Contuitus (Betrachtung)
ausser Acht lassen, auch wenn sie tra­            -zitation zur Verfügung zu stellen.         und Expectatio (Erwartung).
ditionell damit beauftragt waren, grös-                                                            So mag es für ein grundlegendes
sere Informationsmengen aufzube­                  Erinnerung, Betrachtung, Erwartung          Verständnis hilfreich sein, die unter­
wahren. An Big Data zeigt sich viel­              Festzuhalten bleibt, dass es insgesamt      schiedlichen Konzepte zum Umgang
mehr, wie schnelllebig die Zeitläufte             sehr unterschiedliche Vorstellungen         mit Daten schlussendlich mithilfe die­
geworden sind. Wähnten sich die Bib­              vom Umgang mit Daten gibt, die der­         ser drei Dimensionen zu begreifen: der
liotheken (zumindest einige erlauchte             zeit in drei unterschiedlich grossen Ini­   Memoria entsprechen die Bemüh-
unter ihnen) bis vor Kurzem noch an               tiativen angegangen und diskutiert          ungen um die Archivierung und
vorderster Front in der grössten Digita­          werden, wobei durchaus Berührungs­          Nachnutzung von Daten; die LOD-Ini­
lisierungsinitiative und durften sie sich         punkte bestehen. Das gegenwärtige           tiative zeigt das Bemühen, eine Daten­
noch als strategisch wichtige Datenlie­           Bild der Dateninitiativen zeigt sich so     schicht für die gegenwärtige Betrach­
feranten der erfolgreichsten Suchma­              dynamisch, dass derzeit nicht antizi­       tung, also den Contuitus, aufzubauen;
schine ansehen, müssen sie nunmehr                                                            die Bestrebungen von Big Data entspre­
erkennen, dass sie vom Gehilfen des               Aus dieser Perspektive betrachtet, las-     chen schliesslich dem Wunsch, die
globalen Players zum staunenden Be­               sen sich kurioserweise Parallelen zu den    Handlungs- und Gedankenwege ande­
trachter noch weitaus grösserer Daten­            drei Dimensionen der Zeit erkennen, die     rer vorherzusagen.
verwalter geworden sind.                          Augustinus im elften Buch der Confes-            Nicht umsonst begann die Wissen­
     Anders verhält es sich bei der               siones in seiner Reflektion über das We-    schaft der Daten mit Euklids Geomet­
Linked-Open-Data-Initiative. Sollten die          sen der Zeit entwickelte.                   rie, in denen zum ersten Mal von «De­
Bibliotheken und ihre Katalogisie­                                                            domena» (dem Gegebenen)7 die Rede
rungsabteilungen sowie die Verbund­                                                           ist, die in der ersten Übersetzung ins
zentren dazu bereit sein, würde sich                                                          Lateinische eben mit dem Wort Data
Linked Open Data als der notwendige,              pierbar ist, ob die Dateninitiativen wei­   wiedergegeben wurden. Euklid sah als
wenn nicht sogar zwingende kommen­                ter zersplittern, konvergieren oder etwa    Dedomena jenes Gegebene an, aus
de Schritt darstellen, um die Kataloge            zu einem Schichtenmodell zueinander         dem sich gesuchte, d.h. nicht bekannt
in ein Format zu bringen, von dem de­             finden können.                              geometrische Zusammenhänge er­
ren Anbieter selbst, aber auch viele an­                                                      schliessen lassen. Nichts anderes ist –
dere profitieren können. Schlussend­              Die reine Betrachtung der Gegenwart         wenn wir den geometrischen Zusam­
lich könnten damit – neben vielen an­             liefert aber noch keine Antworten auf       menhang beiseitelassen – bei Big Data
deren positiven Seiteneffekten und                die zwei grundlegenden Fragen: Wa­          und Linked Open Data der Fall. Hier ist
neuen Nutzungsformen der Katalogda­               rum heben wir die Daten eigentlich          der Zusammenhang so einfach wie of­
ten – vor allen Dingen die Probleme der           auf? Und: Warum interessieren wir uns       fensichtlich.
Konvergenz unterschiedlicher Ver­                 so sehr für sie? Diese zwei Fragen las­
bunddaten sowie die komplizierten Be­             sen sich letztlich mit ganz grundsätzli­    Wir sollten dabei auch nicht vergessen,
mühungen für die Erstellung standar­              chen menschlichen Bedürfnissen be­          dass seit Anbeginn der Wissenschafts­
disierter Metakataloge ein Ende haben.            antworten: erstens einem eher rück­         geschichte praktisch alle namhaften
                                                  wärtsgewandten Bedürfnis, nämlich           Forscher darum bemüht waren, die Zu­
                                                  dem Sammeln und dem daraus resul­           kunft vorherzusagen, mit welchen Mit­
6 Augustinus, Confessiones, XI, 20, 26, http://   tierenden Bedürfnis nach Erinnerung,        teln auch immer. Auch wenn wir es
    www9.georgetown.edu/faculty/jod/              zweitens mit der Organisation bzw. der      heute nicht mehr wahrhaben wollen,
    latinconf/11.html                             Repräsentation von Wissen, um es im­        schrieb Newton, der gerne als Vater der
7 Jakob Voss (2013): «Was sind eigentlich         mer, d.h. gegenwärtig, zur Verfügung        modernen Wissenschaften angesehen
    Daten?» Libreas. Library Ideas, 23, http://   zur haben, und drittens dem eher vor­       wird, und darauf verwies «auf den
    libreas.eu/ausgabe23/02voss                   wärtsgewandten Wunsch, Zukünftiges          Schultern von Giganten» zu stehen,
8 John Freely (2009): Aladdin’s Lamp, Alfred E.   vorhersagen zu können. Aus dieser Per­      mehrere Bücher zur Prophetie und der
    Knopf, New York.                              spektive betrachtet, lassen sich kurio­     Alchimie8.

6                                                 arbido 4 2013
Diese beiden alles überragenden
Interessen (Prophetie und Alchimie)            ABSTRACT
führten letztlich zum Entstehen der                          Les grandes quantités de données ouvertes, scientifiques et reliées entre elles: dimensions
ungleichen Schwestern Astronomie                             et contextes
und Astrologie sowie der Ablösung der                        Mais que peuvent donc signifier ces énormes quantités de données ouvertes et reliées
Alchimie durch die Chemie. Wissen­                           entre elles? Les autres paradigmes de l’histoire de la science sont-ils donc devenus
schaftstheoretisch würde sich die gan­                       obsolètes? OU bien les données ne sont-elles plus des données? Et qu’est-ce que cela
ze Diskussion um Daten also als nichts                       signifie pour les bibliothèques, les archives et les centres de documentation? Sont-ils
Weiteres herausstellen als die Suche                         concernés ou est-ce leurs données qui le sont? En résulte-t-il de nouvelles tâches pour
nach dem Beweis, dass Prophetie nichts                       ces institutions ou leur importance s’en trouvera-t-il amoindrie?
anderes als ein ganz rationales und be­                      Dans cet article, l’auteur tente de cerner ces questions et d’y répondre. Il le fait en
rechenbares Unterfangen ist.                                 discutant de trois types de données qui, malgré leurs différences, ont quelques points
                                                             communs qui les relient d’une certaine manière, à savoir: big data, linked open data et
Kontakt: rene.schneider@hesge.ch                             research data (c.à.d. de grandes quantités de données ouvertes et reliées entre elles
                                                             ainsi que des données de recherche). Ce triptyque d’initiatives de traitement des don-
                                                             nées répond d’ores et déjà à l’une des questions formulées ci-dessus et montre que les
                                                             données ne sont plus tout à fait des données. Les sciences de l’information et toutes
                                                             les institutions qui y sont liées se trouvent donc face à un défi: maîtriser ces données
                                                             et les tâches qu’elles induisent.                                        (traduction: sg)

Linked Open Data: quelles nouvelles compétences
pour les professionnels de l’information?
Jasmin Hügi et Nicolas Prongué,                  Concernant les LOD en biblio­                        Offres d’emploi et avis d’experts
spécialistes en information                  thèque, encore très peu d’études ont été                 Le Web des données et les LOD repré­
documentaire                                 réalisées pour identifier les compé­                     sentent un sujet très technique, avec
                                             tences qui devraient être enseignées                     lequel les frontières entre le métier
Les LOD ne représentent pas la première      aux futurs professionnels de l’informa­                  d’informaticien et celui de profession­
thématique qui remet en question les         tion. Deux projets méritent d’être men­                  nel de l’information s’estompent.
compétences voire la formation des pro-      tionnés dans ce contexte-là. D’une part,                 L’étude qui est présentée dans cet article
fessionnels de l’information. Ces der-       un curriculum concernant les LOD en                      vise à identifier les compétences priori­
nières années, la littérature scientifique   général a été développé pour le projet                   taires à acquérir pour qu’un profession­
a proposé des réflexions par rapport à       EUCLID4, sans considérer les institu­                    nel de l’information puisse travailler
des programmes d’études en lien avec         tions culturelles. Sur la base de ce cur­
les bibliothèques numériques1, la «Digi-     riculum, des matériels d’apprentissage
tal Curation» (gestion des actifs numé-      sous forme de webinars, de tutoriels et                  1   POMERANTZ, Jeffrey, et al. 2006. Curricu-
riques)2 ainsi qu’avec la gestion de don-    d’un cahier d’accompagnement ont été                         lum development for digital libraries.
nées de recherche3.                          élaborés et mis à disposition en ligne.                      Proceedings of the 6th ACM/IEEE-CS joint
                                             Afin de définir les connaissances néces­                     conference on Digital libraries. New York, NY,
Des études concernant les nouvelles          saires pour travailler quotidiennement                       USA: ACM. DOI: 10.1145/1141753.1141787.
compétences des bibliothécaires              avec les LOD, des experts de différentes                 2 YAKEL, Elizabeth, et al. 2011. Digital Curation
Les LOD ne représentent pas la pre­          industries ont été interrogés. D’autre                       for Digital Natives. Journal of Education for
mière thématique qui remet en ques­          part, le projet Learning Linked Data5                        Library & Information Science. Vol. 52, no. 1,
tion les compétences voire la formation      s’est focalisé spécifiquement sur les                        p. 23–31.
des professionnels de l’information.         besoins des professionnels de l’infor­                   3 STANTON, Jeffrey M., et al. 2011. Education
Ces dernières années, la littérature         mation. Ce projet, qui s’est terminé en                      for eScience Professionals: Job Analysis,
scientifique a proposé des réflexions        septembre 2012, avait pour but de faire                      Curriculum Guidance, and Program
par rapport à des programmes d’études        un répertoire des sujets d’apprentis­                        Considerations. Journal of Education for
en lien avec les bibliothèques numé­         sage afin de développer une plate-forme                      Library and Information Science. Vol. 52, no.
riques, la «Digital Curation» (gestion       soutenant les enseignants et les étu­                        2, p. 79.
des actifs numériques) ainsi qu’avec la      diants dans l’interprétation et la créa­                 4 www.euclid-project.eu/
gestion de données de recherche.             tion des données.                                        5   http://lld.ischool.uw.edu/wp/

7                                            arbido 4 2013
avec des LOD en bibliothèque. Pour                   ces connaissances est nécessaire afin de          Programmation
ceci, des offres d’emploi trouvées en                savoir créer et attribuer des URIs aux            Certains experts interrogés ont évoqué
Suisse, en Allemagne, en Autriche et en              triplets, les publier en ligne ainsi que          la connaissance basique d’au moins un
France ainsi que des avis d’experts in­              créer des interfaces web pour que les             langage de programmation (Java, Ruby,
ternationaux ont été analysés afin de                utilisateurs puissent interagir avec.             PERL, etc.) comme compétence néces­
dresser un premier constat. Seules les                                                                 saire. Cela servirait avant tout de moyen
offres d’emploi exigeant un diplôme en               Triplets                                          de communication avec les informati­
science de l’information, en plus des                En troisième position arrivent les com­           ciens. Ces connaissances peuvent éga­
compétences liées aux LOD, ont été                   pétences en lien avec les triplets, c’est-        lement être utiles pour la programma­
retenues. Quant aux experts, ils de­                 à-dire la connaissance des spécifica­             tion de codes simples qui permettent la
vaient, pour être sélectionnés, avoir                tions RDF émises par le W3C, qui repré­           conversion en masse de données en
étudié les sciences de l’information ou              sentent la base pour la création de tri­          LOD.
avoir travaillé en tant que bibliothé­               plets. Il est également important de
caire, en plus de leur expérience en                 savoir développer et modéliser un                 Technologies du Web sémantique
LOD6. Au final, huit offres d’emploi et              graphe qui peut être appliqué aux don­            Les données organisées en triplets né­
douze réponses d’experts ont été prises              nées. Puisque les triplets peuvent être           cessitent une base de données spéci­
en compte.                                           exprimés à travers différentes syntaxes           fique (un «triple store»), un langage
                                                     (RDF/XML, Notation 3, etc.), il est utile         d’interrogation spécifique (SPARQL) et
Huit compétences-clés                                de comprendre ces dernières ou de                 une interface d’interrogation spéci­
La nature technique des LOD avait une                connaître des outils qui peuvent les pro­         fique (SPARQL Endpoint). La maîtrise
certaine influence sur les réponses.                 duire.                                            de ces technologies est fortement sou­
Ainsi, ces dernières mentionnent beau­                                                                 haitée pour travailler avec les LOD.
coup de détails techniques, tels que des             Web sémantique et Linked Data
langages, des formats ou encore des                  Il s’agit de connaître les principes émis         XML
logiciels. L’analyse du contenu des                  par le W3C et par Tim Berners-Lee,                Enfin, dernier élément mais non des
offres d’emploi et des réponses a per­               ainsi que leurs objectifs. Cette catégorie        moindres, des connaissances de XML
mis d’identifier plus de 40 éléments de              inclut également la compréhension                 et des langages annexes comme XSLT
compétence différents. La figure 1 pré­              basique de l’inférence ou du raisonne­            ont été mentionnées dans les cas ana­
sente les compétences qui apparaissent               ment, par exemple.                                lysés. XML est à la base de nombreux
dans le nombre de cas le plus élevé7.                                                                  standards du Web sémantique, et il est
                                                     Standards de catalogage                           donc indispensable de comprendre et
Ontologies et métadonnées                            Les compétences concernant les stan­              de savoir exploiter des données structu­
Dans cette première catégorie, il s’agit             dards de catalogage sont essentielles             rées en XML.
de connaître des schémas de métadon­                 dans un projet LOD, car pour transfor­
nées tels que Dublin Core, savoir éva­               mer des données en triplets, il faut bien         Un monde changeant
luer et choisir un élément de métadon­               connaître les données de base. Il s’agit          Le travail avec des LOD en bibliothèque
nées pour l’appliquer à ses propres                  donc de comprendre les règles de saisie           nécessite visiblement des compétences
données, savoir créer des vocabulaires               des données (telles que les AACR2), le            très spécifiques et au premier abord,
contrôlés ainsi que des ontologies, et               format d’enregistrement (tel que                  cela peut sembler intimidant. Néan­
savoir effectuer un alignement de deux               MARC), ainsi que le fonctionnement                moins, il est important de noter que les
vocabulaires différents.                             du SIGB utilisé (tel que Virtua).                 compétences déjà existantes parmi les

Développement web
Cet élément englobe des connaissances
concernant le fonctionnement des pro­
tocoles web et des serveurs, ainsi que les
principes du Web design. La maîtrise de

6 La méthodologie sera expliquée en détail
    dans un rapport qui paraîtra à la fin de cette
    année.
7 Pour donner un exemple: si une compétence
    est mentionnée dans chacun des 20 cas, la
    compétence a une haute priorité. Si une
    compétence n’apparaît que dans un seul cas,
    sa priorité est basse (même si la compétence
    est mentionnée très souvent à l’intérieur du
    cas).                                            Figure: Compétences les plus mentionnées dans les 20 cas

8                                                    arbido 4 2013
professionnels de l’information se re­        ment liées au Web sémantique (prin­                    giques. Des cours de formation conti­
trouvent tout à fait dans les éléments        cipes, standards et technologies). Selon               nue sont par ailleurs à mettre en place
cités dans le diagramme. Ainsi, la pre­       nous, l’enseignement de ces compé­                     pour que les professionnels sur le ter­
mière compétence touche aux ontolo­           tences devrait être inclus dans le curri­              rain puissent eux aussi se former aux
gies et aux métadonnées, qui sont utili­      culum des professionnels de l’informa­                 LOD. En effet, le Web sémantique est
sées pour la description des ressources,      tion. Une introduction obligatoire à la                bien plus qu’une tendance, et le monde
et ceci a toujours fait partie des connais­   thématique ainsi que des cours à choix                 des bibliothèques ne peut se permettre
sances de base des professionnels de          devraient être dispensés au niveau ba­                 d’attendre.
l’information. Concernant les standards       chelor, alors que les étudiants au ni­
de catalogage, il est inutile d’évoquer       veau master devraient atteindre une
que cela appartient à la bibliothécono­       compréhension globale afin d’être ca­                  Contact: nicolas.prongue@etu.hesge.ch
mie. En outre, les formations de bache­       pables de prendre des décisions straté­                         jasmin.hugi@hesge.ch
lor en information documentaire en
Suisse contiennent des modules d’en­
seignement de développement web et
de XML. Par rapport à la programma­             ABSTRACT
tion, la frontière entre informaticien et                     Linked Open Data – Welche neuen Kenntnisse brauchen I&D-Fachleute auf diesem Gebiet.
professionnel de l’information se                             Die Linked Open Data (LOD) verbreiten sich progressiv in der kulturellen Domäne.
montre fluctuante, et l’attribution de                        Eine wachsende Anzahl an Projekten entstehen in Institutionen und LOD-Applikationen
cette compétence à l’un des deux mé­                          halten Einzug in Bibliotheken. Dieser Einzug stellt gewisse Kompetenzen der I&D Fach-
tiers représente un sujet de discussion.                      leute infrage, stärkt andere und erfordert neue Kenntnisse und neues Know-how. Dieser
                                                              Artikel präsentiert die Resultate einer Studie, die zum Ziel hat, diese neuen Kompeten-
Ce qui manque réellement en ce mo­                            zen, die sich I&D-Fachleute angesichts LOD aneignen müssen, zu bestimmen.
ment, ce sont les compétences stricte­

«Daten öffnen, weltweit kooperieren»
Grosse Fragen, noch keine abschliessenden Antworten
Vera Münch,                                   Soll man seine Daten wirklich für die
freie Journalistin und PR-Beraterin           ganze Welt öffnen? Wie sichert man in
                                              einer völlig offenen Welt die nationalen
Die neuen Möglichkeiten der nahezu un-        Interessen, wie die des eigenen Hau­
begrenzten Verlinkung von Daten, die Ag-      ses? Wer sorgt für eine vernünftige,
gregation und Analyse riesiger Datenmen-      nachhaltige Ordnung in der Datenabla­
gen – diskutiert unter den Überbegriffen      ge, der Datenverknüpfung und der In­
Big Data, Linked Data und Linked Open         formationspräsentation? Wie kann
Data (LOD) – bieten Bibliotheken völlig       man es als Bibliothek schaffen, mit dem
neue Chancen, ihre Bestände und beson-        atemberaubenden         Forschungsfort­
deren Angebote international sichtbar zu      schritt mitzuhalten? Viele grosse Fra­
machen. Die neue Technik des Cloud Com-       gen, auf die es heute noch keine ab­
putings, also der Bereitstellung und Nut-     schliessenden Antworten gibt.
zung von Software, Rechen- und Speicher-
kapazitäten als Onlinedienstleistung, er-     Globale Clouds: Problemlösung oder
möglicht es zudem, Routinearbeiten im         Herstellerabhängigkeit?                                   Portrait
eigenen Haus zu reduzieren und sie statt-     Als eine der ersten Bibliotheken in Eu­                   Vera Münch (55), Hildesheim (D) begleitet als
dessen durch Automatisierung, Vernet-         ropa hat die Universität Tilburg Ser-                     freie Journalistin und PR-Beraterin für wis-
zung und Abgleich von z.B. Katalogen und      vices der cloudbasierten Softwareinfra­                   senschaftliche Einrichtungen die Entwick-
Metadaten auf viele Schultern in der Bib-     struktur WorldShare™ Management                           lungen in der Fachinformation und im Biblio-
liothekswelt zu verteilen. Auch die Infor-    Services (WMS) von OCLC in Betrieb                        thekswesen. Sie berichtet für die deutsche
mationsauslieferung auf mobile Compu-         genommen: «Wir betreiben, historisch                      Bibliotheksfachzeitschrift b.i.t.online über
ter und Smartphones lässt sich über Cloud     gewachsen, seit Jahren mehrere Biblio­                    Konferenzen, Messen und Trends.
Services relativ problemlos organisieren.     theksinformationssysteme (LIS) paral­

9                                             arbido 4 2013
lel. Mit der Cloud ist jetzt die Techno­            mit öffentlichen Geldern aufgebaut        griff die Diskussion mit Rémi Mathis
logie da, hier etwas zu ändern», so ein             sind und deshalb auch der Öffentlich­     als geladenem Gast und Max Klein von
Mitarbeiter.                                        keit zur Verfügung stehen müssten; sei    OCLC Research3 in einem Workshop
     Durch die Nutzung einer Cloud-                 es vor Ort in der Bibliothek oder vir-    auf. Mathis ist Bibliothekskurator und
Plattform bindet man sich technisch                 tuell. «Durch die Öffnung können an­      Präsident der Wikimedia France. Er be­
eng an einen Anbieter. Entsprechende                dere Bibliotheken und Interessenten       richtete, dass das französische Kultur-
Befürchtungen (in Fachkreisen unter                 die Metadaten für eigene Zwecke und       und Kommunikationsministerium mit
dem Begriff «Vendor Lock-In») disku­                Innovationen nachnutzen.»                 Wikimedia France kooperiert, um die
tiert, begleiten die neue Technologie.                   Die NB hat für die Europeana den     französischsprachigen Ressourcen in
Anja Smit, Direktorin der niederlän-                Schweizer Bibliothekskatalog Helveti­     Wikipedia semantisch zu erschliessen.
dischen Universitätsbibliothek Utrecht              cat vollumfänglich geöffnet. Alle Me­     Klein beschäftigt sich als «Wikipedian
und amtierende Vorsitzende des OCLC                 tadaten sind unter der Corporate-Comm-    in Residence» bei OCLC Research mit
EMEA Regional Council hielt den Be­                 ons-Lizenz CC-O für alle Interessenten    allen Fragen rund um die Weiter-
denken in Strassburg das Verbundar­                 verfügbar und können angebunden           entwicklung von Wikipedia als Quelle
gument entgegen: «Alle Macht geht                   werden. Doffey erklärte: «Wir müssen      für verlinkbare Daten und Informatio­
von den Mitgliedern aus».                           dort sein, wo andere Partner, andere      nen. Er versuchte, in 45 Minuten die
                                                    Bibliotheken auch dabei sind, damit       Idee der freien, von Maschinen und
Die Schweizerische Nationalbibliothek               wir an der Diskussion teilnehmen kön­     Menschen gleichermassen lesbaren
hat eine Strategie                                  nen. Die Schweiz ist so klein, dass wir   Datenbank Wikidata zu erklären – und
Die Direktorin der Schweizerischen                  diese Öffnung auch weltweit nutzen        wie die Forscher dieser Datenbank
Nationalbibliothek (NB), Marie-Chris­               wollen und können.» Genevieve Clavel-     Multilingualität beibringen wollen.
tine Doffey1, hat mit ihrem Team für ihr            Merrin, bei der NB verantwortlich für
Haus eine klare Entscheidung getrof­                den Bereich «Nationale und Internati­     Culturomics: Kulturgeschichte aus
fen. In ihrem Konferenzvortrag2 brach­              onale Kooperation» ergänzte, durch        Digitalisaten herausrechnen
te sie diese auf den Punkt: «Daten öff­             den Big-Data-Austausch auf Basis ver­     Auf diesem hohen Niveau internationa­
nen, weltweit kooperieren». Das bedeu­              linkter Metadaten würde ein Bestands­     ler Forschung ging es nahtlos weiter.
tet, die NB kooperiert nicht nur mit den            abgleich mit grossen anderen Metada­      Jean-Baptiste Michel erforscht in Har­
Schweizer Bibliotheken wie zum Bei­                 tensammlungen möglich. Zur Veran­         vard «die Nutzung von Millionen digi­
spiel im Rahmen des Metakatalogs                    staltung sagte Direktorin Doffey, dass    talisierter Bücher und Dokumenten,
Swissbib und «den anderen etwa 900                  auch «die ganze Diskussion über die       um durch quantitative Analysen daraus
Bibliotheksdiensten, die im Metakata­               Cloud» sehr wertvoll sei. «Als einzelne   z.B. Rückschlüsse zur Geschichte und
log sind», sondern auch mit der Euro­               Institution haben wir zwar nicht die      Kultur zu ziehen». «Culturomics»4 ha­
peana, mit dem WorldCat «und allen                  gleichen Probleme wie Konsortien,         ben er und sein Kollege Erez Lieberman
anderen Möglichkeiten», so Doffey. Sie              aber ich denke, es ist auch einmal ganz   Aiden dieses neue, auf Digitalisaten
begründete die Entscheidung vor allem               interessant, Leute zu hören wie Ray­      aufsetzende Forschungsgebiet getauft.
mit der Überzeugung, dass alle Meta­                mond Bérard, zu erfahren, was es da       Ihre Arbeiten führten zu einer Soft­
daten und Informationsbestände der                  für Probleme gibt und welche Fragen       ware, die aus grossen Datenbeständen
Schweizerischen Nationalbibliothek                  gestellt werden.» Bérard, Direktor des    in den Daten verborgene Trends be­
                                                    französischen staatlichen bibliogra-      rechnet und grafisch als Kurven in Dia­
                                                    fischen Instituts ABES berichtete u.a.,   grammen sichtbar macht. Die For­
                                                    dass ABES für die französischen aka­      schung brachte ihnen im letzten Jahr
1    www.nb.admin.ch/org/amtsvorsteherin/           demischen Bibliotheken eine Studie        Titelseiten auf «Nature and Science»
     index.html?lang=de                             zur Ablösung der bisherigen LIS durch     und auf der «New York Times». Google
2 Aufzeichnungen der Konferenzbeiträge sind,        ein neues, geteiltes «shared LIS»         hat das Programm gekauft.
     soweit sie von den Referenten freigegeben      durchgeführt hat. Auf Basis der ge­
     wurde, auf der Website von OCLC bereitge-      wonnenen Erkenntnisse hat ABES            In Deutschland entsteht ein
     stellt. www.oclc.org/en-europe/events/2013/    sein Bibliothekssystem neu ausge­         «Culturegraph»
     emearc-annual-meeting-feb-26.html. Von         schrieben.                                Die Deutsche Nationalbibliothek (DNB)
     einigen Präsentationen gibt es zudem                                                     baut an einer Plattform, über die Dienste
     Videoaufzeichnungen auf YouTube, u.a. vom      Frankreich setzt stark auf Wikipedia      und Projekte zu Datenvernetzung, Per­
     Vortrag von M.-C. Doffey https://www.          für Bibliotheken                          sistent Identifier und Linked Open
     youtube.com/watch?v=aONFHqMbdig                Wie Wikipedia in Bibliotheken einge­      Data für kulturelle Entitäten zusam­
     http://www.oclc.org/en-europe/events/2013/     bunden und von ihnen genutzt werden       mengeführt werden sollen. Markus
     emearc-annual-meeting-feb-26.html              kann, ist in Bezug auf Big Data und       Geipel, Softwareingenieur bei der DNB,
3 OCLC-Research betreibt eine eigene Website,       Linked Data ebenfalls ein grosses The­    stellte die «Culturegraph» getaufte
     auf der sehr interessante Forschungsprojekte   ma. Die Wissenschaftlerin Titia van der   Plattform vor. Sie soll zu einem globa­
     und -ergebnisse stehen www.oclc.org/           Werf, die vom niederländischen Leiden     len Kulturschatz-Netzwerk weit über
     research.html                                  aus für OCLC die F&E-Aktivitäten mit      die Grenzen einzelner Unternehmen
4 www.culturomics.org/                              europäischen Bibliotheken koordiniert,    und Einrichtungen hinaus werden.

10                                                  arbido 4 2013
Neue Informationsdienste                                Dr. Klaus Ceynowa zeigte innovati­             Milliarden Holdings hinweisen, liefern
mit offenen Daten                                  ve Nutzungsszenarien für digitalisierte             den Rohstoff für schier unendliche
Wie auf Basis offener Daten mit neuen              Inhalte aus Bibliotheksbeständen, die               Nutzungsmöglichkeiten. Van der Werf
IKT entwickelte Dienste aussehen                   von der BSB mithilfe von Technologien               zeigte in ihrem Vortragsthema «Meta­
können, zeigten nach Jean-Baptiste                 wie GPS-gestützte Lokalisierung (Loca­              daten ausser Kontrolle: Metadatenag­
Michel zwei weitere Referenten auf                 tion based Services), durch virtuelle               gregation auf Netzwerkebene», welche
sehr beeindruckende Weise: Silver Oli­             Darstellung angereicherte Informa­                  Aufgabe gute Metadaten erfüllen und
ver, Informationsarchitekt mit Spe­                tionsbereitstellung (Augmented Real-                wo die Grenzen der Technik liegen.
zialgebiet strategische Ausrichtung                ity) sowie gestengesteuerte Präsenta­
der Datennutzung für Onlinepubli­                  tion und Informationssuche (Gesture                 W3C Group für LOD-Erweiterung von
shing bei der britischen Unterneh­                 based Computing and Search) entwic-                 Schema.org eingerichtet
mensberatung Ontoba5, und Dr. Klaus                kelt wurden.                                        Last, but not least sprach OCLC Tech­
Ceynowa, stellvertretender Direktor                                                                    nology Evangelist Richard Wallis im
der Bayerischen Staatsbibliothek                   OCLC Research informiert                            letzten Vortrag über «Linked Data und
(BSB). Oliver referierte über das «Zeit­           umfassend über Datennutzung                         OCLC»7. Dabei berichtete er unter an­
alter des Hinweisens auf Dinge, die in             Nicht nur die eingeladenen Redner,                  derem, dass das World Wide Web Con­
Beziehung zum persönlichen Interes­                auch OCLC Research hatte Spannendes                 sortium (W3C) an der Weiterentwick­
se stehen» («The age of pointing at                aus den Forschungslaboren zu berich­                lung des Metadatenbeschreibungsstan­
things»). Gemeint ist das automa-                  ten. Roy Tennant, Senior Programm                   dards Schema.org in Richtung LOD-
tische Anbieten von weiterführenden                Officer, führte in die «Entfesselung des            Nutzung arbeitet. Dazu wurde eine
Informationen direkt in den Informa­               Katalogisierens»6 durch Datamining in               «Schema Bib Extend Community
tionsraum hinein, in dem sich der                  LOD ein. Die über 290 Millionen                     Group»8 eingerichtet. Wallis leitet sie
Nutzer gerade bewegt.                              WorldCat-Einträge, die auf rund 1,95                als Vorsitzender.

                                                                                                       Kontakt: vera-muench@kabelmail.de

     ABSTRACT                                                                                          OCLC hat sein 4. EMEA Regional Coun-
           Ouvrir les données et coopérer au niveau mondial                                            cil Meeting 2013 unter das Thema «Dyna-
           Les nouvelles possibilités que présentent la mise en réseau pratiquement illimitée des      mic Data: a World of possibilities» gestellt.
           données, l’agrégation et l’analyse d’énormes quantités de données (Big Data, Linked
           Data et Linked Open Data) offrent aux bibliothèques de nouvelles chances de valoriser
           leurs fonds à l’échelle internationale et de proposer des offres spécifiques. La nouvelle
           technique du Cloud Computing, autrement dit la mise à disposition et l’utilisation de       5   www.ontoba.com/blog/bbc-news-labs
           logiciels, de capacités de calcul et de stockage comme prestation en ligne, permet en       6 www.oclc.org/research/news/2013/02-27.
           outre de réduire les travaux de routine et de répartir ces derniers via l’automatisation        html
           et la mise en réseau de catalogues et de métadonnées. La fourniture d’informations sur      7 Ein Interview mit Richard Wallis zu LOD
           des ordinateurs portables et des téléphones intelligents peut également être organisée          erschien in B.I.T.-Online 15 (2012), Ausgabe
           sans trop de problèmes via les Cloud-Services.                          (traduction: sg)       6, S. 566
                                                                                                       8 www.w3.org/community/schemabibex/

                                                                     Annonces/Inserate
                                                                     – arbido newsletter
                                                                     – arbido print
                                                                     – arbido website
                                                                     inserate@staempfli.com
                                                                     031 300 63 89

11                                                 arbido 4 2013
Les institutions patrimoniales suisses
sont favorables à l’open data
Beat Estermann,                                         à des bénévoles des tâches de correction    Le développement spectaculaire de Wi­
collaborateur scientifique,                             et de transcription sur l’Internet, offre   kipédia, Flickr et d’offres analogues
Institut pour le gouvernement                           qui rencontre un véritable succès. Le       basées sur le principe de la commu­
électronique de la Haute école                          Tropenmuseum à Amsterdam met des            nauté virtuelle focalise de plus en plus
spécialisée bernoise                                    centaines de milliers de photos haute       l’attention sur la constitution et la col­
                                                        résolution sur Wikimedia Commons,           lecte collaborative de contenus sur l’In­
Depuis l’avènement de l’Internet, les                   se félicite que ses fonds soient désor­     ternet. De premières collaborations
institutions patrimoniales connaissent                  mais plus faciles d’accès et en espère en   s’installent entre des institutions patri­
des changements successifs nombreux.                    tirer profit par l’augmentation du          moniales et des communautés en ligne,
On par exemple la numérisation systé-                   nombre de visiteurs. Le Brooklyn Mu­        tandis que certaines institutions lancent
matique des objets patrimoniaux, la                     seum s’en remet au jugement des visi­       des projets spécifiques en faisant appel
mise en réseau accrue des organisa-                     teurs de son site web pour sélectionner     au crowdsourcing2.
tions, la coproduction de contenus par                  des photographies destinées à une ex­
les utilisatrices et les utilisateurs ainsi             position. Un consortium de biblio­          Les communautés Wikipédia et Flickr
que la mise à disposition de données et                 thèques européennes utilise le crowd­       découvrent de leur côté que les institu­
de contenus sur l’Internet sous des li-                 funding pour financer la numérisation       tions partimoniales sont des parte­
cences «libres». Une étude de la Haute                  des œuvres tombant dans le domaine          naires importants et cherchent depuis
école spécialisée bernoise1 montre où les               public. A Vienne, des chercheurs            quelques années à collaborer active­
institutions patrimoniales suisses se si-               misent sur les données libres d’accès       ment avec elles. A partir de 2009, c’est
tuent dans ce contexte.                                 pour visualiser d’une nouvelle façon        le mouvement pour l’ouverture des
                                                        d’appréhender l’histoire de l’art.          données publiques qui, depuis les
Les institutions patrimoniales                               Ces exemples montrent les pro­
en pleine mutation                                      fonds changements qui traversent le         Le développement spectaculaire de Wi-
Le Musée de Derby mise sur des codes                    champ des institutions patrimoniales        kipédia, Flickr et d’offres analogues ba-
QR pour enrichir via des articles de                    depuis l’avènement de l’Internet dans       sées sur le principe de la communauté
Wikipédia les explications concernant                   les années 1990 et les innovations qu’il    virtuelle focalise de plus en plus
les objets d’exposition, et ce en plu­                  a induites.                                 l’attention sur la constitution et la col-
sieurs langues bien entendu. La Biblio­                                                             lecte collaborative de contenus sur
thèque nationale australienne propose                   On peut, concrètement, identifier plu­      l’Internet.
                                                        sieurs tendances successives:
                                                        Depuis le début des années 2000, les
                                                        institutions patrimoniales en Europe
                                                        conjuguent leurs efforts afin de numé­      Etats-Unis et la Grande-Bretagne, se
1    En allemand: Estermann Beat (2013):                riser de manière coordonnée et la plus      propage rapidement pour toucher
     Schweizer Gedächtnisinstitutionen im               complète possible les objets patrimo­       quelque 50 Etats de par le monde. Son
     Internet-Zeitalter. Ergebnisse einer Pilotbefra-   niaux et leurs métadonnées. Outre une       exigence: les données des autorités
     gung zu den Themenbereichen Open Data              mise en réseau renforcée qui permet         publiques doivent être rendues acces­
     und Crowdsourcing, Berner Fachhochschule,          aux institutions d’échanger leur savoir-    sibles sous une forme lisible par ordi­
     E-Government-Institut. / En anglais:               faire et d’éviter les doublons, sont éga­   nateur afin qu’elles puissent être utili­
     Estermann Beat (2013): Swiss Heritage              lement proposées dans la foulée des         sées par des tiers. Si le mouvement pour
     Institutions in the Internet Era. Results of a     offres de «single-point-of-access» sous     l’ouverture des données publiques
     pilot survey on open data and crowdsour-           la forme de systèmes de catalogues inter-   trouve son origine dans une vision de
     cing, Bern University of Applied Sciences,         organisations et de bibliothèques vir­      la politique étatique que l’on veut plus
     E-Government Institute.                            tuelles.                                    transparente et plus participative, il est
2 Le concept de «crowdsourcing» désigne des                                                         également motivé par une vision tech­
     activités participatives en ligne dans le cadre    Dès 2005, on assiste à l’avènement du       nico-économique: la mise en réseau du
     desquelles une personne ou une organisation        Web social qui offre encore plus de pos­    plus grand nombre possible de données
     demande publiquement à un groupe (en               sibilités d’interaction. Cette tendance     «ouvertes» doit permettre l’émergence
     général non défini de manière précise) de          se caractérise par de nouvelles formes      de ce qu’il est convenu d’appeler le
     personnes d’horizons différents d’accomplir        de personnalisation et par une implica­     «Web sémantique». Les données des
     une tâche à titre bénévole. On parle               tion plus forte des utilisatrices et des    autorités publiques ainsi que, le cas
     également de «coproduction» ou, en                 utilisateurs, ou des visiteuses et des      échéant, celles d’entreprises privées,
     particulier dans le contexte de Wikipédia, de      visiteurs respectivement, qui sont ap­      deviennent ainsi des ressources infras­
     création collaborative de contenus.                pelés à coproduire.                         tructurelles libres d’accès que des tiers

12                                                      arbido 4 2013
Sie können auch lesen