Digitalisierungsprojekte juristischer Bibliotheken und die Einbindung von Fremddigitalisaten in die eigene Präsentation - Ivo Vogel ...

Die Seite wird erstellt Len Specht
 
WEITER LESEN
Digitalisierungsprojekte juristischer Bibliotheken und die Einbindung von Fremddigitalisaten in die eigene Präsentation - Ivo Vogel ...
Digitalisierungsprojekte juristischer
Bibliotheken und die Einbindung von
  Fremddigitalisaten in die eigene
             Präsentation

                Ivo Vogel
        Staatsbibliothek zu Berlin
       Sondersammelgebiet Recht
Digitalisierungsprojekte juristischer Bibliotheken und die Einbindung von Fremddigitalisaten in die eigene Präsentation - Ivo Vogel ...
Inhalt

 Darstellung verschiedener Digitalisierungsprojekte in
  juristischen Bibliotheken (exemplarisch an zwei Bibliotheken)
 Herausarbeitung von Problemen bei der Durchführung dieser
  Projekte
 Recherchierbarkeit von digitalisierten Rechtsmaterialien
 Volltexterfassung
 Digitalisierung historischer Gesetzblätter und
  Parlamentsschrifttum

 Im Vortrag geht es ausschließlich um die Retrodigitalisierung
  historischer Rechtsmaterialien!

Ivo Vogel | Leiter des Sondersammelgebietes Recht        23.11.2012 | S. 2
Arten digitalisierter Rechtsmaterialien

 Handschriften
 Monographien
 Sammelschriften
 Zeitschriften
 Parlamentschriften

Ivo Vogel | Leiter des Sondersammelgebietes Recht   23.11.2012 | S. 3
Drei Projekte vor den DFG-Praxisregeln
„Digitalisierung".

 Juristische Dissertationen des 16. - 18. Jahrhunderts
  aus Universitäten des Alten Reichs / Max-Planck-Institut für
  europäische Rechtsgeschichte

 Preußische Rechtsquellen Digital / Staatsbibliothek zu Berlin

 Literaturquellen zum deutschen, österreichischen und
  schweizerischen Privat- und Zivilprozessrecht des 19.
  Jahrhunderts / Max-Planck-Institut für europäische
  Rechtsgeschichte

Ivo Vogel | Leiter des Sondersammelgebietes Recht         23.11.2012 | S. 4
Juristische Dissertationen des 16. - 18.
Jahrhunderts aus Universitäten des Alten Reichs /
MPI für europäische Rechtsgeschichte
 juristische Dissertationen des 16. bis 18. Jahrhunderts aus
  dem Gebiet des Alten Reichs (ca. 73.000 Schriften)
 Mit Förderung der Generalverwaltung der MPG wurden alle
  Schriften systematisch im Katalog der Bibliothek
  bibliographisch erschlossen.
 Über die Katalogisierung hinaus wurden bestimmte
  Schlüsselseiten digitalisiert, „um der Forschung einen
  Mehrwert an Informationen zu bieten“.
 Nach Abschluss des Projekts konnte auf mehr als 92.000
  Titelblätter und Widmungsseiten in Form hochwertiger
  Farbbilder zugegriffen werden.
 Problem: Verlinkung nur über den Katalog des MPI
 LINK

Ivo Vogel | Leiter des Sondersammelgebietes Recht          23.11.2012 | S. 5
Preußische Rechtsquellen Digital / SBB

 Gegenstand:
       Im Mittelpunkt des von der DFG geförderten Projektes
        stand die umfassende Zusammenstellung preußischer
        Gesetze von 1298 bis 1810: Corpus Constitutionum
        Marchicarum (CCM) und des Novum Corpus
        Constitutionum Prussico-Brandenburgensium Praecipue
        Marchicarum (NCC).
       Diese bibliografisch voneinander unabhängig erschienenen
        mehrbändigen Werke müssen im Zusammenhang
        betrachtet werden, da sie inhaltlich aufeinander Bezug
        nehmen.

   Folge: Gemeinsame Digitalisierung

Ivo Vogel | Leiter des Sondersammelgebietes Recht        23.11.2012 | S. 6
Preußische Rechtsquellen Digital / SBB

 Titelseiten

Ivo Vogel | Leiter des Sondersammelgebietes Recht   23.11.2012 | S. 7
Preußische Rechtsquellen Digital / SBB

 Art der Quellen

       Es handelt sich in erster Linie um textbasierte Quellen, die
        zweispaltig angeordnet, in Fraktur gesetzt und teilweise
        durch kleinere Kommentare ergänzt wurden.
       Es finden sich auch mehrseitige bildliche Darstellungen,
        beispielsweise für verschiedenartige Münzen oder
        Werkzeuge.
       Zu einem großen Teil setzt sich die Sammlung aus
        Tabellen und Formularen zusammen.

Ivo Vogel | Leiter des Sondersammelgebietes Recht            23.11.2012 | S. 8
Preußische Rechtsquellen Digital / SBB

Ivo Vogel | Leiter des Sondersammelgebietes Recht   23.11.2012 | S. 9
Preußische Rechtsquellen Digital / SBB

 Eckdaten der Digitalisierung:

       Die 25.120 im Folioformat vorliegenden Seiten wurden
        bitonal mit einer Auflösung von 600 dpi im Format TIFF
        6.0 gescannt.
       Neben technischen wurden dabei auch bibliografische
        Daten in den TIFF-Headern abgelegt.
       Im Anschluss erfolgte die strukturierte Erfassung der
        Repertorien in XML unter Nutzung der
        Dokumenttypdefinitionen der Text Encoding Initiative
        (TEI).

Ivo Vogel | Leiter des Sondersammelgebietes Recht          23.11.2012 | S. 10
Preußische Rechtsquellen Digital / SBB

 Spezielle Erfassungsproblematik
       Aufgrund der starken Hierarchisierung der Werke (vor
        allem des CCM) weisen die einzelnen Bände unzählige
        Paginierungen auf, die ihre Benutzung erschweren.
       Soll eine bestimmte Spalte zitiert oder referenziert
        werden, so ist es zur Eindeutigkeit notwendig, die
        verschiedenen Hierarchiestufen mitzuführen.
       Zur Normierung dieser Angaben musste ein achtstelliger
        Seitenschlüssel (zum Beispiel T1200345) entworfen und
        im TIFF-Header einer jeden Seite eingetragen werden.
       Ebenso erfolgte jede Spaltenangabe der Repertorien
        zusätzlich in normierter Form.
       Eine eindeutige Referenzierung der Seiten wurde mithilfe
        einer Konkordanz zwischen Seitenschlüssel und
        dazugehörigem Image hergestellt.

Ivo Vogel | Leiter des Sondersammelgebietes Recht              23.11.2012 | S. 11
Preußische Rechtsquellen Digital / SBB

 Das folgenden - nach TEI ausgezeichneten Beispiele
  (Eintragung im Inhaltsverzeichnis, sowie Beginn eines
  Sachregistereintrages) - demonstriert die Tiefe der
  strukturierten Erfassung.

Ivo Vogel | Leiter des Sondersammelgebietes Recht         23.11.2012 | S. 12
Preußische Rechtsquellen Digital / SBB

 Seit Sommer 2002 standen die Images (25.120) und sukzessive auch
  die erfassten Strukturdaten über das Internet in einer zur Verfügung.
 Grundlage dafür bildet das von Thomas Stäcker (Herzog August
  Bibliothek Wolfenbüttel) entwickelte javascriptbasierte Blättertool.
 Die derzeit angebotene Version erlaubt es, in den Images zu blättern
  sowie durch Navigieren über die Inhaltsverzeichnisse gezielt auf
  einzelne Edikte zuzugreifen.
 Die Quellensammlung wurde dafür bibliografisch und sachlich
  nachvollziehbar in 32 (CCM) bzw. 62 (NCC) „Portionen“ entsprechend
  den vorliegenden Abteilungen bzw. Jahrgängen eingeteilt.
 Dazu passend wurden Informationen aus Inhaltsverzeichnissen und
  chronologischen Registern zu 9.525 Edikten gruppiert, deren Angaben
  browserseitig durchsucht werden können.
 Die jeweils angeführte Spaltenangabe wurde mit einer Verknüpfung
  zum betreffenden Image hinterlegt und weist somit direkt auf die
  gewünschte Seite.

Ivo Vogel | Leiter des Sondersammelgebietes Recht                 23.11.2012 | S. 13
Preußische Rechtsquellen Digital / SBB

Ivo Vogel | Leiter des Sondersammelgebietes Recht   23.11.2012 | S. 14
Preußische Rechtsquellen Digital / SBB

 Wesentliches Anliegen war die Verbindung zu anderen
  Projekten, speziell zum Deutschen Rechtswörterbuch (DRW)
  der Heidelberger Akademie der Wissenschaften. Dieses
  Belegwörterbuch der germanischen Rechtssprache verweist
  auf viele, zum Teil digitalisierte Quellen.
 Die bearbeiteten Werke CCM und NCC stellen seither
  bedeutende und häufig zitierte Quellen dieses Wörterbuchs
  dar.
 Folgerichtig wird im Rechtswörterbuch an bisher über 1.400
  Stellen auf die erstellten Digitalisate der betreffenden Seiten
  im Angebot der Staatsbibliothek verwiesen. Über eine
  Verknüpfung gelangt man unmittelbar auf die Seite mit den
  zitierten Belegen.
 Damit wurde die Verknüpfung beider DFG-Projekte realisiert.

Ivo Vogel | Leiter des Sondersammelgebietes Recht          23.11.2012 | S. 15
Preußische Rechtsquellen Digital / SBB /
Verknüpfung mit dem DRW

Ivo Vogel | Leiter des Sondersammelgebietes Recht   23.11.2012 | S. 16
Preußische Rechtsquellen Digital / SBB

 Ziele (für die Weiterentwicklung -> dringend)

       Es ist beabsichtigt, unter verschiedenen Suchaspekten mit
        einzelnen Titelstichwörtern sowie nach
        Hauptschlagwörtern des Realregisters suchen zu können.
       Außerdem soll eine kombinierte Suche mit dem
        Veröffentlichungsdatum realisiert werden.
       Eine Volltextsuche, die alle Daten einbezieht, würde die
        genannten Sucheinstiege ergänzen.

Ivo Vogel | Leiter des Sondersammelgebietes Recht           23.11.2012 | S. 17
Preußische Rechtsquellen Digital / SBB

 Herausforderungen
   Schwierigkeit beim Retrieval:
       historisch begründete Varianz der deutschen
        Rechtschreibung
       Quellen wurden entsprechend ihrer Vorlageform
        wiedergegeben.
       Beispiele: Münze (Müntze), Ernte (Erndte), Strafe (Straffe)
        und Holz (Holtz).
       Zur Entschärfung dieser Problematik sollen
        Softwareangebote, die eine systemseitige
        Berücksichtigung unterschiedlicher historischer
        Schreibweisen im Deutschen beim Retrieval realisieren,
        geprüft und weiterentwickelt werden.

   Volltextindexierung

Ivo Vogel | Leiter des Sondersammelgebietes Recht           23.11.2012 | S. 18
Literaturquellen zum deutschen, österreichischen
und schweizerischen Privat- und Zivilprozessrecht
des 19. Jahrhunderts / MPI für europäische
Rechtsgeschichte

 Das Max-Planck-Institut für europäische Rechtsgeschichte hat
  sich seit seiner Gründung 1964 intensiv mit der Erforschung
  der Privatrechtsgeschichte Europas beschäftigt.
 Besonders reichhaltig ist daher sein Bestand an
  Literaturquellen zum deutschen, österreichischen und
  schweizerischen Privat- und Zivilprozeßrecht des 19.
  Jahrhunderts.
 Die Förderung der Deutschen Forschungsgemeinschaft
  machte es Ende der 1990er Jahre möglich, diesen in seiner
  Dichte ungewöhnlichen Bestand zu digitalisieren und damit
  einem größeren Kreis von Wissenschaftlern zugänglich zu
  machen.
 Durch das Projekt werden 4.316 Bände mit 1.351.223 Seiten
  bereitgestellt.

Ivo Vogel | Leiter des Sondersammelgebietes Recht        23.11.2012 | S. 19
Literaturquellen zum deutschen, österreichischen
und schweizerischen Privat- und Zivilprozessrecht
des 19. Jahrhunderts / MPI für europäische
Rechtsgeschichte
 Durch die Volltext-Erfassung ihrer Inhaltsverzeichnisse ist
  eine Erschließungsebene geschaffen, die über die übliche
  bibliothekarische Verzeichnung hinausgeht.
 Die Bereitstellung der digitalen Sammlung im Internet erfolgt
  mittels eines WWW-Servers.
 Der Server kombiniert die aufbereiteten Inhaltsverzeichnisse
  mit den durch ein direktes Interface aus dem OPAC der
  Bibliothek geladenen bibliographischen Informationen.

Ivo Vogel | Leiter des Sondersammelgebietes Recht         23.11.2012 | S. 20
Standardisierung für die Digitalisierung (DFG)

 Retrospektive Digitalisierung von
  Bibliotheksbeständen. Evaluierungsbericht über einen
  Förderschwerpunkt der DFG, Januar 2005
       http://www.dfg.de/download/pdf/foerderung/
        programme/lis/retro_digitalisierung_eval_050406.pdf

 Praxisregeln im Förderprogramm Kulturelle
  Überlieferung, Stand: März 2007
       http://www.dfg.de/download/pdf/foerderung/
        programme/lis/praxisregeln_kulturelle_ueberlieferung.pdf

 DFG-Praxisregeln "Digitalisierung". Stand: April 2009
       http://www.dfg.de/download/pdf/foerderung/
        programme/lis/praxisregeln_digitalisierung.pdf

Ivo Vogel | Leiter des Sondersammelgebietes Recht         23.11.2012 | S. 21
Projekte gemäß den DFG-Praxisrichtlinien

 Juristische Zeitschriften 1703 – 1830
   (Kooperationsprojekt zwischen dem Max-Planck-Institut für
   europäische Rechtsgeschichte und dem Sondersammelgebiet
   Recht der Staatsbibliothek zu Berlin)
 Mit dem Projekt werden die Zeitschriften aller
  deutschsprachigen Territorien und aller juristischen
  Disziplinen in digitale Form überführt und der Wissenschaft in
  zeitgemäßer, elektronischer Weise zur Verfügung gestellt.
 LINK

Ivo Vogel | Leiter des Sondersammelgebietes Recht        23.11.2012 | S. 22
Juristische Zeitschriften 1703 – 1830

Ivo Vogel | Leiter des Sondersammelgebietes Recht   23.11.2012 | S. 23
Projekte gemäß den DFG-Praxisrichtlinien

 Deutsches Territorialrecht von 1801 bis 1900
   (Sondersammelgebiet Recht der Staatsbibliothek zu Berlin)
 Ziel des Vorhabens ist die Digitalisierung von
  rechtshistorischen Quellen aus dem Publikationszeitraum
  1801-1900 mit dem Schwerpunkt auf dem deutschen
  Partikularrecht.
 Derzeit umfasst das Projekt ein Volumen von ca. 12.500
  Bänden auf ca. 2,5 Mio. Seiten.
 Die Bildqualität des digitalisierten Materials wird so gewählt,
  dass ein automatisiertes Texterkennungsverfahren
  problemlos angewendet werden kann.
 Für dieses Projekt der Massendigitalisierung wird der Goobi-
  Workflow der Staatsbibliothek zu Berlin genutzt.

Ivo Vogel | Leiter des Sondersammelgebietes Recht          23.11.2012 | S. 24
1. Fazit

   Alle bisherigen Digitalisierungsprojekte (insbesondere auch
   die der juristischen Bibliotheken) müssen auf den Stand der
   Standards gemäß den Praxisregeln der DFG gebracht werden.
   Als vereinheitlichten Standard sollten z. B. alle Projekte
   (wenigstens als zusätzliche Ansicht) den DFG-Viewer
   anbieten.

Ivo Vogel | Leiter des Sondersammelgebietes Recht           23.11.2012 | S. 25
Recherchierbarkeit (Einbindungsproblematik)

   „Die DFG erwartet, dass Projektnehmer gezielte
   Anstrengungen unternehmen, um einen hohen
   Bekanntheitsgrad und eine hohe Nutzung der erstellten
   Ressourcen zu garantieren. Dies sollte mindestens durch die
   Einbindung der Ressourcen in vorhandene oder entstehenden
   materialspezifischen Portale und Kataloge […] geschehen.“

Ivo Vogel | Leiter des Sondersammelgebietes Recht      23.11.2012 | S. 26
Recherchebeispiel

 „Entwickelung der Organisation des
  landwirtschaftlichen Kreditwesens in Bayern“
 Suche über den KVK in den Verbünden, der DNB und dem
  Bereich elektronische Texte (BASE, DFG : e-books, DFG :
  Aufsätze, EROMM Web Search, Google Bücher, ZVDD) = 15
  Kataloge bzw. Datenbanken
 Ergebnis von 8 Katalogen bzw. DB; nur drei Ergebnisse
  haben zum Digitalisat verlinkt:
       EROMM Web Search
       Verbundkatalog HeBIS, Hessen
       Zentrales Verzeichnis Digitalisierter Drucke (ZVDD)

 Damit haben 10 Bibliotheken, die das Werk physisch in ihrem
  Bestand halten, nicht auf das Digitalisat verlinkt!

Ivo Vogel | Leiter des Sondersammelgebietes Recht             23.11.2012 | S. 27
Weiteres Beispiel

 Codex Iustinianus cum glossa ordinaria Accursii
 Suche über den KVK in den Verbünden, der DNB und dem
  Bereich elektronische Texte (BASE, DFG : e-books, DFG :
  Aufsätze, EROMM Web Search, Google Bücher, ZVDD) = 15
  Kataloge bzw. Datenbanken
 Ergebnis von 4 Katalogen bzw. DB, die alle zum Digitalisat
  verlinkt haben:
       Staatsbibliothek zu Berlin
       Verbundkatalog GBV
       EROMM Web Search
       Zentrales Verzeichnis Digitalisierter Drucke (ZVDD)

Ivo Vogel | Leiter des Sondersammelgebietes Recht             23.11.2012 | S. 28
2. Fazit

   Die Verbreitung und Recherchierbarkeit von Digitalisaten
   über ZVDD und EROMM bzw. den KVK oder die Virtuelle
   Fachbibliothek Recht genügt nicht.

   Vielmehr sollte jeder Verbund Digitalisate einspielen, um
   diese in die lokalen Kataloge einfließen zu lassen. Zumindest
   sollte dies für die Bibliotheken gelten, die auch ein physisches
   Exemplar im Bestand haben. Darüber hinaus sollten
   Digitalisierungsprojekte (DB) beim Aufbau von
   Discoverysystemen berücksichtigt und eingebunden werden.

Ivo Vogel | Leiter des Sondersammelgebietes Recht          23.11.2012 | S. 29
Problem der Volltexterfassung

 OCR (Optical Character Recognition)

       Bisher hat die OCR-Bearbeitung erst bei jüngeren
        Antiquaschriften ab dem 19. Jahrhundert sowie bei
        Frakturschriften ab der zweiten Hälfte des 19.
        Jahrhunderts zu akzeptablen Ergebnissen geführt.

       Da sich der Markt dynamisch weiterentwickelt und neue
        Produkte auf den Markt kommen, können die Praxisregeln
        der DFG zur Frage der OCR-Software und ihrer
        Anwendbarkeit zum jetzigen Zeitpunkt keine weiteren
        Empfehlungen geben.

Ivo Vogel | Leiter des Sondersammelgebietes Recht           23.11.2012 | S. 30
Warum stellt die OCR für historische Texte eine
wirkliche Herausforderung dar?

Verwendete Typo
 Alte Schriftarten werden verwendet - Standard OCR-
  Lösungen können keine Fraktur-Schriften erkennen.
 Die Qualität der Buchstaben ist zu schlecht:
       Unvollständige Zeichen
       Vermischt mit Dreck, Anmerkungen oder Scanrauschen

 Für die auf alten Dokumenten verwendeten Schrifttypen gibt
  es größtenteils keine Pendants in modernen
  Computerschriften.
Probleme durch die alte Sprache
 Da es zur Entstehung der Dokumente keine einheitliche
  Rechtschreibung gab, variiert die Schreibweise einzelner
  Wörter zum Teil erheblich.

Ivo Vogel | Leiter des Sondersammelgebietes Recht            23.11.2012 | S. 31
Warum die OCR für historische Texte eine wirkliche
Herausforderung darstellt.

Bildqualität
 Scans von alten Dokumenten sind oft mangelhaft, eine gute
  Scanqualität ist jedoch entscheidend für eine gute OCR.
   Probleme:
       Gewelltes Papier
       Papierseiten sind verklebt
       Verschachtelte Layouts
       Gebogene Textzeilen, wenn vorliegende Dokumente vorsichtig
        behandelt werden müssen und nicht ganz geöffnet werden können

Ivo Vogel | Leiter des Sondersammelgebietes Recht             23.11.2012 | S. 32
Warum die OCR für historische Texte eine wirkliche
Herausforderung darstellt.

Layouterkennung
 Historische Bücher/Dokumente haben oft eine andere
  Layoutstruktur als moderne Texte. Spezielle Algorithmen, die
  für die Erkennung von modernen Layout entwickelt wurden,
  liefern auf alten Dokumenten keine zufriedenstellenden
  Ergebnisse.

Ivo Vogel | Leiter des Sondersammelgebietes Recht      23.11.2012 | S. 33
Alternative zur OCR?

Direkterfassung
 Man unterscheidet bei der Direkterfassung (Abschreiben) von
  Texten zwei Verfahren, das einfache und das double-key-
  Verfahren.
       Bei letzterem wird ein Text zweimal erfasst und die Abweichungen
        beider Versionen durch automatischen Textabgleich
        herausgefiltert.
       Auf diese Weise sind Erfassungsgenauigkeiten von 99,997%
        erreichbar, also ein praktisch fehlerfreier Text. Unterhalb einer
        Genauigkeit von 99,5 % ist bei manueller Erfassung ein Ergebnis
        im Grunde wertlos, da z. B. bei 99% jeder 100ste Buchstabe(!)
        falsch wäre (pro Zeile also ca. ein Fehler).
 Die Direkterfassung ist für das Massendigitalisierungs-
  geschäft keine wirklich gute Alternative, da sie sehr kosten-
  und personalintensiv ist.
 Beispiel Direkterfassung: DRQEdit

Ivo Vogel | Leiter des Sondersammelgebietes Recht                 23.11.2012 | S. 34
3. Fazit

   Die Volltexterfassung von historischen Drucken ist immer
   noch nicht ausreichend gelöst und umgesetzt. Es ist dringend
   notwendig, dass alle bisherigen Digitalisierungsprojekte eine
   Texterkennung nachholen, wenn die entsprechende Software
   zur Verfügung steht. Hierfür bedarf es einer nationalen
   Strategie.

Ivo Vogel | Leiter des Sondersammelgebietes Recht        23.11.2012 | S. 35
Gesamtlösung für historische Gesetzblätter und
Parlamentsschrifttum

 Bisher steht für die rechtswissenschaftliche Recherche
  nach historischen Gesetzblättern und
  Parlamentsschrifttum keine befriedigende Lösung zur
  Verfügung.
 Einzelprojekte:
       Verhandlungen des Deutschen Reichtags
       Deutsches Reichsgesetzblatt (bei Alex)
       Stenographische Berichte über die Verhandlungen des preußischen
        Hauses der Abgeordneten (kommerziell)

 Beispiel Österreich:
       RIS
       ALEX

Ivo Vogel | Leiter des Sondersammelgebietes Recht               23.11.2012 | S. 36
Gesamtlösung für historische Gesetzblätter und
Parlamentsschrifttum

 Vision für Deutschland:
       Erweiterung des Dokumentations- und Informationssystem für
        Parlamentarische Vorgänge (DIP)
       Aufbau eines Portals für historische Gesetzblätter und
        Parlamentsschriften

 Gesamtkoordination durch die Deutsche Digitale Bibliothek
  oder Eigeninitiative juristischer Bibliotheken?

Ivo Vogel | Leiter des Sondersammelgebietes Recht                23.11.2012 | S. 37
4. Fazit

   Im Bereich der Digitalisierung historischer Gesetzesblätter
   und des dazugehörigen Parlamentsschrifttums gibt es in
   Deutschland erheblichen Aufholbedarf. Eine Gesamt-
   koordination verteilter Projekte sollte angestrebt werden.

Ivo Vogel | Leiter des Sondersammelgebietes Recht         23.11.2012 | S. 38
Ende

Bei Rückfragen wenden Sie sich bitte an:
Ivo Vogel
Ivo.Vogel@sbb.spk-berlin.de
Tel.: 030- 266 433 210
Sie können auch lesen