Digitalisierungsprojekte juristischer Bibliotheken und die Einbindung von Fremddigitalisaten in die eigene Präsentation - Ivo Vogel ...
←
→
Transkription von Seiteninhalten
Wenn Ihr Browser die Seite nicht korrekt rendert, bitte, lesen Sie den Inhalt der Seite unten
Digitalisierungsprojekte juristischer Bibliotheken und die Einbindung von Fremddigitalisaten in die eigene Präsentation Ivo Vogel Staatsbibliothek zu Berlin Sondersammelgebiet Recht
Inhalt Darstellung verschiedener Digitalisierungsprojekte in juristischen Bibliotheken (exemplarisch an zwei Bibliotheken) Herausarbeitung von Problemen bei der Durchführung dieser Projekte Recherchierbarkeit von digitalisierten Rechtsmaterialien Volltexterfassung Digitalisierung historischer Gesetzblätter und Parlamentsschrifttum Im Vortrag geht es ausschließlich um die Retrodigitalisierung historischer Rechtsmaterialien! Ivo Vogel | Leiter des Sondersammelgebietes Recht 23.11.2012 | S. 2
Arten digitalisierter Rechtsmaterialien Handschriften Monographien Sammelschriften Zeitschriften Parlamentschriften Ivo Vogel | Leiter des Sondersammelgebietes Recht 23.11.2012 | S. 3
Drei Projekte vor den DFG-Praxisregeln „Digitalisierung". Juristische Dissertationen des 16. - 18. Jahrhunderts aus Universitäten des Alten Reichs / Max-Planck-Institut für europäische Rechtsgeschichte Preußische Rechtsquellen Digital / Staatsbibliothek zu Berlin Literaturquellen zum deutschen, österreichischen und schweizerischen Privat- und Zivilprozessrecht des 19. Jahrhunderts / Max-Planck-Institut für europäische Rechtsgeschichte Ivo Vogel | Leiter des Sondersammelgebietes Recht 23.11.2012 | S. 4
Juristische Dissertationen des 16. - 18. Jahrhunderts aus Universitäten des Alten Reichs / MPI für europäische Rechtsgeschichte juristische Dissertationen des 16. bis 18. Jahrhunderts aus dem Gebiet des Alten Reichs (ca. 73.000 Schriften) Mit Förderung der Generalverwaltung der MPG wurden alle Schriften systematisch im Katalog der Bibliothek bibliographisch erschlossen. Über die Katalogisierung hinaus wurden bestimmte Schlüsselseiten digitalisiert, „um der Forschung einen Mehrwert an Informationen zu bieten“. Nach Abschluss des Projekts konnte auf mehr als 92.000 Titelblätter und Widmungsseiten in Form hochwertiger Farbbilder zugegriffen werden. Problem: Verlinkung nur über den Katalog des MPI LINK Ivo Vogel | Leiter des Sondersammelgebietes Recht 23.11.2012 | S. 5
Preußische Rechtsquellen Digital / SBB Gegenstand: Im Mittelpunkt des von der DFG geförderten Projektes stand die umfassende Zusammenstellung preußischer Gesetze von 1298 bis 1810: Corpus Constitutionum Marchicarum (CCM) und des Novum Corpus Constitutionum Prussico-Brandenburgensium Praecipue Marchicarum (NCC). Diese bibliografisch voneinander unabhängig erschienenen mehrbändigen Werke müssen im Zusammenhang betrachtet werden, da sie inhaltlich aufeinander Bezug nehmen. Folge: Gemeinsame Digitalisierung Ivo Vogel | Leiter des Sondersammelgebietes Recht 23.11.2012 | S. 6
Preußische Rechtsquellen Digital / SBB Titelseiten Ivo Vogel | Leiter des Sondersammelgebietes Recht 23.11.2012 | S. 7
Preußische Rechtsquellen Digital / SBB Art der Quellen Es handelt sich in erster Linie um textbasierte Quellen, die zweispaltig angeordnet, in Fraktur gesetzt und teilweise durch kleinere Kommentare ergänzt wurden. Es finden sich auch mehrseitige bildliche Darstellungen, beispielsweise für verschiedenartige Münzen oder Werkzeuge. Zu einem großen Teil setzt sich die Sammlung aus Tabellen und Formularen zusammen. Ivo Vogel | Leiter des Sondersammelgebietes Recht 23.11.2012 | S. 8
Preußische Rechtsquellen Digital / SBB Ivo Vogel | Leiter des Sondersammelgebietes Recht 23.11.2012 | S. 9
Preußische Rechtsquellen Digital / SBB Eckdaten der Digitalisierung: Die 25.120 im Folioformat vorliegenden Seiten wurden bitonal mit einer Auflösung von 600 dpi im Format TIFF 6.0 gescannt. Neben technischen wurden dabei auch bibliografische Daten in den TIFF-Headern abgelegt. Im Anschluss erfolgte die strukturierte Erfassung der Repertorien in XML unter Nutzung der Dokumenttypdefinitionen der Text Encoding Initiative (TEI). Ivo Vogel | Leiter des Sondersammelgebietes Recht 23.11.2012 | S. 10
Preußische Rechtsquellen Digital / SBB Spezielle Erfassungsproblematik Aufgrund der starken Hierarchisierung der Werke (vor allem des CCM) weisen die einzelnen Bände unzählige Paginierungen auf, die ihre Benutzung erschweren. Soll eine bestimmte Spalte zitiert oder referenziert werden, so ist es zur Eindeutigkeit notwendig, die verschiedenen Hierarchiestufen mitzuführen. Zur Normierung dieser Angaben musste ein achtstelliger Seitenschlüssel (zum Beispiel T1200345) entworfen und im TIFF-Header einer jeden Seite eingetragen werden. Ebenso erfolgte jede Spaltenangabe der Repertorien zusätzlich in normierter Form. Eine eindeutige Referenzierung der Seiten wurde mithilfe einer Konkordanz zwischen Seitenschlüssel und dazugehörigem Image hergestellt. Ivo Vogel | Leiter des Sondersammelgebietes Recht 23.11.2012 | S. 11
Preußische Rechtsquellen Digital / SBB Das folgenden - nach TEI ausgezeichneten Beispiele (Eintragung im Inhaltsverzeichnis, sowie Beginn eines Sachregistereintrages) - demonstriert die Tiefe der strukturierten Erfassung. Ivo Vogel | Leiter des Sondersammelgebietes Recht 23.11.2012 | S. 12
Preußische Rechtsquellen Digital / SBB Seit Sommer 2002 standen die Images (25.120) und sukzessive auch die erfassten Strukturdaten über das Internet in einer zur Verfügung. Grundlage dafür bildet das von Thomas Stäcker (Herzog August Bibliothek Wolfenbüttel) entwickelte javascriptbasierte Blättertool. Die derzeit angebotene Version erlaubt es, in den Images zu blättern sowie durch Navigieren über die Inhaltsverzeichnisse gezielt auf einzelne Edikte zuzugreifen. Die Quellensammlung wurde dafür bibliografisch und sachlich nachvollziehbar in 32 (CCM) bzw. 62 (NCC) „Portionen“ entsprechend den vorliegenden Abteilungen bzw. Jahrgängen eingeteilt. Dazu passend wurden Informationen aus Inhaltsverzeichnissen und chronologischen Registern zu 9.525 Edikten gruppiert, deren Angaben browserseitig durchsucht werden können. Die jeweils angeführte Spaltenangabe wurde mit einer Verknüpfung zum betreffenden Image hinterlegt und weist somit direkt auf die gewünschte Seite. Ivo Vogel | Leiter des Sondersammelgebietes Recht 23.11.2012 | S. 13
Preußische Rechtsquellen Digital / SBB Ivo Vogel | Leiter des Sondersammelgebietes Recht 23.11.2012 | S. 14
Preußische Rechtsquellen Digital / SBB Wesentliches Anliegen war die Verbindung zu anderen Projekten, speziell zum Deutschen Rechtswörterbuch (DRW) der Heidelberger Akademie der Wissenschaften. Dieses Belegwörterbuch der germanischen Rechtssprache verweist auf viele, zum Teil digitalisierte Quellen. Die bearbeiteten Werke CCM und NCC stellen seither bedeutende und häufig zitierte Quellen dieses Wörterbuchs dar. Folgerichtig wird im Rechtswörterbuch an bisher über 1.400 Stellen auf die erstellten Digitalisate der betreffenden Seiten im Angebot der Staatsbibliothek verwiesen. Über eine Verknüpfung gelangt man unmittelbar auf die Seite mit den zitierten Belegen. Damit wurde die Verknüpfung beider DFG-Projekte realisiert. Ivo Vogel | Leiter des Sondersammelgebietes Recht 23.11.2012 | S. 15
Preußische Rechtsquellen Digital / SBB / Verknüpfung mit dem DRW Ivo Vogel | Leiter des Sondersammelgebietes Recht 23.11.2012 | S. 16
Preußische Rechtsquellen Digital / SBB Ziele (für die Weiterentwicklung -> dringend) Es ist beabsichtigt, unter verschiedenen Suchaspekten mit einzelnen Titelstichwörtern sowie nach Hauptschlagwörtern des Realregisters suchen zu können. Außerdem soll eine kombinierte Suche mit dem Veröffentlichungsdatum realisiert werden. Eine Volltextsuche, die alle Daten einbezieht, würde die genannten Sucheinstiege ergänzen. Ivo Vogel | Leiter des Sondersammelgebietes Recht 23.11.2012 | S. 17
Preußische Rechtsquellen Digital / SBB Herausforderungen Schwierigkeit beim Retrieval: historisch begründete Varianz der deutschen Rechtschreibung Quellen wurden entsprechend ihrer Vorlageform wiedergegeben. Beispiele: Münze (Müntze), Ernte (Erndte), Strafe (Straffe) und Holz (Holtz). Zur Entschärfung dieser Problematik sollen Softwareangebote, die eine systemseitige Berücksichtigung unterschiedlicher historischer Schreibweisen im Deutschen beim Retrieval realisieren, geprüft und weiterentwickelt werden. Volltextindexierung Ivo Vogel | Leiter des Sondersammelgebietes Recht 23.11.2012 | S. 18
Literaturquellen zum deutschen, österreichischen und schweizerischen Privat- und Zivilprozessrecht des 19. Jahrhunderts / MPI für europäische Rechtsgeschichte Das Max-Planck-Institut für europäische Rechtsgeschichte hat sich seit seiner Gründung 1964 intensiv mit der Erforschung der Privatrechtsgeschichte Europas beschäftigt. Besonders reichhaltig ist daher sein Bestand an Literaturquellen zum deutschen, österreichischen und schweizerischen Privat- und Zivilprozeßrecht des 19. Jahrhunderts. Die Förderung der Deutschen Forschungsgemeinschaft machte es Ende der 1990er Jahre möglich, diesen in seiner Dichte ungewöhnlichen Bestand zu digitalisieren und damit einem größeren Kreis von Wissenschaftlern zugänglich zu machen. Durch das Projekt werden 4.316 Bände mit 1.351.223 Seiten bereitgestellt. Ivo Vogel | Leiter des Sondersammelgebietes Recht 23.11.2012 | S. 19
Literaturquellen zum deutschen, österreichischen und schweizerischen Privat- und Zivilprozessrecht des 19. Jahrhunderts / MPI für europäische Rechtsgeschichte Durch die Volltext-Erfassung ihrer Inhaltsverzeichnisse ist eine Erschließungsebene geschaffen, die über die übliche bibliothekarische Verzeichnung hinausgeht. Die Bereitstellung der digitalen Sammlung im Internet erfolgt mittels eines WWW-Servers. Der Server kombiniert die aufbereiteten Inhaltsverzeichnisse mit den durch ein direktes Interface aus dem OPAC der Bibliothek geladenen bibliographischen Informationen. Ivo Vogel | Leiter des Sondersammelgebietes Recht 23.11.2012 | S. 20
Standardisierung für die Digitalisierung (DFG) Retrospektive Digitalisierung von Bibliotheksbeständen. Evaluierungsbericht über einen Förderschwerpunkt der DFG, Januar 2005 http://www.dfg.de/download/pdf/foerderung/ programme/lis/retro_digitalisierung_eval_050406.pdf Praxisregeln im Förderprogramm Kulturelle Überlieferung, Stand: März 2007 http://www.dfg.de/download/pdf/foerderung/ programme/lis/praxisregeln_kulturelle_ueberlieferung.pdf DFG-Praxisregeln "Digitalisierung". Stand: April 2009 http://www.dfg.de/download/pdf/foerderung/ programme/lis/praxisregeln_digitalisierung.pdf Ivo Vogel | Leiter des Sondersammelgebietes Recht 23.11.2012 | S. 21
Projekte gemäß den DFG-Praxisrichtlinien Juristische Zeitschriften 1703 – 1830 (Kooperationsprojekt zwischen dem Max-Planck-Institut für europäische Rechtsgeschichte und dem Sondersammelgebiet Recht der Staatsbibliothek zu Berlin) Mit dem Projekt werden die Zeitschriften aller deutschsprachigen Territorien und aller juristischen Disziplinen in digitale Form überführt und der Wissenschaft in zeitgemäßer, elektronischer Weise zur Verfügung gestellt. LINK Ivo Vogel | Leiter des Sondersammelgebietes Recht 23.11.2012 | S. 22
Juristische Zeitschriften 1703 – 1830 Ivo Vogel | Leiter des Sondersammelgebietes Recht 23.11.2012 | S. 23
Projekte gemäß den DFG-Praxisrichtlinien Deutsches Territorialrecht von 1801 bis 1900 (Sondersammelgebiet Recht der Staatsbibliothek zu Berlin) Ziel des Vorhabens ist die Digitalisierung von rechtshistorischen Quellen aus dem Publikationszeitraum 1801-1900 mit dem Schwerpunkt auf dem deutschen Partikularrecht. Derzeit umfasst das Projekt ein Volumen von ca. 12.500 Bänden auf ca. 2,5 Mio. Seiten. Die Bildqualität des digitalisierten Materials wird so gewählt, dass ein automatisiertes Texterkennungsverfahren problemlos angewendet werden kann. Für dieses Projekt der Massendigitalisierung wird der Goobi- Workflow der Staatsbibliothek zu Berlin genutzt. Ivo Vogel | Leiter des Sondersammelgebietes Recht 23.11.2012 | S. 24
1. Fazit Alle bisherigen Digitalisierungsprojekte (insbesondere auch die der juristischen Bibliotheken) müssen auf den Stand der Standards gemäß den Praxisregeln der DFG gebracht werden. Als vereinheitlichten Standard sollten z. B. alle Projekte (wenigstens als zusätzliche Ansicht) den DFG-Viewer anbieten. Ivo Vogel | Leiter des Sondersammelgebietes Recht 23.11.2012 | S. 25
Recherchierbarkeit (Einbindungsproblematik) „Die DFG erwartet, dass Projektnehmer gezielte Anstrengungen unternehmen, um einen hohen Bekanntheitsgrad und eine hohe Nutzung der erstellten Ressourcen zu garantieren. Dies sollte mindestens durch die Einbindung der Ressourcen in vorhandene oder entstehenden materialspezifischen Portale und Kataloge […] geschehen.“ Ivo Vogel | Leiter des Sondersammelgebietes Recht 23.11.2012 | S. 26
Recherchebeispiel „Entwickelung der Organisation des landwirtschaftlichen Kreditwesens in Bayern“ Suche über den KVK in den Verbünden, der DNB und dem Bereich elektronische Texte (BASE, DFG : e-books, DFG : Aufsätze, EROMM Web Search, Google Bücher, ZVDD) = 15 Kataloge bzw. Datenbanken Ergebnis von 8 Katalogen bzw. DB; nur drei Ergebnisse haben zum Digitalisat verlinkt: EROMM Web Search Verbundkatalog HeBIS, Hessen Zentrales Verzeichnis Digitalisierter Drucke (ZVDD) Damit haben 10 Bibliotheken, die das Werk physisch in ihrem Bestand halten, nicht auf das Digitalisat verlinkt! Ivo Vogel | Leiter des Sondersammelgebietes Recht 23.11.2012 | S. 27
Weiteres Beispiel Codex Iustinianus cum glossa ordinaria Accursii Suche über den KVK in den Verbünden, der DNB und dem Bereich elektronische Texte (BASE, DFG : e-books, DFG : Aufsätze, EROMM Web Search, Google Bücher, ZVDD) = 15 Kataloge bzw. Datenbanken Ergebnis von 4 Katalogen bzw. DB, die alle zum Digitalisat verlinkt haben: Staatsbibliothek zu Berlin Verbundkatalog GBV EROMM Web Search Zentrales Verzeichnis Digitalisierter Drucke (ZVDD) Ivo Vogel | Leiter des Sondersammelgebietes Recht 23.11.2012 | S. 28
2. Fazit Die Verbreitung und Recherchierbarkeit von Digitalisaten über ZVDD und EROMM bzw. den KVK oder die Virtuelle Fachbibliothek Recht genügt nicht. Vielmehr sollte jeder Verbund Digitalisate einspielen, um diese in die lokalen Kataloge einfließen zu lassen. Zumindest sollte dies für die Bibliotheken gelten, die auch ein physisches Exemplar im Bestand haben. Darüber hinaus sollten Digitalisierungsprojekte (DB) beim Aufbau von Discoverysystemen berücksichtigt und eingebunden werden. Ivo Vogel | Leiter des Sondersammelgebietes Recht 23.11.2012 | S. 29
Problem der Volltexterfassung OCR (Optical Character Recognition) Bisher hat die OCR-Bearbeitung erst bei jüngeren Antiquaschriften ab dem 19. Jahrhundert sowie bei Frakturschriften ab der zweiten Hälfte des 19. Jahrhunderts zu akzeptablen Ergebnissen geführt. Da sich der Markt dynamisch weiterentwickelt und neue Produkte auf den Markt kommen, können die Praxisregeln der DFG zur Frage der OCR-Software und ihrer Anwendbarkeit zum jetzigen Zeitpunkt keine weiteren Empfehlungen geben. Ivo Vogel | Leiter des Sondersammelgebietes Recht 23.11.2012 | S. 30
Warum stellt die OCR für historische Texte eine wirkliche Herausforderung dar? Verwendete Typo Alte Schriftarten werden verwendet - Standard OCR- Lösungen können keine Fraktur-Schriften erkennen. Die Qualität der Buchstaben ist zu schlecht: Unvollständige Zeichen Vermischt mit Dreck, Anmerkungen oder Scanrauschen Für die auf alten Dokumenten verwendeten Schrifttypen gibt es größtenteils keine Pendants in modernen Computerschriften. Probleme durch die alte Sprache Da es zur Entstehung der Dokumente keine einheitliche Rechtschreibung gab, variiert die Schreibweise einzelner Wörter zum Teil erheblich. Ivo Vogel | Leiter des Sondersammelgebietes Recht 23.11.2012 | S. 31
Warum die OCR für historische Texte eine wirkliche Herausforderung darstellt. Bildqualität Scans von alten Dokumenten sind oft mangelhaft, eine gute Scanqualität ist jedoch entscheidend für eine gute OCR. Probleme: Gewelltes Papier Papierseiten sind verklebt Verschachtelte Layouts Gebogene Textzeilen, wenn vorliegende Dokumente vorsichtig behandelt werden müssen und nicht ganz geöffnet werden können Ivo Vogel | Leiter des Sondersammelgebietes Recht 23.11.2012 | S. 32
Warum die OCR für historische Texte eine wirkliche Herausforderung darstellt. Layouterkennung Historische Bücher/Dokumente haben oft eine andere Layoutstruktur als moderne Texte. Spezielle Algorithmen, die für die Erkennung von modernen Layout entwickelt wurden, liefern auf alten Dokumenten keine zufriedenstellenden Ergebnisse. Ivo Vogel | Leiter des Sondersammelgebietes Recht 23.11.2012 | S. 33
Alternative zur OCR? Direkterfassung Man unterscheidet bei der Direkterfassung (Abschreiben) von Texten zwei Verfahren, das einfache und das double-key- Verfahren. Bei letzterem wird ein Text zweimal erfasst und die Abweichungen beider Versionen durch automatischen Textabgleich herausgefiltert. Auf diese Weise sind Erfassungsgenauigkeiten von 99,997% erreichbar, also ein praktisch fehlerfreier Text. Unterhalb einer Genauigkeit von 99,5 % ist bei manueller Erfassung ein Ergebnis im Grunde wertlos, da z. B. bei 99% jeder 100ste Buchstabe(!) falsch wäre (pro Zeile also ca. ein Fehler). Die Direkterfassung ist für das Massendigitalisierungs- geschäft keine wirklich gute Alternative, da sie sehr kosten- und personalintensiv ist. Beispiel Direkterfassung: DRQEdit Ivo Vogel | Leiter des Sondersammelgebietes Recht 23.11.2012 | S. 34
3. Fazit Die Volltexterfassung von historischen Drucken ist immer noch nicht ausreichend gelöst und umgesetzt. Es ist dringend notwendig, dass alle bisherigen Digitalisierungsprojekte eine Texterkennung nachholen, wenn die entsprechende Software zur Verfügung steht. Hierfür bedarf es einer nationalen Strategie. Ivo Vogel | Leiter des Sondersammelgebietes Recht 23.11.2012 | S. 35
Gesamtlösung für historische Gesetzblätter und Parlamentsschrifttum Bisher steht für die rechtswissenschaftliche Recherche nach historischen Gesetzblättern und Parlamentsschrifttum keine befriedigende Lösung zur Verfügung. Einzelprojekte: Verhandlungen des Deutschen Reichtags Deutsches Reichsgesetzblatt (bei Alex) Stenographische Berichte über die Verhandlungen des preußischen Hauses der Abgeordneten (kommerziell) Beispiel Österreich: RIS ALEX Ivo Vogel | Leiter des Sondersammelgebietes Recht 23.11.2012 | S. 36
Gesamtlösung für historische Gesetzblätter und Parlamentsschrifttum Vision für Deutschland: Erweiterung des Dokumentations- und Informationssystem für Parlamentarische Vorgänge (DIP) Aufbau eines Portals für historische Gesetzblätter und Parlamentsschriften Gesamtkoordination durch die Deutsche Digitale Bibliothek oder Eigeninitiative juristischer Bibliotheken? Ivo Vogel | Leiter des Sondersammelgebietes Recht 23.11.2012 | S. 37
4. Fazit Im Bereich der Digitalisierung historischer Gesetzesblätter und des dazugehörigen Parlamentsschrifttums gibt es in Deutschland erheblichen Aufholbedarf. Eine Gesamt- koordination verteilter Projekte sollte angestrebt werden. Ivo Vogel | Leiter des Sondersammelgebietes Recht 23.11.2012 | S. 38
Ende Bei Rückfragen wenden Sie sich bitte an: Ivo Vogel Ivo.Vogel@sbb.spk-berlin.de Tel.: 030- 266 433 210
Sie können auch lesen