URMEL - DIE MULTIMEDIALE BIBLIOTHEK DER THULB UND LANGZEITARCHIVIERUNG - ULRIKE KRÖNERT
←
→
Transkription von Seiteninhalten
Wenn Ihr Browser die Seite nicht korrekt rendert, bitte, lesen Sie den Inhalt der Seite unten
UrMEL - Die multimediale Bibliothek der ThULB und Langzeitarchivierung Ulrike Krönert © 2007 Thüringer Universitäts- und Landesbibliothek Jena
Inhalt • MyCoRe als Basis System für alle Anwendungen in UrMEL • Der Zeitschriftenserver der ThULB • Workflow von der Digitalisierung bis zur Titelaufnahme • Sicherung, Langzeitarchivierung jetzt und in Zukunft © 2007 Thüringer Universitäts- und Landesbibliothek Jena
Warum multimediale Bibliotheken? • Bibliotheken dienen der Erhaltung von Dokumenten mit bleibenden, wissenschaftlichen, künstlerischem oder gesellschaftlichen Wert • Zunehmender Umfang von digitalen Materialien • Retrodigitalisierung von durch Zerfall gefährdeten Werken (Bestandserhaltung), bzw. zur weltweiten Zugänglichmachung seltener Werke © 2007 Thüringer Universitäts- und Landesbibliothek Jena
Grundsätzliche Fragen • Welche Formate wählen, um möglichst langfristige Lesbarkeit zu gewährleisten, bzw. Migration zu anderen Formaten zu ermöglichen (Standardisierung, verlustlos) • Speicherung und Verwaltung der Digitalisate und deren Metadaten • Gewährleistung einer dauerhaften Archivierung • Gestaltung der Workflows, die für jede Kollektion (Hochchulschriften, Archive oder Zeitschriften) neu bestimmt werden muß • Welche Präsentationssysteme © 2007 Thüringer Universitäts- und Landesbibliothek Jena
Präsentationssysteme UrMEL UrMEL http://urmel.uni-jena.de/ http://www.urmel-dl.de/ Digitale Bibliothek Thüringen Zeitschriftenserver Archivserver http://www.db-thueringen.de/ http://zs.thulb.uni-jena.de/ Welche Präsentationssysteme MyCoRe http://www.mycore.de/ © 2007 Thüringer Universitäts- und Landesbibliothek Jena
MyCoRe Als Basissystem aller UrMEL Applikationen XML als zentrales Format für Layout Servlet Web-Browser • Konfiguration • Import Abfrage Auswahl Darstellung • Export • Speicherung • Layout Java Servlets • Schnittstellen Digitale Bibliothek Thüringen Schnittstellen zu University@UrMELL Journals@UrMEL Collections@UrMEL PICA, (OAI, Z39.50) Ilmedia Ilmenau Bibliotheksportalen (IPORT..), Fachdatenbanken,zentralen Target Erfurt Systemen (ZDB,EZB…) Teilprojekte Fachhochschulen MyCoRe Code Relationale Datenbank Textsuchmaschine Lucene Filesystem Datenhaltungsschicht DB2 © 2007 Thüringer Universitäts- und Landesbibliothek Jena
MyCoRe • Software für den Betrieb eines Systems für Digitale Bibliotheken und Archive • Anwendungen 14 Universitäten in Deutschland • My-eigene, lokale Anwendung, Core-Softwarekern o. allg. "Content Repositories" realisiert auf der Basis von Java • Versch. Datenbanken einsetzbar • Entwurfsgrundsätze • Anpassbarkeit • Erweiterbarkeit • Offene Schnittstellen • MyCoRe ist als Open Source Object unter der GNU Lizenz (General Public License) verfügbar http://www.mycore.de/ © 2007 Thüringer Universitäts- und Landesbibliothek Jena
Konfigurierbares Metadatenmodell • Datentypen (erweiterbar):Text mit Sprache, Zahl, Boolean, Datum, Link, Kategorie, historisches/unscharfes Datum • Datenfelder:Name, Datentyp, Wiederholbarkeit z. B. Titel, MCRMetaLangText, 1-n mal • Objekttypen:bestehen aus Datenfeldern z. B. Dokument, Person • Verweise zwischen Objekttypen z. B. Dokument Person • Vererbung von Metadaten an Kindobjekte z. B. Zeitschrift -> Heft -> Artikel • Definition über XML-Dateien © 2007 Thüringer Universitäts- und Landesbibliothek Jena
Vorzüge • Import ganzer Datei- und Verzeichnisstrukturen, auch sehr viele / sehr große Dateien. • Generieren und Prüfung von MD5 Prüfsummen • File Content Stores speichern Datei-Inhalte: – Lokales Dateisystem auf dem Server – Entferntes Dateisystem via FTP / SCP / CIFS / Samba • Wahl des Speichersystems über definierte Regeln • Upload über HTML-Formular oder Java-Applet • Download: auch ZIP-Generierung on-the-fly • Volltextsuche in PDF, HTML, Word, OpenOffice © 2007 Thüringer Universitäts- und Landesbibliothek Jena
Vorzüge • Freie Layoutgestaltung mittels XSLT • Zugriffsschutz durch flexible ACL-Implementierung • Unicode-fähig (UTF-8) © 2007 Thüringer Universitäts- und Landesbibliothek Jena
Journals@UrMEL http://zs.thulb.uni-jena.de/ • Verlage (z.B. ZfBB) • Online Zeitschriften als Open Access Publikation mit Wissenschaftlern und Fachgesellschaften (z.B. Endocytobiology, Jena Economic Research Papers) • digitalisierte historische Zeitschriften (z.B. JALZ) © 2007 Thüringer Universitäts- und Landesbibliothek Jena
Datenmodell Zeitschrift Hauptsachtitel, Zusatztitel zu Sachtitel, Herausgeber, n Mitherausgeber, Autor, Beitragender, Stichwort/Schlagwort, Personen Klassifikation, Zusammenfassung, Zeitraum, Bezeichner, Sprache, Besitznachwes, Bemerkung, Art, Nachname, Vorname, Akademischer Titel, Adelstitel, Präfix, Vorgänger, Nachfolger, Pflichtfeld Geschlecht, PLZ, Ort, Straße, Nummer, Telefon, FAX, Geburtsdatum, Todesdatum, Beruf, Nationalität, e-mail, 1 Anmerkungen n m Band, Ausgabe … Hauptsachtitel, Zusatztitel zu Sachtitel, Herausgeber, Mitherausgeber, Autor, Beitragender, Stichwort/Schlagwort, n Klassifikation, Zusammenfassung, Zeitraum, Bezeichner, Sprache, Besitznachweis, Bemerkung, Art, Jahrgang/Erscheinungsverlauf, Pflichtfeld 1 m Volltext n m Institutionen n Name, Staat, PLZ, Ort, Straße, Nummer, Telefon, FAX, URL, E-Mail. Anmerkungen Artikel Hauptsachtitel, Zusatztitel, Autor, Beitragender, Stichwort/Schlagwort, Klassifikation, Zusammenfassung, Zeitraum, Bezeichner, n Sprache, Besitznachweis, Bemerkung, Art, Jahrgang/Erscheinungsverlauf, Rubrik, Umfang/Seitenanzahl Volltext © 2007 Thüringer Universitäts- und Landesbibliothek Jena
Spezialentwicklung - Bildbetrachter • Retrodigitalisierte Artikel werden als unkomprimierte „TIFF“-Dateien im System gespeichert • Ein integrierter Bildbetrachter erzeugt beim Betrachten die für den Nutzer optimale Größe und Qualität • Ein integrierter Cache trägt • zur Entlastung des Servers bei und beschleunigt den Ladevorgang © 2007 Thüringer Universitäts- und Landesbibliothek Jena
Ausblick Journals@UrMEL • Erwerb von Online Zeitschriften Integration dieser Zeitschriften in Journals@UrMEL • ca. 130 Zeitungen und Zeitschriften aus der Zeit um 1800 • Archivierung von Verlagen erworbenen Daten – Annalen der Physik -> 2008 – IOP -> 2009 • Bei Datenübernahme genaue Datenanalyse durch Bibliothekare © 2007 Thüringer Universitäts- und Landesbibliothek Jena
Formate • Bestrebung – möglichst wenig Formate, um Arbeitsaufwand zu minimieren und eventuelle Migration zu erleichtern • Erstellung von Raw TIFFs – Handschr. 600 dpi, für OCR 400 dpi sonst 300dpi Handschr. farbig, sonst Graustufen oder schwarz-weiß („sw“) • von Gesamtwerken werden PDFs aus „sw“ erzeugt (für 600 S., ca. 35 MB) • Zu jedem Objekt kann xml-File zur Beschreibung der Metadaten und des zugehörigen Digitalisats erzeugt werden © 2007 Thüringer Universitäts- und Landesbibliothek Jena
Workflow • Scans werden in definierten Directory Strukturen abgelegt • Qualitätskontrolle, jeder Scan wird angesehen • Nachberarbeitung projektbezogen – mit MATLAB Script Auschneiden, entfernen von Flecken, einheitliche Größen, Kontraste, geraderücken, macht auch sw Files – mit pixedit • Titelaufnahme von Mitarbeitern – Metadaten in die Präsentation eingepflegt, sowie Scans geladen © 2007 Thüringer Universitäts- und Landesbibliothek Jena
Sicherung der Daten • 20 Zeitungen und Zeitschriften • 950 GB momentan (20. 9.2007) • DBT und Archive – 180 + 750 GB • Online Sicherung der Datenbank • Tägliches Backup des Datenbankservers • Daten im Filesystem werden im URZ gespiegelt und 7 Tage lang Snapshots des Filesystems bereit gehalten © 2007 Thüringer Universitäts- und Landesbibliothek Jena
Technische Voraussetzungen • Für Ausfallsicherheit Cluster (bis 4 Knoten) von Sunfire X4100 bzw. X4200, mit jeweils 8GB bzw 16 GB speicher und 2 DualCore Prozesssoren • Speicheranbindung über Fiber Channel an das Universitätsrechenzentrum • Software: Linux Red Hat 5, Clustersuite und Global Filesystem für Clustermanagement, Xen zur Virtualisierung • Datenbank: IBM DB2 © 2007 Thüringer Universitäts- und Landesbibliothek Jena
Langzeitarchivierung • Alle Objekte in Journals@UrMEL unterliegen den Anforderungen einer Langzeitarchivierung • Zu jedem Objekt kann xml-File zur Beschreibung der Metadaten und des zugehörigen Digitalisats erzeugt werden • Oktober 2007: Ablage dieser Daten auf Speicherbereich im URZ • Geplant: DFG Antrag zur Langzeitarchivierung der Daten in kopal © 2007 Thüringer Universitäts- und Landesbibliothek Jena
Geplant • Entwicklung einer Leitlinie für die Definition der Archivpakete • Erarbeitung eines Workflows, Definition der Einspeisewege • Anbindung der Präsentationssysteme an kopal • Einbindung der koLibRi Bibliotheken in MyCoRe • Abgleich von Präsentations- und Archivdaten © 2007 Thüringer Universitäts- und Landesbibliothek Jena
Geplant Journals@UrMEL + koLibRi Bibliothek Restore im Verlustfall Filesystem mit oder bei evtl. erfolgter Formate :q Digitalisaten Migration in kopal Datenbank Archivierung der Daten Erzeugung der METS –Datei Kopal und des Archivpakets mit koLibRi Bibliothek © 2007 Thüringer Universitäts- und Landesbibliothek Jena
Danke für die Aufmerksamkeit © 2007 Thüringer Universitäts- und Landesbibliothek Jena
Sie können auch lesen