URMEL - DIE MULTIMEDIALE BIBLIOTHEK DER THULB UND LANGZEITARCHIVIERUNG - ULRIKE KRÖNERT

Die Seite wird erstellt Maria Mohr
 
WEITER LESEN
URMEL - DIE MULTIMEDIALE BIBLIOTHEK DER THULB UND LANGZEITARCHIVIERUNG - ULRIKE KRÖNERT
UrMEL - Die multimediale
   Bibliothek der ThULB und
   Langzeitarchivierung

   Ulrike Krönert

© 2007 Thüringer Universitäts- und Landesbibliothek Jena
URMEL - DIE MULTIMEDIALE BIBLIOTHEK DER THULB UND LANGZEITARCHIVIERUNG - ULRIKE KRÖNERT
Inhalt

   • MyCoRe als Basis System für alle Anwendungen in
     UrMEL
   • Der Zeitschriftenserver der ThULB
   • Workflow von der Digitalisierung bis zur Titelaufnahme
   • Sicherung, Langzeitarchivierung jetzt und in Zukunft

© 2007 Thüringer Universitäts- und Landesbibliothek Jena
URMEL - DIE MULTIMEDIALE BIBLIOTHEK DER THULB UND LANGZEITARCHIVIERUNG - ULRIKE KRÖNERT
Warum multimediale Bibliotheken?

   • Bibliotheken dienen der Erhaltung von Dokumenten mit
     bleibenden, wissenschaftlichen, künstlerischem oder
     gesellschaftlichen Wert
   • Zunehmender Umfang von digitalen Materialien
   • Retrodigitalisierung von durch Zerfall gefährdeten Werken
     (Bestandserhaltung), bzw. zur weltweiten
     Zugänglichmachung seltener Werke

© 2007 Thüringer Universitäts- und Landesbibliothek Jena
URMEL - DIE MULTIMEDIALE BIBLIOTHEK DER THULB UND LANGZEITARCHIVIERUNG - ULRIKE KRÖNERT
Grundsätzliche Fragen

  • Welche Formate wählen, um möglichst langfristige
    Lesbarkeit zu gewährleisten, bzw. Migration zu anderen
    Formaten zu ermöglichen (Standardisierung, verlustlos)
  • Speicherung und Verwaltung der Digitalisate und deren
    Metadaten
  • Gewährleistung einer dauerhaften Archivierung
  • Gestaltung der Workflows, die für jede Kollektion
    (Hochchulschriften, Archive oder Zeitschriften) neu
    bestimmt werden muß
  • Welche Präsentationssysteme

© 2007 Thüringer Universitäts- und Landesbibliothek Jena
URMEL - DIE MULTIMEDIALE BIBLIOTHEK DER THULB UND LANGZEITARCHIVIERUNG - ULRIKE KRÖNERT
Präsentationssysteme

                                        UrMEL       UrMEL
                                            http://urmel.uni-jena.de/
                                        http://www.urmel-dl.de/

       Digitale Bibliothek Thüringen          Zeitschriftenserver            Archivserver
       http://www.db-thueringen.de/           http://zs.thulb.uni-jena.de/

                                       Welche Präsentationssysteme

                                              MyCoRe
                                              http://www.mycore.de/

© 2007 Thüringer Universitäts- und Landesbibliothek Jena
URMEL - DIE MULTIMEDIALE BIBLIOTHEK DER THULB UND LANGZEITARCHIVIERUNG - ULRIKE KRÖNERT
MyCoRe

  Als Basissystem aller UrMEL Applikationen
                                                                                                     XML als zentrales
                                                                                                     Format für

                                                                                Layout Servlet
                                        Web-Browser                                                  • Konfiguration
                                                                                                     • Import
             Abfrage                          Auswahl          Darstellung                           • Export
                                                                                                     • Speicherung
                                                                                                     • Layout
                                      Java Servlets                                                  • Schnittstellen

      Digitale Bibliothek Thüringen                                                        Schnittstellen zu
          University@UrMELL               Journals@UrMEL    Collections@UrMEL              PICA, (OAI, Z39.50)
            Ilmedia Ilmenau                                                                Bibliotheksportalen (IPORT..),
                                                                                           Fachdatenbanken,zentralen
              Target Erfurt                                                                Systemen (ZDB,EZB…)‫‏‬
      Teilprojekte Fachhochschulen

                                      MyCoRe Code

      Relationale Datenbank           Textsuchmaschine
                                           Lucene          Filesystem                            Datenhaltungsschicht
              DB2

© 2007 Thüringer Universitäts- und Landesbibliothek Jena
URMEL - DIE MULTIMEDIALE BIBLIOTHEK DER THULB UND LANGZEITARCHIVIERUNG - ULRIKE KRÖNERT
MyCoRe

• Software für den Betrieb eines Systems für
  Digitale Bibliotheken und Archive
• Anwendungen 14 Universitäten in Deutschland
• My-eigene, lokale Anwendung, Core-Softwarekern
  o. allg. "Content Repositories" realisiert auf der Basis von
  Java
• Versch. Datenbanken einsetzbar
• Entwurfsgrundsätze
   • Anpassbarkeit
   • Erweiterbarkeit
   • Offene Schnittstellen
• MyCoRe ist als Open Source Object unter der GNU Lizenz
  (General Public License) verfügbar http://www.mycore.de/
© 2007 Thüringer Universitäts- und Landesbibliothek Jena
URMEL - DIE MULTIMEDIALE BIBLIOTHEK DER THULB UND LANGZEITARCHIVIERUNG - ULRIKE KRÖNERT
© 2007 Thüringer Universitäts- und Landesbibliothek Jena
Konfigurierbares Metadatenmodell

   • Datentypen (erweiterbar):Text mit Sprache, Zahl,
     Boolean, Datum, Link, Kategorie, historisches/unscharfes
     Datum
   • Datenfelder:Name, Datentyp, Wiederholbarkeit
     z. B. Titel, MCRMetaLangText, 1-n mal
   • Objekttypen:bestehen aus Datenfeldern
     z. B. Dokument, Person
   • Verweise zwischen Objekttypen
     z. B. Dokument  Person
   • Vererbung von Metadaten an Kindobjekte
     z. B. Zeitschrift -> Heft -> Artikel
   • Definition über XML-Dateien

© 2007 Thüringer Universitäts- und Landesbibliothek Jena
Vorzüge

   • Import ganzer Datei- und Verzeichnisstrukturen, auch sehr viele / sehr
     große Dateien.
   • Generieren und Prüfung von MD5 Prüfsummen
   • File Content Stores speichern Datei-Inhalte:
         – Lokales Dateisystem auf dem Server
         – Entferntes Dateisystem via FTP / SCP / CIFS / Samba
   • Wahl des Speichersystems über definierte Regeln
   • Upload über HTML-Formular oder Java-Applet
   • Download: auch ZIP-Generierung on-the-fly
   • Volltextsuche in PDF, HTML, Word, OpenOffice

© 2007 Thüringer Universitäts- und Landesbibliothek Jena
Vorzüge

   • Freie Layoutgestaltung mittels XSLT
   • Zugriffsschutz durch flexible ACL-Implementierung
   • Unicode-fähig (UTF-8)‫‏‬

© 2007 Thüringer Universitäts- und Landesbibliothek Jena
Journals@UrMEL

    http://zs.thulb.uni-jena.de/

•     Verlage (z.B. ZfBB)‫‏‬
•     Online Zeitschriften als
      Open Access Publikation
      mit Wissenschaftlern und
      Fachgesellschaften (z.B. Endocytobiology,
      Jena Economic Research Papers)
•     digitalisierte historische Zeitschriften (z.B. JALZ)

© 2007 Thüringer Universitäts- und Landesbibliothek Jena
Datenmodell

  Zeitschrift
  Hauptsachtitel, Zusatztitel zu Sachtitel, Herausgeber,           n
  Mitherausgeber, Autor, Beitragender, Stichwort/Schlagwort,           Personen
  Klassifikation, Zusammenfassung, Zeitraum, Bezeichner,
  Sprache, Besitznachwes, Bemerkung, Art,                              Nachname, Vorname, Akademischer Titel, Adelstitel, Präfix,
  Vorgänger, Nachfolger, Pflichtfeld                                   Geschlecht, PLZ, Ort, Straße, Nummer, Telefon, FAX,
                                                                       Geburtsdatum, Todesdatum, Beruf, Nationalität, e-mail,
                                 1                                     Anmerkungen

                                 n                                                                      m

  Band, Ausgabe …
  Hauptsachtitel, Zusatztitel zu Sachtitel, Herausgeber,
  Mitherausgeber, Autor, Beitragender, Stichwort/Schlagwort,       n
  Klassifikation, Zusammenfassung, Zeitraum, Bezeichner,
  Sprache, Besitznachweis, Bemerkung, Art,
  Jahrgang/Erscheinungsverlauf, Pflichtfeld
                                 1                                                                      m
  Volltext

                                                   n           m
                                                                        Institutionen
                                 n
                                                                        Name, Staat, PLZ, Ort, Straße, Nummer, Telefon, FAX, URL, E-Mail.
                                                                        Anmerkungen
  Artikel
  Hauptsachtitel, Zusatztitel, Autor, Beitragender,
  Stichwort/Schlagwort,
  Klassifikation, Zusammenfassung, Zeitraum, Bezeichner,           n
  Sprache, Besitznachweis, Bemerkung, Art,
  Jahrgang/Erscheinungsverlauf, Rubrik, Umfang/Seitenanzahl

  Volltext

© 2007 Thüringer Universitäts- und Landesbibliothek Jena
Spezialentwicklung - Bildbetrachter

• Retrodigitalisierte Artikel
  werden als unkomprimierte
  „TIFF“-Dateien im
  System gespeichert

• Ein integrierter
  Bildbetrachter erzeugt beim
  Betrachten die für den Nutzer
  optimale Größe und Qualität

• Ein integrierter Cache trägt
• zur Entlastung des Servers bei
  und beschleunigt den Ladevorgang

© 2007 Thüringer Universitäts- und Landesbibliothek Jena
Ausblick Journals@UrMEL

   • Erwerb von Online Zeitschriften
     Integration dieser Zeitschriften in Journals@UrMEL
   • ca. 130 Zeitungen und Zeitschriften aus der Zeit um 1800
   • Archivierung von Verlagen erworbenen Daten
         – Annalen der Physik -> 2008
         – IOP -> 2009
   • Bei Datenübernahme genaue Datenanalyse durch
     Bibliothekare

© 2007 Thüringer Universitäts- und Landesbibliothek Jena
Formate

   • Bestrebung – möglichst wenig Formate, um
     Arbeitsaufwand zu minimieren und eventuelle Migration
     zu erleichtern
   • Erstellung von Raw TIFFs
         – Handschr. 600 dpi, für OCR 400 dpi sonst 300dpi
           Handschr. farbig, sonst Graustufen oder schwarz-weiß („sw“)
   • von Gesamtwerken werden PDFs aus „sw“ erzeugt
     (für 600 S., ca. 35 MB)
   • Zu jedem Objekt kann xml-File zur Beschreibung der
     Metadaten und des zugehörigen Digitalisats erzeugt
     werden

© 2007 Thüringer Universitäts- und Landesbibliothek Jena
Workflow

   • Scans werden in definierten Directory Strukturen
     abgelegt
   • Qualitätskontrolle, jeder Scan wird angesehen
   • Nachberarbeitung projektbezogen
         – mit MATLAB Script
           Auschneiden, entfernen von Flecken, einheitliche
           Größen, Kontraste, geraderücken, macht auch sw Files
         – mit pixedit
   • Titelaufnahme von Mitarbeitern
         – Metadaten in die Präsentation eingepflegt, sowie
           Scans geladen
© 2007 Thüringer Universitäts- und Landesbibliothek Jena
Sicherung der Daten

   • 20 Zeitungen und Zeitschriften
   • 950 GB momentan (20. 9.2007)
   • DBT und Archive – 180 + 750 GB
   • Online Sicherung der Datenbank
   • Tägliches Backup des Datenbankservers
   • Daten im Filesystem werden im URZ gespiegelt und 7
     Tage lang Snapshots des Filesystems bereit gehalten

© 2007 Thüringer Universitäts- und Landesbibliothek Jena
Technische Voraussetzungen

   • Für Ausfallsicherheit Cluster (bis 4 Knoten) von
     Sunfire X4100 bzw. X4200, mit jeweils 8GB bzw 16 GB
     speicher und 2 DualCore Prozesssoren
   • Speicheranbindung über Fiber Channel an das
     Universitätsrechenzentrum
   • Software: Linux Red Hat 5, Clustersuite und Global
     Filesystem für Clustermanagement, Xen zur
     Virtualisierung
   • Datenbank: IBM DB2

© 2007 Thüringer Universitäts- und Landesbibliothek Jena
Langzeitarchivierung

   • Alle Objekte in Journals@UrMEL unterliegen den
     Anforderungen einer Langzeitarchivierung
   • Zu jedem Objekt kann xml-File zur Beschreibung der
     Metadaten und des zugehörigen Digitalisats erzeugt
     werden
   • Oktober 2007: Ablage dieser Daten auf Speicherbereich
     im URZ
   • Geplant: DFG Antrag zur Langzeitarchivierung der Daten
     in kopal

© 2007 Thüringer Universitäts- und Landesbibliothek Jena
Geplant

   • Entwicklung einer Leitlinie für die Definition der
     Archivpakete
   • Erarbeitung eines Workflows, Definition der
     Einspeisewege
   • Anbindung der Präsentationssysteme an kopal
   • Einbindung der koLibRi Bibliotheken in MyCoRe
   • Abgleich von Präsentations- und Archivdaten

© 2007 Thüringer Universitäts- und Landesbibliothek Jena
Geplant

         Journals@UrMEL
         + koLibRi Bibliothek                                      Restore im Verlustfall
                                                Filesystem mit     oder bei evtl. erfolgter Formate
          :q                                    Digitalisaten      Migration in kopal
                Datenbank

                                            Archivierung der Daten
                                            Erzeugung der METS –Datei
                   Kopal                    und des Archivpakets mit
                                            koLibRi Bibliothek

© 2007 Thüringer Universitäts- und Landesbibliothek Jena
Danke für die Aufmerksamkeit

© 2007 Thüringer Universitäts- und Landesbibliothek Jena
Sie können auch lesen