News - Steinbuch Centre for Computing (SCC)

Die Seite wird erstellt Sam Wichmann
 
WEITER LESEN
News - Steinbuch Centre for Computing (SCC)
news
Steinbuch Centre for Computing                                                 Ausgabe 2 | 2016

                                           Ein offener Hafen für Forschungsdaten
                                           An Open Haven for Research Data

                                           Landesdienst bwDataArchiv geht in Betrieb
                                           State-wide Service bwDataArchiv goes into Operation

                                           Smart Data Innovation Conference 2016 am SCC
                                           Smart Data Innovation Conference 2016 at SCC

         KIT – Die Forschungsuniversität in der Helmholtz-Gemeinschaft
                                                                                     | 01
                                                                               SCCnews
                                                                                   www.kit.edu
News - Steinbuch Centre for Computing (SCC)
Editorial

Liebe Leserinnen und Leser,
im Sommer dieses Jahres hat der von Bund und Ländern berufene Rat für Informationsinfrastrukturen
(RfII) Empfehlungen zum Forschungsdatenmanagement in Deutschland veröffentlicht. Darin macht der
Rat den Vorschlag eine „Nationale Forschungsdateninfrastruktur“ als Netzwerk mit übergreifenden Zent-
ren zu errichten. Durch deren ausgeprägte Expertise in der Beschreibung, der Verarbeitung, und Speiche-
rung bis hin zur Langzeitarchivierung von Forschungsdaten, sollen tragfähige und nachhaltige Strukturen
im Forschungsdatenmanagement geschaffen werden.

Nur etwa drei Monate später gab die Helmholtz-Gemeinschaft bekannt, mit Beginn 2017 ein solches
Netzwerk aus multi-thematischen Datenzentren – die Helmholtz Data Federation (HDF) aufzubauen. Die
Helmholtz-Zentren betonen dabei ihre Bereitschaft, die notwendigen Dateninfrastrukturen zu schaffen,
dort Forschungsdaten langfristig zu bewahren und sie anderen zur Nachnutzung so offen wie möglich
zugänglich zu machen (S. 18).

Das SCC am KIT koordiniert die HDF-Aktivitäten und bringt hier eine über Jahre erlangte Erfahrung in der
Handhabung von großen Mengen wissenschaftlicher Daten ein. Ein wichtiger Baustein in diesem System
ist der gerade in Betrieb gegangene Service bwDataArchiv, der von Wissenschaftseinrichtungen des Lan-
des zur nachhaltigen Speicherung und Archivierung von Forschungsdaten genutzt werden kann (S. 6).

Neben den großen Datenmengen aus der Wissenschaft, die am SCC gespeichert und archiviert werden,
bietet das SCC auch Dienste für die Smart Data-Forschung an. Das am SCC ansässige Smart Data Innovation Lab hat nun ein Projekt-
jahr erfolgreich in Kooperation mit Wirtschaftsunternehmen gemeistert. Die Ergebnisse der Projekte wurden auf der ersten Smart Data
Innovation Conference am KIT vorgestellt und diskutiert (S. 4).

Noch etwas in eigener Sache: Unser Kollege Hannes Hartenstein lässt sein Amt im Direktorium des SCC seit Oktober diesen Jahres
ruhen, um sich verstärkt der Fortentwicklung der Governance der Informationsverarbeitung und -versorgung am KIT zuwenden zu
können. Wir wünschen ihm viel Erfolg und freuen uns auf die weitere gute Zusammenarbeit.

Viel Freude beim Lesen.                                                                                   Bernhard Neumair, Achim Streit

Dear reader,

In the summer of this year, the Council for Information Infrastructures (RfII) published recommendations on research data manage-
ment in Germany. In the recommendations, the Council proposes a National Research Data Infrastructure conceived as a network with
overarching centers. Their extensive expertise in the description, processing, storage and long-term archiving of research data enables
establishment of a sustainable research data management structures.
Only about three months later, the Helmholtz Association announced the development of such a network of multi-thematic data
centers - the Helmholtz Data Federation (HDF). With the HDF, the Helmholtz Centers emphasize their readiness to create the necessary
data infrastructure, to maintain research data in the long term for future use and to make the results as open as possible (page 18).
The SCC of KIT coordinates the activities of the HDF and provides its experience gained over many years in the handling of large
quantities of scientific data. An important building block in this system is the bwDataArchiv service that has just been put into operati-
on. The service can be used by scientific institutions of the state of Baden-Wuerttemberg and offers sustainable long term storage and
archiving of research data (page 6).
In addition to the large amounts of data collected and archived, the SCC also delivers services for smart data research. The Smart Data
Innovation Lab conducted a successful project year with increased cooperation with business enterprises. The results were presented
and discussed among participants at the first Smart Data Innovation Conference at KIT (page 4).
On a final note: Our colleague Hannes Hartenstein temporary left the Board of Directors of the SCC since October in order to dedicate
more time to the further development of the governance of information, communication and information technologies at KIT.
We wish him lots of success and look forward to further cooperation.

Enjoy reading                                                                                             Bernhard Neumair, Achim Streit

02 |         SCCnews
News - Steinbuch Centre for Computing (SCC)
Inhaltsverzeichnis

          DIENSTE UND INNOVATION

		   04   Smart Data Innovation Conference 2016 am SCC

		   06   Landesdienst bwDataArchiv geht in Betrieb

		   08   Virtuelle Graphikworkstations im Betrieb – ein Projektfazit

		   11   ILIAS 5 – Update des E-Learning-Systems des KIT

          FORSCHUNG UND PROJEKTE

		   13   V-FOR-WaTer – Eine virtuelle Forschungsumgebung
          für die Wasser- und terrestrische Umweltforschung

		   14   EUDAT Operations Management

		   16   Gründung der EUDAT Collaborative Data Infrastructure

		   17   bwDIM – Vereinfachter Datenfluss im Forschungsdatenmanagement

		   18   Ein offener Hafen für Forschungsdaten

		   18   Abgeschlossene Promotionsarbeit

		   19   Laborbuch 2.0 – digital und dezentral verfügbar

		   20   Sternenstaub, Wasserflöhe und Hochleistungsrechner:
          3. bwHPC-Symposium am Universitätsrechenzentrum Heidelberg

          STUDIUM UND WISSENSVERMITTLUNG

		   22   „Erste Hilfe“ für Erstsemester

		   23   Internationale GridKa Schule – Data Science on Modern Architectures

		   24   Oktober 2016 – der Cyber Security Month

          VERSCHIEDENES

		   25   Schülerkolloquium Simulierte Welten am SCC

		   26   31. International Supercomputing Conference

		   27   Forschungsdaten managen – E-Science-Tage 2017

		   27   Inside SCC – hohes Medien- und Besucherinteresse in 2016

		   27   Impressum & Kontakte

                                                                                SCCnews   | 03
News - Steinbuch Centre for Computing (SCC)
DI E N STE UND I NN OVATION

Smart Data Innovation Conference 2016 am SCC
Das SCC hat im Oktober 2016 die erste Smart Data Innovation Conference organisiert. Im Rahmen dieser Kon-
ferenz wurden die Ergebnisse aus dem ersten Projektjahr des Smart Data Innovation Labs öffentlich vorgestellt
und mit dem angereisten Fachpublikum diskutiert.                                                                      Nico Schlitter

Das Smart Data Innovation Lab (SDIL) ist      um realitätsnahe Forschung in diesen        (siehe auch SCC-News 2015, S​ . 4 und
ein seit 2014 bestehendes bundesweites        strategisch wichtigen Feldern zu fördern.   looKIT Ausgabe 3/2016, S. 30).
Labor für Smart Data-Forschung auf Basis
von In-Memory Big Data-Technologien.          Die Hauptkomponenten der SDIL-Platt-        Die Projektmitarbeiter am Karlsruher
SDIL ist als Austausch- und Betriebsplatt-    form umfassen die In-Memory Datenban-       Institut für Technologie (KIT), am Deut-
form konzipiert, um die Kooperation           ken HANA von SAP und Terracotta der         schen Forschungszentrum für Künstliche
zwischen Wirtschaft, und Forschung im         Software AG, sowie die Big Data-Lösun-      Intelligenz (DFKI) und am Fraunhofer-
Bereich Big Data- und Smart Data-Tech-        gen der IBM Watson Foundation, inkl.        Institut für Intelligente Analyse- und
nologien zu beschleunigen. Unternehmen        SPSS Modeler und BigInsights. Die not-      Informationssysteme (IAIS) untersuchen
und Forschungseinrichtungen haben sich        wendigen Hardwareressourcen wurden          wissenschaftliche Fragestellungen aus
dazu als Partner in den vier SDIL-Commu-      von den Projektpartnern als Leihstellung    den Bereichen Dateninfrastruktur,
nities Industrie 4.0, Energie, Smart Cities   ins Smart Data Innovation Lab einge-        -analyse, -integration, -kuratierung und
und personalisierte Medizin organisiert,      bracht und werden vom SCC betrieben         -anonymisierung.

Abb. 1: Schematische Darstellung der SDIL-Plattform

04 |         SCCnews
News - Steinbuch Centre for Computing (SCC)
D IE N S T E U N D IN N OVAT I O N

Die Ergebnisse aus dem ersten Projektjahr
des Smart Data Innovation Labs wurden
am 12. und 13. Oktober 2016 im Rah-
men der Smart Data Innovation Confe-
rence (SDIC) öffentlich vorgestellt und mit
dem angereisten Fachpublikum diskutiert.

Der erste Konferenztag war durch an-
geregte Diskussionen in den Innovation
Communities geprägt, welche das Ziel
hatten neue Projektideen zu entwickeln
und entsprechende Forschungskooperati-
onen zu initiieren. Am Folgetag wurden,
im Rahmen von wissenschaftlichen
Vorträgen, die Projektergebnisse der Pro-
jektpartner präsentiert. Eine Postersession
rundete das wissenschaftliche Programm
des Vormittags ab.

Der Nachmittag war der praktischen            Abb. 2: Wissenschaftlicher Fachvortrag auf der SDIC über Big Data Analysen
Einführung in die vielfältigen Möglichkei-
ten der SDIL-Plattform gewidmet. In drei
parallel stattfindenden Tutorials konnten     Morris Riedel, vom Forschungszentrum
die Teilnehmer, unter Anleitung des SDIL      Jülich, gab eine praktische Einführung in
Support Teams, die Plattform hautnah          die Datenanalyse und demonstrierte wie
kennenlernen und testen:                      typische Klassifikationsprobleme mit Hilfe
                                              von parallelisierten Support-Vektor-Ma-
                                              schinen auf dem mit htCondor und MP
                                              betriebenen SDIL-Cluster gelöst werden
                                              können.

                                              Michael Vössing, vom Karlsruhe Service
                                              Research Center (KSRI) am KIT, konnte
                                              den Teilnehmern näher bringen, wie die
                                              umfangreichen, im IBM SPSS Modeler
                                              enthaltenen Analyseverfahren durch              Smart Data Innovation Conference
                                              die Nutzung des IBM Watson Clusters             2016 at SCC
                                              beschleunigt werden können.                     The Smart Data Innovation Lab (SDIL)
                                                                                              offers big data researchers access to a
                                              Die Nutzung der SAP HANA Datenbank              large variety of big data and in-memo-
                                              wurde von Markus Fath (SAP Deutsch-             ry technologies. Industry and science
                                              land) demonstriert. Besonderen Eindruck         collaborate closely to find hidden
                                              hinterließen dabei die Funktionalitäten,        value in big data and generate smart
                                              die über die typischen Funktionen eines         data. In October 2016, SCC hosted
                                              klassischen relationalen Datenbanksys-          the Smart Data Innovation Confe-
                                              tems hinausgehen.                               rence (SDIC2016) and presented first
                                                                                              results of the SDIL research project to
                                              Aufgrund des durchweg positiven Feed-           the public. In addition, the SDIC2016
                                              backs der Konferenzteilnehmer haben wir         participants had the opportunity to
                                              beschlossen, die Smart Data Innovation          participate in tutorials and hands-on
Abb. 3: Projektleiter Nico Schlitter erläu-   Conference auch im nächsten Jahr am             trainings and get familiar with the
tert die Komponenten des Smart Data           Steinbuch Centre for Computing durch-           unique potential of the SDIL platform.
Innovation Labs.                              zuführen.

                                                                                                             SCCnews       | 05
News - Steinbuch Centre for Computing (SCC)
DI E N STE UND I NN OVATION

Landesdienst bwDataArchiv geht in Betrieb
bwDataArchiv, der neue Landesdienst für die Langzeitspeicherung und Archivierung von Forschungsdaten, geht
in Betrieb. Mit dem neuen Dienst lassen sich große wissenschaftliche Datensätze über 10 Jahre und mehr zu-
verlässig speichern.                                                                                                 Bettina Bauer, Jos van Wezel

Das Landesprojekt bwDataArchiv schließt           Zeitgleich mit dem Projekt bwDataArchiv               rechenzentrum (DKRZ) und verschiedenen
zum Jahresende seine dreijährige Pro-             und ebenso mit Beteiligung des SCC,                   führenden amerikanischen Rechenzentren
jekttätigkeit ab und startet nun mit dem          wurden weitere Langzeitspeicherdienste                zum Einsatz, welche auch die Weiterent-
gleichnamigen Dienst. bwDataArchiv                für Forschungsdaten aufgebaut, die die                wicklung des Systems verantworten. Die
ermöglicht es, Wissenschaftlerinnen und           Speicherinfrastruktur von bwDataAr-                   Infrastruktur ist hierarchisch aufgebaut
Wissenschaftlern in Baden-Württemberg,            chiv nutzen, jedoch über einen eigenen                und bietet, neben einem schnell zugreif-
Forschungsdaten zu archivieren. Erste             Nutzerkreis für Spezialanwendungen                    baren Plattenspeicher, in einer tieferen
Pilotnutzer speichern Daten, z. T. große          bedienen und dafür eine eigene Nut-                   Speicherschicht Magnetbandspeicher, der
Mengen, schon seit Mitte 2015 erfolg-             zerverwaltung betreiben. bwDataArchiv                 am KIT über mehrere Bandbibliotheken
reich mit dieser Technologie. Dabei han-          arbeitet mit den Diensten RADAR2 und                  an zwei Standorten mit Bandlaufwerken
delt es sich vor allem, aber nicht nur, um        bwDataDiss3 zusammen. Eine internatio-                von unterschiedlichen Herstellern verteilt
Nutzer des Projektpartners HLRS1.                 nale Ausrichtung der Aktivitäten erfolgt              ist. Die HPSS-Architektur gewährleistet
                                                                     durch die Einbindung               eine beliebige Skalierung und einen brei-
                                                                     des EU-Projekts EUDAT,             ten Einsatzbereich, sowohl als Speicher
                                                                     das ihren Nutzern                  mit hohem Durchsatz, als auch beim
                                                                     den Dienst B2SAFE                  Dienst bwDataArchiv, als eine verlässliche
                                                                     zur Verfügung stellt.              und wirtschaftliche Datenablage.
                                                                     Zusammen mit dem
                                                                     Dienst B2FIND entsteht             bwDataArchiv kann als Speicherkompo-
                                                                     so ein Archivspeicher-             nente für ausgefeilte Langzeitarchivie-
                                                                     angebot für interna-               rungslösungen begriffen werden. Der
                                                                     tionale Communities.               Dienst bietet den Forschenden aber auch
                                                                     EUDAT beteiligt sich               die Möglichkeit initiativ und eigenverant-
                                                                     auch konzeptionell am              wortlich Daten auf lange Sicht zugreifbar
Abb. 1: Gespeicherte Datenmengen und Anzahl an Dateien               Dienst bwDataArchiv.               zu machen. Gewährleistet wird dies durch
seit Inbetriebnahme des HPSS-Speichersystems                         Es entwickelt eine Lö-             ein sicheres Speicherverfahren, Bitstream
                                                                     sung zur Gewährleis-               Preservation genannt, das neben der
                                                                     tung und effizienten               Kontrolle der Daten durch Checksum-
         Preservation projects    Generic archive for users of       kontinuierlichen Über-             men, eine sichere Übertragung und eine
                                     Universities, Libraries                                            redundante Ablage auf Magnetbändern
                                                                     prüfung der Dateninte-
                                Cultural and Scientific Institutes
                                                                     grität des Archivs.                vorsieht. Im Vordergrund steht die trans-
                                                                                                        parente Einbindung der Archivierungs-
                                                                              Als Speicherinfrastruk-   komponente in den Speicherungs- und
                                                                              tur nutzt bwDataArchiv    Datensicherungsworkflow des Nutzers.
                                                                              ein HPSS-System (High     Für bwDataArchiv kommen das universel-
                                                                              Performance Storage       le Übertragungsprotokoll sftp4 und die im
                                         Secure Access                        Management) mit           Grid-Umfeld verwendete Variante GridFTP
                        Policies                         Bit‐Preservation
                                                                              theoretisch unbegrenz-    zur Anwendung. Für die Übertragung mit
              Disk                 HSM                                        tem Speicherplatz. Das    GridFTP bietet bwDataArchiv mit der Ei-
                                                    Tape              Tape

             Metadata
                                                   Copy 1            Copy 2   Datenmanagementsys-       genentwicklung bwDAHub eine vorkonfi-
            Archive System / HPSS                                             tem HPSS kommt unter      gurierte Lösung auf Basis von uberftp und
                                                                              anderem bei der Max       globus-url-copy. Die grobe Architektur der
Abb. 2: bwDataArchiv bietet Wissenschaftlern von Einrich-                     Planck Computing and      bwDataArchiv-Infrastruktur zeigt Abb. 3.
tungen in Baden-Württemberg sowie unterschiedlichen                           Data Facility (MPCDF),
Forschungsprojekten mit hohem Datenaufkommen einen                            dem Deutschen Klima-
verlässlichen Langzeitspeicher.

06 |         SCCnews
News - Steinbuch Centre for Computing (SCC)
D IE N S T E U N D IN N OVAT I O N

          HPSS data base servers                                                                        front‐end nodes (sftp, gridftp)

                                                                              Data
                                                                             Network
            standby production

                                                                                               HPSS data
                                                                                              mover nodes

                                                                              SAN

            Tape Library – IBM                                                                                         Tape Library – Oracle
              TS1140 drives                                          2 x 200 TB disk cache                                 10kD drives
Abb. 3: Schematische Darstellung der bwDataArchiv-Infrastruktur

Eine geplante Weiterentwicklung von                        Ministeriums für Wissenschaft und Kunst      Dienstes haben mitgewirkt: Thomas Bö-
bwDataArchiv sieht eine einfache Pub-                      (MWK) in das Langzeitspeicherprojekt mit     nisch, Frank Scheiner und Björn Schem-
likationskomponente für automatisch                        ein. Der Zugang zum Dienst bwDataAr-         bera (HLRS). Felix Bach, Bettina Bauer,
erzeugte Daten aus Messinstrumenten                        chiv erfolgt über das föderierte Identi-     Ahmad Hammad, Dorin-Daniel Lobontu
und die Funktionalität des begrenzten                      tätsmanagementsystem bwIDM. Nutzer           und Jos van Wezel (SCC).
Austauschs von Forschungsdaten in                          außerhalb der Föderation erhalten den
Arbeitsgruppen vor. Die Anforderungen                      Zugang z.B. über eine, von einem KIT-Mit-
für die Entwicklung dieser Komponenten                     arbeiter initiierte, persönliche Einladung
                                                                                                            State-wide Service bwDataArchiv
basieren auf Nutzerwünschen, die unter                     via System-Mail.
                                                                                                            goes into Operation
anderem über das Landesprojekt bwFDM-
                                                                                                            With the bwDataArchive service
Communites erhoben wurden. Das Lan-                        Als Landesdienst wird bwDataArchiv
                                                                                                            research data can be securely stored
desprojekt bwDIM (bwDataInMotion) bei                      ab 1.1.2017 Nutzern aus baden-würt-
                                                                                                            for many years. Scientists are offered
dem das SCC, die KIT-Bibliothek und das                    tembergischen Hochschulen und deren
                                                                                                            an easy to use platform that integrates
Leibniz Institut für Informationsinfrastruk-               Projektpartnern zur Verfügung stehen.
                                                                                                            with daily scientific workflows and
tur (FIZ) zusammenarbeiten, gewährleistet
                                                                                                            offers a solution to their data manage-
eine Weiterentwicklung des Dienstes                        Weitere Informationen findet man unter
                                                                                                            ment requirements. The service that
und bindet die E-Science-Initiativen des                   www.rda.kit.edu. Beim Aufbau des
                                                                                                            builds on the HPSS storage system, is
                                                                                                            available for members of institutes in
                                                                                                            the state of Baden-Wuerttemberg and
  1
      Höchstleistungsrechenzentrum Stuttgart                                                                will be used as reliable bit storage by
  2
      Research Data Repository (s. SCC-News 2015, S. 25)                                                    several projects and high level archival
  3
      Archivierung von Dissertationen (s. SCC-News 2/2014, S. 37)                                           applications.
  4
      secure file transfer protocol

                                                                                                                           SCCnews        | 07
News - Steinbuch Centre for Computing (SCC)
DI E N STE UND I NN OVATION

Virtuelle Graphikworkstations im Betrieb – ein Projektfazit.
Moderne Röntgentomographie, wie sie mit der ANKA-Synchrotronstrahlungsquelle durchgeführt wird, liefert
enorme Datenmengen. Die zeitliche und räumliche Auflösung der Bilder erfordert leistungsfähige Analyseum-
gebungen, die nicht nur in der Lage sind, hohe Datenraten zu verarbeiten, sondern diese auch graphikbeschleu-
nigt in 2D/3D zu analysieren. Im Rahmen des Projekts ASTOR wurde eine innovative Hard- und Softwareumge-
bung geschaffen, die Wissenschaftlern virtualisierte Graphikworkstations mit OpenGL-fähigem Remotezugang
ad hoc zur Verfügung stellt. Diese einmalige Umgebung ist seit Anfang 2015 in Betrieb und wird sogar von
Gastwissenschaftlern der Pennsylvania State University genutzt.                             Dr. Matthias Bonn, Dr. Wolfgang Mexner1

Virtuelle Graphikworkstations                 den üblichen virtuellen Infrastrukturen       und ein Portal [1] entwickelt, das die
                                              nicht vorhanden ist, und Spezialsoftware,     notwendige Orchestrierung des Clusters
Das Ziel des (inzwischen abgeschlos-          die in typischen virtuellen Serverinstanzen   anstößt und alle Konfigurations- und
senen) ASTOR-Projektes liegt darin,           nicht läuft und auch nicht mit Webtech-       Migrationsvorgänge der sehr komplexen
wissenschaftliche Analysesoftware in          niken verfügbar gemacht werden kann.2         VMware-API vor dem Nutzer versteckt.4
virtualisierten Arbeitsplätzen, ähnlich       VM-Ware-Spezialisten des SCC haben            Aus Nutzersicht ist lediglich eine von
einer echten Workstation, schnell und un-     deswegen zusammen mit Wissenschaft-           verschiedenen Vorlagen für virtuelle
kompliziert zur Verfügung zu stellen. Die     lern der KIT-Institute IBPT und IPS einen     Computer zu selektieren (VM-Templates),
Darstellung von 2D/3D-Daten, wie sie die      VMware vSphere-Cluster aufgebaut, der         mit der gewünschten CPU-, RAM- und
Röntgentomographie erzeugt, erfordert         hardwareseitig mit den notwendigen            Plattenkapazität zu konfigurieren und
leistungsfähige Graphikhardware, die in       Graphikbeschleunigern ausgestattet ist3       dann zu starten (Abb. 1). Neben speziel-
                                                                                                                len ASTOR-Templates
                                                                                                                werden allgemein
                                                                                                                gehaltene Templates,
                                                                                                                auch ohne Graphikbe-
                                                                                                                schleunigung, in ver-
                                                                                                                schiedenen Linux- und
                                                                                                                Windowsvarianten
                                                                                                                angeboten, so dass
                                                                                                                auch weniger spezielle
                                                                                                                VM-Wünsche abge-
                                                                                                                deckt werden können.
                                                                                                                Hierbei können
                                                                                                                verschiedene, auch
                                                                                                                geographisch verteilte,
                                                                                                                vSphere-Installationen
                                                                                                                integriert werden, so
                                                                                                                dass Nutzergruppen
                                                                                                                voneinander sepa-
                                                                                                                rierte Umgebungen
                                                                                                                nutzen können. Der
                                                                                                                Instanziierungsprozess
                                                                                                                einer neuen VM im
                                                                                                                ASTOR-Cluster dauert,
                                                                                                                abhängig vom Templa-
                                                                                                                te und der gewählten
                                                                                                                Festplattengröße,
Abb. 1: Virtuelle Maschinen im ASTOR-Portal                                                                     5-15 Minuten. Danach

08 |        SCCnews
News - Steinbuch Centre for Computing (SCC)
D IE N S T E U N D IN N OVAT I O N

ist der Login mit einem
speziellen Client (VMware
Horizon), der den graphik-
beschleunigten Windows-
Desktop per OpenGL oder
DirectX remote zugänglich
macht, möglich, und die
vorinstallierte Analysesoft-
ware kann genutzt werden.
Der Systemzugang zu den
Standard VMs ohne GPU
geschieht mit den üblichen
Bordmitteln Secure Shell
(SSH) bzw. Remote Desktop
Protocol (RDP).

Die für den Nutzer gene-
rierten Rohbilddaten der
Röntgentomographieex-
perimente werden der
VM automatisch über ein
nutzerspezifisches Netz-
laufwerk mit einer 10
GBit/s-Netzwerkanbindung           Abb. 2: Remotezugriff auf eine VM mit der Analysesoftware VGStudio MAX
eingeblendet. Entspre-
chende Mountpunkte und
deren Einbindung sind in den Templates         Konten im VMware-Orchestrierungsdienst       wissenschaftler der Pennsylvania State
voreingestellt. So steht innerhalb weniger     für den ASTOR-Cluster freigeschaltet.        University beteiligt, wobei zeitweise bis
Minuten eine Arbeitsumgebung (wie in           Die Authentifizierung der Nutzer an den      zu 25 ASTOR-VMs existierten. Da jedoch
Abb. 2) zur Verfügung, für deren Nut-          Webportalen geschieht über Shibboleth        nur maximal acht davon gleichzeitig
zung lediglich ein Standard-Notebook,          Web-SSO. Die Authentifizierung an den        mit Graphikprozessor (GPU) betrieben
eine gewöhnliche 16 MBit DSL-Anbin-            OpenGL-Gastsystemen wird mit dem             werden können, wurde ein Mechanismus
dung ans Internet zur Remote-Bildüber-         LDAP-Fassadenkonto durchgeführt, bei         eingerichtet, der dafür sorgt, dass nicht
tragung und ein KIT-Benutzerkonto              den generischen Gastsystemen mit loka-       benötigte VMs heruntergefahren werden,
notwendig sind. Der Registrierungspro-         len root/Administratorrechten.               so dass die genutzten Ressourcen frei-
zess läuft dabei zweistufig ab: Zunächst                                                    gegeben und von anderen VMs genutzt
melden sich die Nutzer am Portal für           Nutzungserfahrungen                          werden können.6 Dieses Verfahren ist ein
Föderierte Dienste am KIT (bwidm.scc.                                                       Accounting und Billing mit sogenannten
kit.edu) für den ANKA-Dienst an, so dass       Seit Anfang 2015 wurden die virtuellen       virtuellen Euros. Hierzu wird die Fähigkeit
die Bilddatenspeicher für den Nutzer           Graphikworkstations von ca. 15 Nutzern       des VM-Orchestrierungsdienstes genutzt,
ansprechbar werden. In einem zwei-             – überwiegend Biologen – in Anspruch         im einstelligen Minutentakt bis zu ca. 25
ten Schritt werden die entsprechenden          genommen. Unter anderem waren Gast-          Ressourcenverbrauchsmetriken pro VM zu

  1
      Institut für Beschleunigerphysik und Technologie (IBPT) am KIT
  2
      Wie z. B. die im Projektkontext eingesetzten Amira oder VG Studio MAX auf Basis von Windows Server.
  3
      Die Projektumgebung besteht aus zwei ESXi Hosts, die zusammen 16 3 GHZ Xeon Kerne, 700 GB RAM und 8 NVIDIA GRID K2 GPU Kerne anbieten.
      Für die VM-Images stehen 21 TB NFS-Speicher zur Verfügung.
  4
      Technisch kommt PCIPassthrough zum Einsatz, das ein physisches PCI-Device direkt in eine VM einblendet, weswegen verschiedene VMware-Automatismen
      wie DRS und vMotion für die betreffenden VMs nicht nutzbar sind und die Zuordnung von VM zu Host und PCI-Device selbst durchgeführt werden muss.
  5
      Das Mapping erfolgt hier über den Shibboleth-internen Identifier ePPN (eduPersonPrincipalName)
  6
      Die bei VMware normalerweise problemlose Überprovisionierung von Laufzeitressourcen, wie RAM, steht bei laufenden VMs mit PCI-Passthrough-Hardware nicht zur
      Verfügung. Eine gestartete VM erhält ihre Ressourcen immer exklusiv reserviert. Stehen die Ressourcen nicht zur Verfügung, kann die VM nicht gestartet werden.

                                                                                                                                              SCCnews          | 09
News - Steinbuch Centre for Computing (SCC)
DI E N STE UND I NN OVATION

erfassen und über längere Zeiträume,                       werden vollautomatisch durchgeführt,                       Workstations, signifikante Verbesserun-
u. a. in Stunden- und Tagesaggregati-                      eine einmalige oder dauerhafte Erhöhung                    gen. Wissenschaftler können somit ein
onen, zu archivieren. Darauf aufbauend                     des monatlichen Budgets ist jedoch zu-                     flexibles System von überall aus nutzen,
ist ein Kostenmodell7 erstellt worden, das                 sätzlich möglich. Dieser Mechanismus er-                   das zudem wesentlich leichter auf einem
den Ressourcenverbrauch auf Stunden-                       höhte die Disziplin der Nutzer. Durch das                  aktuellen technischen Stand (Hard- und
basis in virtuelle Euros umrechnet und                     veränderte Verhalten und den Zeitzonen-                    Software, inklusive Lizensierung) gehalten
bei Überschreiten eines monatlichen                        versatz der amerikanischen Anwender,                       werden kann. Dies gilt nicht nur für die
Grundbudgets zunächst den betreffenden                     konnten deutlich mehr Forscher bedient                     spezialisierte ASTOR-Umgebung, sondern
Nutzer informiert und später dann die                      werden, als es mit den verfügbaren                         auch für damit bereitgestellte VMs, die
VMs des Nutzers mit steigender Frequenz                    Ressourcen oder gar physischen Worksta-                    dem generellen Einsatz in Forschung und
abschaltet. Das definierte Kostenmodell                    tions machbar gewesen wäre.                                Lehre dienen. Darüber hinaus könnten
erlaubt es, eine typische GPU-VM zehn                                                                                 die VMs feingranular monetär abgerech-
Stunden pro Tag zu nutzen, dabei bleibt                    Fazit                                                      net werden.
es dem Nutzer überlassen, wie er das
jeweilige Kontingent einsetzt. Ein Kosten-                 Die Implementierung der ASTOR-System-
simulator erlaubt es vorab, die entstehen-                 umgebung stellt einzigartige Funktionen
den „virtuellen Kosten“ abzuschätzen.                      zur Verfügung und bietet, im Vergleich zu                    Weitere Informationen
Die Billing- und ggf. Shutdown-Prozesse                    traditionellen IT-Umgebungen mit lokalen                     [1] https://astor.kit.edu

  7
      Beispiel für die flexible virtuelle Abrechnung: 0.007 € pro GB RAM + 0.05 € pro CPU Core + 0.5 € pro nVidia GPU Core, stündlich und nur bei laufender VM.
      VM-Imagespeicher und die genutzte CPU-Takte werden erfasst, aber nicht eingerechnet.

Working with Virtual Graphics Workstations – Results of the ASTOR-Project
Modern X-ray tomography, as provided by the ANKA synchrotron light facility, results
in immense data amounts, the temporal and spatial resolution of the resulting 3D
images demands for powerful environments. These hard- and software must be able
to process the high data rates and needs the capability to analyze the image data
with help of accelerated graphics processing in 2D/3D. Within the ASTOR project,
the SCC has implemented together with scientists of IBPT and IPS a system providing
scientists virtualized workstations with an OpenGL accelerated graphics subsystem,
remotely usable from everywhere in the Internet. The environment is in use since
2015, is usable cloud-like as-a-service, and it is currently also evaluated by guest
scientists from Pennsylvania State University.

10 |             SCCnews
D IE N S T E U N D IN N OVAT I O N

ILIAS 5 – Update des E-Learning-Systems des KIT
DieILIAS   5 – Update
    neue Version          desbetriebenen
                 5 des am SCC E-Learning-Systems
                                         E-Learning Systemsdes
                                                            ILIASKIT
                                                                 wurde im September 2016 eingespielt.
MitDie  neue
    ILIAS    Version
          5 wurden    5 des
                   nicht nur am  SCC betriebenen
                              notwendige          E-Learningdurchgeführt,
                                         Sicherheits-Updates Systems ILIASeswurde
                                                                            stehen im
                                                                                    nunSeptember
                                                                                        auch neue 2016
                                                                                                  Funkti-
  eingespielt.
onen           Mit ILIAS 5 wurden nicht nur notwendige Sicherheits-Updates
     zur Verfügung.                                                        durchgeführt,
                                                                        Franziska           esAlvar
                                                                                  Wandelmaier, stehen
                                                                                                    Wenzel
      nun auch neue Funktionen zur Verfügung.

Neuerungen                                                               Es ist geplant über    weitere Highlights
                                                                                           Franziska                 der neuen
                                                                                                          Wandelmaier,          ILIAS-Version
                                                                                                                              Alvar   Wenzel
                                                                         auf der ILIAS-Startseite als „Tipp des Tages“ zu informieren. Im
ILIAS 5 verfügt über eine erweiterte Funktionalität1, die z.T. auch      Zuge der Weiterentwicklung von ILIAS wurde mit der Version 5
     Neuerungen
speziell von den ILIAS-Nutzerinnen und Nutzern am KIT ge-                auch das äußere Erscheinungsbild moderner gestaltet, beispiels-
                                                                      1
     ILIAS 5  verfügt
wünscht wurde, z.B.     über   eine   erweiterte    Funktionalität     , die z.T.
                                                                         weise       auch
                                                                                 durch  neuespeziell
                                                                                               Icons (s. von
                                                                                                         Abb. den    ILIAS-Nutzerinnen
                                                                                                               1). Außerdem    wurde das Layout
     und NutzernNachrücken
„„ Automatisches      am KIT gewünscht        wurde, z.B.
                                 von Wartelisten                         für mobile Anzeigegeräte weiter optimiert.
„„ Laden auch mehrerer Dateien gleichzeitig in Kursräume
    per Drag
           & rücken
                Drop     Mitglieder auf der Warteliste eines Kurses      Was bedeutet       die Umstellung
                                                                                  mit maximaler                 für die ILIAS-Nutzerinnen
                                                                                                         Teilnehmeranzahl
„„ schnelles Aufräumen des „Persönlichen Schreibtischs“                  und Nutzer?
               automatisch nach, wenn sich ein Kursmitglied vom Kurs abmeldet oder abgemeldet wird;
    durch gleichzeitiges Löschen mehrerer Objekte
           Sortiermöglichkeiten,
„„ erweiterte  können mehrere etwa    Dateien    gleichzeitig
                                           innerhalb von Gruppen per Drag    & Drop inändert
                                                                         Grundsätzlich       die Kursräume         geladen werden;
                                                                                                   sich für die Nutzerinnen   und Nutzer von
                                                                         ILIAS  durch  die  Umstellung
           kann der „Persönliche Schreibtisch“ schneller aufgeräumt werden, da in ILIAS 5 an dieser
    und Kategorien                                                                                        wenig.  Es hat sich gezeigt, dass die
„„ PDF-Export von Wikis (für bestimmte Seiten oder insgesamt)            meisten Nutzer sich nach kurzer Zeit an das neue Erscheinungs-
               Stelle nun die Löschung mehrerer ausgewählter
„„ erweiterte Link-Möglichkeiten in Wikis
                                                                                Objekte gleichzeitig möglich ist.
                                                                         bild gewöhnen konnten (Vergleich s. Abb. 1) und keine gravie-
„„ Zuordnung beliebig vieler Kursbetreuer mit Kontakt-                   renden Probleme bei der Bedienung auftraten.2
     Im Zuge der
    Möglichkeit überWeiterentwicklung
                      die Info-Seite des Kursesvon ILIAS wurde mit der Version 5 auch das äußere Erscheinungsbild
     moderner
„„ gezielter      gestaltet,
             Versand            beispielsweise
                      von E-Mails  aus Kursen, etwadurch
                                                     nur an neue Icons          Fehler!
                                                                            (s.bereits
                                                                         Alle               Verweisquelle
                                                                                       in ILIAS  4.3 vorhandenen  konnte    nicht automatisch
                                                                                                                     Kurse wurden
    Administratoren  oder
     gefunden werden.).    nur an Tutoren                                in die  neue  Version   5.1  überführt. Die  Dozierenden   selbst muss-

                                                                                           ILIAS 5

                             ILIAS 4.3
Abb. 1: Neue Funktionen im veränderten Layout von ILIAS 5 (rechts); daneben zum Vergleich die Ansicht in ILIAS 4.3
      Abbildung 1: Neue Icons in ILIAS 5 (rechts); daneben zum Vergleich die Icons von ILIAS 4.3
  1
      Zu den Neuerungen siehe auch das Feature Wiki von ILIAS: http://www.ilias.de/docu/goto.php?target=wiki_1357_Overview&lang=de
  2   Was bedeutet die Umstellung für die ILIAS-Nutzerinnen und Nutzer?
      Um den ILIAS-Nutzerinnen und Nutzern den Umstieg zu erleichtern, bietet das Zentrum für Mediales Lernen (ZML) Schulungen, Webinare und
      Grundsätzlich ändert sich für die Nutzerinnen und Nutzer von ILIAS durch die Umstellung wenig. Es
      weitere Informationsmaterialien zur neuen Version 5 an: http://www.zml.kit.edu/e-learning-schulungen.php.

      hat sich gezeigt, dass die meisten Nutzer sich nach kurzer Zeit an das neue Erscheinungsbild
      gewöhnen konnten und keine gravierenden Probleme bei der Bedienung auftraten.2 SCCnews                                                   | 11
DI E N STE UND I NN OVATION

ten daher keine Kurse übertra-
gen. Bei dem Update wurde –
bildlich gesprochen – der Antrieb
gewechselt und mit mehr
Funktionalität ausgestattet; das
damit betriebene System bleibt
jedoch in der Form erhalten, in
der es Dozierenden und Studie-
renden aus der Vergangenheit
bekannt ist.

Ablauf der Umstellung

Beim Update auf ILIAS 5 wurden
über 14.000 Kurse und ca.
65.000 Benutzerkonten transfe-
riert. Das Installationsverzeichnis
                                      Abb.  2: Ladezeit der ILIAS-Startseite im Wochenüberblick (rechts oben, Maximum: 1,21 Sekun-
                                         Abbildung 2: Ladezeit der ILIAS-Startseite im Wochenüberblick (rechts oben, Maximum: 1,21 Sekunden, Mittel: 0,47
auf dem Filesystem (ca. 1 Ter-
                                      den,  Mittel:  0,47
                                         Sekunden) bei starkSekunden)       beigleichzeitig
                                                             wechselnder Zahl    stark wechselnder
                                                                                            aktiver Nutzer Zahl gleichzeitig
                                                                                                           (Maximum:           aktiver
                                                                                                                      657 Nutzer,         Nutzer
                                                                                                                                  Mittel: 139) 4    (Maximum:
abyte) musste für das Update auf
                                      657 Nutzer, Mittel: 139)4
eine andere Versionsverwaltung           Des Weiteren eröffnen sich mit der neuen ILIAS-Version Möglichkeiten zur Anbindung aktuell
(von SVN auf Github) umgestellt          unterstützter Plugins an die ILIAS-Installation des KIT, wie z.B. LiveVoting und der bald schon zur
                                         Verfügung stehenden Anbindung an die Bibliothek des KIT.
werden. Die komplette Datenbank (mit einer Größe von über 30                      Vor der Freigabe der neuen Version für alle Nutzer wurden intern
Gigabyte) wurde umstrukturiert. Der Update-Prozess verlief zwar                   zahlreiche, im Vorfeld erstellte Testszenarien durchgespielt.
weitgehend automatisch, war aber zeitaufwändig und erforderte
                                         Fragen zum neuen ILIAS 5 beantwortet gerne der ILIAS-Support (ilias@studium.kit.edu).
an vielen Stellen manuelles Eingreifen, da sich über die lange                    Weitere Optimierungen
Laufzeit der bestehenden ILIAS-Installation  an
                                         Abstractmehreren      Stellen
Unstimmigkeiten und sogar Fehler in derILIAS
                                           Datenbank      eingeschli-
                                                 5 – Update                       In der neuen
                                                                 of KIT’s E-Learning          SystemILIAS-Version stehen verschiedene Caching-Metho-
chen hatten.                                                                      den (wie z.B. Memcached) zur Verfügung. Durch deren Einsatz,
                                         KIT’s e-learning-system ILIAS,kombiniert  which is hosted      at SCC,
                                                                                                 mit einer        was updated
                                                                                                              verbesserten          to version 5 indes ILIAS-
                                                                                                                              Programmierung
Aufgrund des großen Versionssprungs, von September
                                              ILIAS 4.32016.     ILIAS 5 not Source
                                                          auf ILIAS               only includes
                                                                                            Codes important       security
                                                                                                     (beispielsweise    bei updates,      it also offersund dank
                                                                                                                             Datenbankabfragen)
5.1, mussten während des Update-Prozessesseveral   newDatenbank-
                                                einige   features (such as der    drag-and-drop        for uploading
                                                                                       guten Aufstellung        unserer multiple     files)komplett
                                                                                                                          mittlerweile       and is virtualisier-
tabellen von Hand hinzugefügt, gelöschtcompatible       with a larger set often
                                           oder nachbearbeitet                       plugins.  The layout3,has
                                                                                       ILIAS-Installation      können nun auch plötzliche5Nutzeranstür-
                                                                                                                   also  changed     in  version      with
werden. Diese Arbeiten erforderten einen modernized      iconsmit
                                            langen Vorlauf       and design.me      Internal  processes
                                                                                       vom System            were
                                                                                                        besser     optimized,
                                                                                                                 bewältigt        including
                                                                                                                             werden              database2).
                                                                                                                                         (s. Abbildung
vielen Vorarbeiten, zahlreichen kleinerenqueries    and caching mechanisms, to speed up ILIAS.
                                           Test-Update-Sequenzen
und einem großen Test-Update an einer Spiegelung des Produk-                      Diese Verbesserung macht sich besonders zu Vorlesungsbeginn
tivsystems.                                                                       bemerkbar, da Sprünge von so gut wie keinem angemeldeten
                                                                                  Nutzer auf knapp 600 gleichzeitig aktiven Nutzern innerhalb
Die Anpassungen des Layouts für das KIT waren in der neuen                        weniger Minuten keine Seltenheit darstellen.
ILIAS-Version besonders zeitaufwändig, da sich an dieser Stelle
die zur Verfügung stehenden Konfigurations-Möglichkeiten und                      Des Weiteren eröffnen sich mit der neuen ILIAS-Version Möglich-
der gesamte Anpassungsprozess wesentlich verändert haben.                         keiten zur Anbindung aktuell unterstützter Plugins an die ILIAS-
                                         4
                                           Die Grafiken zeigen bereits auf bestimmte Zeitintervalle gemittelte Werte, sodass die genannten Maxima in
                                                                                  Installation des KIT, wie z.B. LiveVoting und der bald schon zur
                                         der Grafik nicht mehr zu erkennen sind.
                                                                                  Verfügung stehenden Anbindung an die Bibliothek des KIT.

ILIAS 5 – Update of KIT’s E-Learning System
                                                                                   Fragen zum neuen ILIAS 5 beantwortet gerne der ILIAS-Support
KIT’s e-learning-system ILIAS, which is hosted at SCC, was
                                                                                   (ilias@studium.kit.edu).
updated to version 5 in September 2016. ILIAS 5 not only
includes important security updates, it also offers several new
features (such as drag-and-drop for uploading multiple files)
and is compatible with a larger set of plugins. The layout has
also changed in version 5 with modernized icons and design.                          3
                                                                                         Vier Webserver, eine Service-Maschine sowie ein virtueller Datenbankserver
Internal processes were optimized, including database que-                               (s. auch SCC News 2015, S. 12-13).
ries and caching mechanisms, to speed up ILIAS.                                      4
                                                                                         Die Grafiken zeigen bereits auf bestimmte Zeitintervalle gemittelte Werte,
                                                                                         sodass die genannten Maxima in der Grafik nicht mehr zu erkennen sind.

12 |           SCCnews
FOR S C H U N G U N D P RO J E K T E

V-FOR-WaTer – Eine virtuelle Forschungsumgebung für die
Wasser- und terrestrische Umweltforschung
Das Management sowie die Aufbereitung von heterogenen
Datenbeständen für hydrologische Analysen und Modellie-
rungen stellt oftmals eine große Herausforderung dar. Ty-
pischerweise erfordert dies ein zeitintensives Umformatie-
ren unterschiedlichster Daten verschiedenster Quellen für
die jeweilige Fragestellung. Die virtuelle Forschungsumgebung
V-FOR-WaTer ermöglicht einen einfachen Zugriff auf die Daten im benötigten Format und bietet ebenso eine
Plattform, auf der Analysewerkzeuge gespeichert, geteilt und genutzt werden können. Um den Anforderungen
der Umweltforschung gerecht zu werden, erfolgt die Entwicklung der Forschungsumgebung in Zusammenar-
beit mit dem Institut für Wasser und Gewässerentwicklung (IWG) des KIT.                                     Dr. Marcus Strobl, Dr. Sibylle Hassler1

„Startschuss“ des zunächst für zwei Jahre                 im zielgerichteten und abgestimmten          Langfristig soll V-FOR-WaTer auch über
finanzierten Landesprojektes V-FOR-                       Ausbau bestehender Forschungsein-            Landesgrenzen hinaus als gutes Beispiel
WaTer war am 1.7.2016, wobei bereits                      zugsgebiete der Universitäten unter der      für den Umgang mit Umweltdaten gelten
im Februar Abstimmungsgespräche mit                       Integration des Umweltmessnetzes der         und erweitert werden. Dies wird durch
den Universitäten in Baden-Württemberg                    Landesanstalt für Umwelt, Messungen          eine modulare Ankopplung an andere,
und der Landesanstalt für Umwelt,                         und Naturschutz Baden-Württemberg            bereits bestehende Systeme, wie z.B. das
Messungen und Naturschutz Baden-                          (LUBW) sowie der Anbindung des               der LUBW, aber potentiell auch nationale
Württemberg (LUBW) stattfanden. Durch                     Deutschen Wetterdienstes (DWD). In           oder internationale Systeme, gewährleis-
die frühe und intensive Zusammenarbeit                    diesem Observatorium betreiben die           tet.
mit der wissenschaftlichen Gemeinschaft                   Universitäten Baden-Württembergs und
in diesem Forschungsbereich wird die                      die LUBW, wissenschaftlich koordiniert,        Weitere Informationen
bestmögliche Akzeptanz und Nutzbar-                       ihre Umweltbeobachtungsmessnetze. Die          http://www.vforwater.de
keit der Virtuellen Forschungsumgebung                    gemessenen Daten können so gemein-
(VFU) erreicht.                                           sam genutzt werden, um insbesondere
                                                          langfristige Auswirkungen des globalen
Der Schwerpunkt von V-FOR-WaTer liegt                     Wandels besser zu verstehen. Dies ist
                                                                                                          V-FOR-WaTer – a virtual research
auf der Haltung hydro-meteorologischer                    ein wichtiger Schritt hin zur Realisierung
                                                                                                          environment for water and terrestrial
Daten und dem direkten Zugriff auf                        der Vision eines „Landesobservatoriums
                                                                                                          environmental research
Analysewerkzeuge, um Forschungsdaten                      Oberrheingraben“.
                                                                                                          Management and preprocessing of hetero-
schnell prozessieren zu können und für
                                                                                                          geneous data pools for hydrological analy-
die prognostische Modellierung nutzbar                    Die Speicherung der Modellparametri-
                                                                                                          ses and models often bears a big challenge.
zu machen. Die erste Phase ist auf die In-                sierungen und Simulationsergebnisse
                                                                                                          Typically, a time-consuming transformation
tegration von Wasser- und Umweltdaten                     in V-FOR-WaTer für unterschiedliche
                                                                                                          of different data from various sources is
aus Baden-Württemberg fokussiert.                         Gebiete, und die Entwicklung geeigneter
                                                                                                          required. V-FOR-WaTer provides simple
                                                          Dokumentationsstandards, ermöglicht
                                                                                                          access to data in the required format and
Insbesondere der Oberrheingraben ist                      es die Erkenntnisse aus den Modellen
                                                                                                          provides a platform to save, share and use
durch seine lange Geschichte in der                       zu bewahren und zu teilen. Somit kann
                                                                                                          tools for data analysis. To meet the various
Umweltbeobachtung und der großen Di-                      langfristig ein vergleichendes Lernen über
                                                                                                          requirements of environmental research,
versität der Landschaftsräume und Land-                   die Vor- und Nachteile unterschiedlicher
                                                                                                          the V-FOR-WaTer virtual research environ-
nutzungen prädestiniert für den Aufbau                    Modellsysteme für die Anwendung in
                                                                                                          ment is developed in close cooperation
eines Langzeitobservatoriums mit einer                    unterschiedlichen Regionen und für un-
                                                                                                          with the Institute of Water and River Basin
gemeinsamen VFU. Die Kernidee besteht                     terschiedliche Ziele gewährleistet werden.
                                                                                                          Management at KIT.
  1
      Institut für Wasser und Gewässerentwicklung (IWG)

                                                                                                                         SCCnews        | 13
F O R SCHUNG UN D PR OJEKTE

EUDAT Operations Management
Das EUDAT Konsortium ist eine internationale Kooperation, die digitale Dateninfrastrukturen, Ressourcen und
Datendienste fördert, um Forschungs- und Wissenschafts-Communities beim Datenmanagement zu unter-
stützen. 35 europäische Organisationen nutzen Dienste und Speicherressourcen in 15 Ländern, die eine so
genannte kollaborative Dateninfrastruktur (CDI) bilden. Ziel ist es, wissenschaftliche Daten langfristig zu spei-
chern, aufzufinden und in einer vertrauenswürdigen Umgebung zu verarbeiten. Durch die Einführung eines
Operationsteams sowie geeigneter Managementprozesse wird die Kommunikation zwischen den Partnern auf
technischer Ebene wirkungsvoll gebündelt. Das Operations Management bildet eine wichtige Schnittstelle in
der CDI, die aus 13 generischen Datenzentren und einer wachsenden Anzahl von Wissenschaftsgemeinschaften
und themenspezifischen Zentren besteht. Im Rahmen des Arbeitspaketes "Operations" koordiniert das SCC die
Implementierung und den Betrieb von Diensten, sowie die Bereitstellung der Ressourcen.                                           Pavel Weber

EUDAT – Datendienste                             Inbetriebnahme der CDI                           unterstützt. Das Operationsteam soll
für die Wissenschaft                                                                              garantieren, dass die erforderlichen Res-
                                                 Innerhalb des Arbeitspakets "Operations"         sourcen rechtzeitig zur Verfügung gestellt
EUDAT2020, das dreijährige Nachfol-              werden Konzepte entwickelt, um die               werden können.
geprojekt von EUDAT, umfasst sieben              CDI technisch zu konsolidieren. Ziel ist
Kern-Communities - CLARIN, ELIXIR,               es die Integrität, die Vertraulichkeit und       Blick in die Projektstruktur
ENES, EPOS, ICOS, LTER und VPH. Diese            die sichere Aufbewahrung der von den
repräsentieren ein sehr breites Spektrum         Benutzern hinterlegten Daten zu gewähr-          Das breite Spektrum von notwendigen
aus Sozial- und Geisteswissenschaft,             leisten. Hierfür wurde eine neue, verteilte      Maßnahmen wurde in fünf Aufgabenbe-
Geographie, Energie und Umweltwissen-            IT-Infrastruktur aufgebaut. Diese besteht        reiche zusammengefasst (Abb. 1)
schaft, aber auch Biologie und Biowis-           aus 13 generischen Datenzentren und
senschaft. Für diese sehr heterogenen            einer wachsenden Anzahl an Wissen-               Data Project Consultancy & Enabling:
Wissenschafts-Communities bietet EUDAT           schafts-Communities sowie thematischen           Hierunter fällt der Aufbau von Experten-
IT-Dienste, die es ermöglichen wissen-           Zentren. Im letzten Jahr konzentrierten          wissen zur Unterstützung der Forscher
schaftliche Daten effizient zu verwalten         sich die Aktivitäten von "Operations" auf        und Anwender bei der Nutzung der CDI
sowie hochverfügbar und langfristig              die Umsetzung der Datenprojekte auf die          für deren Datenprojekte.
zu speichern. Alle EUDAT-Aktivitäten             CDI. Diese Aufgabe erfordert die Zusam-
zur Erbringung dieser IT-Dienste sind in         menarbeit aller Partner, die die Nutzer          Helpdesk & Support: Diese Task unter-
Arbeitspaketen organisiert. Hier wird das        mit Werkzeugen für den IT-Betrieb,               stützt die EUDAT CDI Benutzer durch ein
Arbeitspaket Operations näher betrachtet.        einer effektiven Kommunikation, durch            zentrales Helpdesk-System und definiert
                                                 Software-Monitoring und einen Helpdesk           die dafür notwendigen Richtlinien. Die
                                                                                                  einlaufenden Anfragen verteilt ein „Dis-
                                                                                                  patching Officer“ über das Supportsystem
                                                   CDI Data Centres                               an die Partnerorganisationen, die den
                                                                                                  2nd-Level-Support leisten.
                                     EUDAT Service
                                       EUDAT Service
                                        EUDAT Services                                            Security: Dieses Aufgabenpaket kon-
                                                                                                  zentriert sich auf die Koordinierung
                                                 API                                              der operativen Sicherheit und auf die
                      GRNET                              SCC                             MPCDF    Sicherheitsbewertung, die Vertraulichkeit,
    Service Portfolio          API   SVMON Framework           API      Data Project              Integrität und Zugänglichkeit der Daten,
 (List of all EUDAT services          (software versions              Management Tool             der Dienste und der Systeme von EUDAT.
 and service components)             monitoring framework)            (List of all projects and
                                                                           their services)
                                                                                                  Operational Tools & Services: Bereit-
Abb. 2: Schema der automatisierten Software-Versions-Überwachung innerhalb der CDI.               stellung zentraler Basisdienste wie z.B.

14 |          SCCnews
FOR S C H U N G U N D P RO J E K T E

Accounting, Überwachung, Inventarisie-            CDI, ist nur über geeignete Werkzeuge        veraltete Software zu identifizieren und
rung und Authentifizierung, die benötigt          und Workflows effizient zu verwalten.        effizienter zu aktualisieren.
werden, um die CDI zu betreiben.                  Es ist wichtig durch deren Nutzung die
                                                  Kommunikation per E-Mail oder Telefon        Ausblick
Service and Resource Provisioning &               zu reduzieren und stattdessen opera-
Coordination: Über diese Tasks soll die           tive Daten automatisch zwischen den          Experten des SCC bieten neben der
von den Datenprojekten erforderliche              unterschiedlichen Betriebsprozessen zu       Koordination bei der Bereitstellung von
Überwachung der Produktivität, der Ser-           übertragen. Des Weiteren soll die Vielfalt   IT-Diensten und Ressourcen auch techni-
vicequalität, der Sicherheit und Nachhal-         der Werkzeuge konsolidiert werden und        sche Unterstützung zur Installation und
tigkeit der CDI koordiniert werden. Eine          alle Informationen mit Hilfe von APIs in     Konfiguration von EUDAT-Diensten an.
weitere Aufgabe ist die Bereitstellung der        einem einheitlichen Datenpool zusam-         Für den EUDAT-Dienst B2SAFE wurde
IT-Ressourcen und zugehörigen Services.           menlaufen. Diesen Ansatz nutzt beispiels-    am SCC eine automatisierte Installation
                                                  weise das "Software Version Monitoring"      und Konfiguration, basierend auf dem
Clevere Betriebsprozesse                          (SVMON), das im SCC entwickelt wurde.        Systemkonfigurationswerkzeug Puppet,
                                                  Es stellt ein Framework zur Verfügung,       entwickelt. Die Pakete für die automati-
Das SCC verantwortet den Bereich Service          das regelmäßig die aktuellen Software        sche Installation weiterer Dienste wie z.
and Resource Provisioning & Coordi-               Versionen aller EUDAT-Dienste abfragt        B. B2STAGE werden derzeit geschrieben
nation. Die vom Operations Manager                und abspeichert und mit der Service          und stehen bald allen Datenzentren zur
des SCC koordinierten übergreifenden              Portfolio Datenbank vergleicht, ob           Verfügung.
Verfahren für die Planung, Steuerung und          Software-Updates notwendig sind (siehe
den Betrieb der Infrastruktur und Dienste         Abb. 2). Die Ergebnisse werden an ein
basieren auf den Service Management               weiteres EUDAT-Werkzeug, das Data Pro-
Standards FitSM (www.fitsm.eu).                   ject Management Tool, geschickt. Dieser        Weitere Informationen:
                                                  Ansatz erlaubt es den unterschiedlichen        SCC erweitert Beteiligung in EUDAT;
In Rahmen des Arbeitspakets                       Datenprojekten automatisch und schnell         SCC-News 2015, S. 28
Operations wurden aus
den 14 FitSM-Kern-
prozessen die für den
Service-Support wichtigen
Prozesse – Incident &                                          EUDAT Federated Operations
service request, Problem,
Configuration, Change
und Release & deployment           Data Project Consultancy &
                                                                                                            Helpdesk & Support
management – für EUDAT                      Enabling
angewendet, sowie dafür
                                             Enabling Team                                            1st level support: BSC (Spain)
passende Richtlinien defi-
                                             CINECA (Italy)                                           2nd level support: Site deputies,
niert. Für die erfolgreiche
Koordination des EUDAT
Betriebs ist eine tägli-
                                                                                                                   Security
che Interaktion mit den                      Network, Configuration
                                             • Compute Resources
anderen oben aufgeführ-                      • Service Hosting,
ten Aufgabenbereichen                          Service on Demand
                                                                                                     EUDAT Security Officer,Security Team
                                             • Service Deployment                                              CSC (Finland)
erforderlich. Dies wird u.a.                   Storage, Storage Services
auch durch die Einführung
cleverer und schlanker               Service and Resource                                             Operational Tools & Services
                                                                                                          (Wiki, Monitoring, Accounting,
IT-Betriebsprozesse, wie sie      Provisioning & Coordination                                              Inventory DB, Auhentication)
FitSM definiert, erreicht.
                                  Operations Team, Site Deputies
                                                                                                                MPCDF (Germany)
                                          KIT/SCC (Germany)
Werkzeuge und
Workflows im Betrieb                                                                                                                         1
                                Abb. 1: Der über das Projekt EUDAT koordinierte Betrieb verteilter europäischer Datenzentren
                                (themenspezifisch Datenzentren – rot, allgemeine Datenzentren – blau, zentrale Toolprovider –
Eine so weitverteilte           grün). Das Arbeitspaket ist in fünf Aufgabengebiete unterteilt.
Infrastruktur, wie die
                                                                                                                                           >>>

                                                                                                                    SCCnews         | 15
F O R SCHUNG UN D PR OJEKTE

>>>   EUDAT Operations Management
      The EUDAT consortium is an international collaboration, which federates the digital capabilities, resources, and data services to
      engage and support multiple research communities in efficient data management. A geographically distributed, resilient network
      of 35 European organizations shares service and storage resources across 15 countries and builds a Collaborative Data Infrastruc-
      ture (CDI) to preserve, find, access and process data in a trusted environment. The EUDAT operations team organizes the co-
      operation of the different actors within the CDI and provides the distributed operational infrastructure with 13 generic data centers
      in partnership with a growing number of collaborating research communities, thematic centers and research infrastructures. The
      contribution of SCC to the EUDAT Operations task is focused on the coordination of deployment and operation of services as well
      as resource provisioning.

      Gründung der EUDAT Collaborative Data Infrastructure
      Fünfzehn Forschungseinrichtungen haben die EUDAT Collaborative Data Infrastructure gegründet. Ziel ist der
      Aufbau einer zuverlässigen Dateninfrastruktur für das Management von Forschungsdaten in Europa.
                                                                                              Prof. Dr. Achim Streit, Daniel Mallmann1, Stefan Heinzel2

      Fünfzehn Einrichtungen, darunter das                   Die Daten-Infrastruktur umfasst neben
      Jülich Supercomputing Center (JSC), das                generischen und multi-disziplinären wis-           JSC is one of fifteen European partners that
      Steinbuch Centre for Computing (SCC)                   senschaftlichen Datenzentren, wie dem              recently founded the EUDAT Collaborati-
      und die Max Planck Computing & Data                    JSC und dem SCC, auch fachspezifische              ve Data Infrastructure (EUDAT CDI). The
      Facility (MPCDF), haben kürzlich die                   Zentren, beispielsweise das Deutsche Kli-          partners consist of European data centres
      EUDAT Collaborative Data Infrastructure                marechenzentrum. Die daten-orientierten            and operators of community repositories.
      (EUDAT CDI) gegründet. Ziel der EUDAT                  Dienste aus den Bereichen „Data Sha-               EUDAT CDI is a partnership agreement that
      CDI ist es, eine nachhaltige Perspektive               ring“, „Data Access“, „Data Storage“,              evolved from the EUDAT2020 project, fun-
      für das Management von Forschungs-                     „Data Preservation“, „Data Processing“             ded by the Horizon 2020 programme. The
      daten in Europa zu bieten und dafür                    und „Data Discovery“ werden von Wis-               goal of EUDAT CDI is to offer a long-term
      eine zuverlässige Dateninfrastruktur zu                senschaftlern unterschiedlicher Diszipli-          perspective beyond current project funding
      etablieren und langfristig zu betreiben.               nen gemeinsam mit den Betreibern dieser            for managing scientific data, thus beco-
      Die Kollaboration besteht aus europäi-                 Dienste entworfen und betreut. Auf                 ming a reliable infrastructure for scientific
      schen Datenzentren und Betreibern von                  große multi-disziplinäre Forschungsein-            communities and researchers.
      Forschungsdatenrepositorien. Grundlage                 richtungen zugeschnittene Dienste sind             EUDAT CDI was launched at the first EUDAT
      der Organisation ist eine partnerschaft-               genauso Bestandteil des Portfolios, wie            CDI Council meeting, which took place
      liche Vereinbarung, die sich aus dem in                solche, die sich an kleinere Forschungs-           on 27 September 2016 in Krakow. At this
      Horizon 2020 geförderten EUDAT2020                     gruppen und einzelne Wissenschaftlerin-            meeting, three new partner applications for
      Projekt entwickelt hat. Die EUDAT CDI                  nen und Wissenschaftler wenden. Das                joining EUDAT CDI were accepted.
      bildet somit auch einen Grundstein                     JSC betreibt derzeit u.a. die zentrale Nut-
      zur Etablierung der European Open                      zeridentifikation und allgemeine Dienste           The infrastructure comprises generic or
      Science Cloud (EOSC). Im Rahmen des                    zur Synchronisation und zum Austausch              multi-domain data centres, such as JSC,
      ersten EUDAT CDI Council Meeting, am                   von Daten, das SCC und die MPCDF                   and community-specific data centres. The
      27.09.2016 in Krakau, wurde die EUDAT                  betreiben Dienste zur Langzeitspeiche-             infrastructure services are co-designed by
      CDI offiziell ins Leben gerufen. Zeitgleich            rung und Archivierung. Alle Zentren der            community scientists and data service de-
      wurden drei neue Partner aufgenommen                   EUDAT CDI unterstützen den Aufbau                  velopers. EUDAT CDI offers tailored services
      und weitere Organisationen haben ihr                   von Forschungsrepositorien gemäß den               for large research communities and generic
      Interesse zum Beitritt erklärt.                        Grundsätzen von Open Access.                       services for small research groups and indi-
                                                                                                                vidual scientists. JSC currently operates the
                                                                                                                central user identification, a generic service
                                                                                                                for data synchronization and exchange, and
        1
            Jülich Supercomputing Centre (JSC)                 Weitere Informationen:                           community-specific services.
        2
            Max Planck Computing and Data Facility (MPCDF)     https://www.eudat.eu/eudat-cdi

      16 |             SCCnews
FOR S C H U N G U N D P RO J E K T E

bwDIM – Vereinfachter Datenfluss
im Forschungsdatenmanagement
Das baden-württembergische Landesprojekt bwDataInMotion (bwDIM) unterstützt Wissenschaftlerinnen und
Wissenschaftler der Universitäten in Baden-Württemberg beim Forschungsdatenmanagement. Es hat zum Ziel,
den Datenfluss zwischen den unterschiedlichen Systemen zu vereinfachen.                                                    Felix Bach

Verfügbarkeit und Nutzbarkeit wissenschaftlicher Daten sind
Schlüsselfaktoren für die weitere Entwicklung der empirischen
Wissenschaften. Das Management, der langfristige Erhalt und
die Zugänglichmachung dieser Daten ist jedoch eine große
Herausforderung für Hochschulen und außeruniversitäre For-
schungseinrichtungen.

Das baden-württembergische Landesprojekt bwDIM (bwDataIn-
Motion) ist eine Kooperation des Steinbuch Centre for Compu-
ting mit dem Leibniz-Institut für Informationsinfrastruktur (FIZ
Karlsruhe) und der KIT-Bibliothek und zielt auf den vereinfach-
ten Datenfluss zwischen den unterschiedlichen Systemen zum
Forschungsdatenmanagement. Es soll damit den Arbeitsalltag für
die Forschenden erleichtern, indem technische und organisatori-
sche Hürden bei der Archivierung, Publikation und Nachnutzung
von Forschungsdaten überwunden werden (s. Abb. 1).

Dabei wird auf bestehenden Bausteinen und Vorarbeiten aus
anderen Projekten (u.a. bwDataArchiv, RADAR, bwDataDiss)
aufgebaut. Diese werden zu einem größeren Ganzen verknüpft.
Hierzu untersucht das Projekt die zentralen Arbeitsprozesse der
Forscherinnen und Forscher und identifiziert bestehende Defizite
auf Prozessebene und bei den technischen Basisdiensten. Darauf
aufbauend werden Lösungsansätze zur Prozessoptimierung so-
wie zur Optimierung und Integration der Basisdienste erarbeitet,
umgesetzt und anhand bestehender Systeme und Nutzergrup-
pen validiert.
                                                                   Abb. 1: Schematische Darstellung der Datenflüsse beim
                                                                   Forschungsdatenmanagement
Konkret beinhaltet dies die Vereinheitlichung von Archiv-
schnittstellen, Standardisierung administrativer und technischer
Metadaten, föderationsübergreifende Authentifizierung und
Autorisierung, Unterstützung multipler Datenübertragungs- und         bwDIM – simplifying data flows in research
asynchroner Datenbereitstellungsverfahren sowie die Anbindung         data management
der technischen Infrastruktur der Verlags- und Repositoriensys-       The project bwDataInMotion (bwDIM) supports scientists of uni-
teme.                                                                 versities in Baden-Württemberg in managing their research data.
                                                                      The goal of the project is to simplify the flow of data between
                                                                      the diverse storage- and repository systems. This includes the
                                                                      unification of archive interfaces, standardisation of admin-istra-
                                                                      tive and technical metadata, authentification and authorization
                                                                      across federation borders, asynchronous data transfer methods,
                                                                      as well as integrating the technical infrastructure with reposito-
                                                                      ries and the publication systems.

                                                                                                             SCCnews       | 17
Sie können auch lesen