News - Steinbuch Centre for Computing (SCC)
←
→
Transkription von Seiteninhalten
Wenn Ihr Browser die Seite nicht korrekt rendert, bitte, lesen Sie den Inhalt der Seite unten
news Steinbuch Centre for Computing Ausgabe 2 | 2016 Ein offener Hafen für Forschungsdaten An Open Haven for Research Data Landesdienst bwDataArchiv geht in Betrieb State-wide Service bwDataArchiv goes into Operation Smart Data Innovation Conference 2016 am SCC Smart Data Innovation Conference 2016 at SCC KIT – Die Forschungsuniversität in der Helmholtz-Gemeinschaft | 01 SCCnews www.kit.edu
Editorial Liebe Leserinnen und Leser, im Sommer dieses Jahres hat der von Bund und Ländern berufene Rat für Informationsinfrastrukturen (RfII) Empfehlungen zum Forschungsdatenmanagement in Deutschland veröffentlicht. Darin macht der Rat den Vorschlag eine „Nationale Forschungsdateninfrastruktur“ als Netzwerk mit übergreifenden Zent- ren zu errichten. Durch deren ausgeprägte Expertise in der Beschreibung, der Verarbeitung, und Speiche- rung bis hin zur Langzeitarchivierung von Forschungsdaten, sollen tragfähige und nachhaltige Strukturen im Forschungsdatenmanagement geschaffen werden. Nur etwa drei Monate später gab die Helmholtz-Gemeinschaft bekannt, mit Beginn 2017 ein solches Netzwerk aus multi-thematischen Datenzentren – die Helmholtz Data Federation (HDF) aufzubauen. Die Helmholtz-Zentren betonen dabei ihre Bereitschaft, die notwendigen Dateninfrastrukturen zu schaffen, dort Forschungsdaten langfristig zu bewahren und sie anderen zur Nachnutzung so offen wie möglich zugänglich zu machen (S. 18). Das SCC am KIT koordiniert die HDF-Aktivitäten und bringt hier eine über Jahre erlangte Erfahrung in der Handhabung von großen Mengen wissenschaftlicher Daten ein. Ein wichtiger Baustein in diesem System ist der gerade in Betrieb gegangene Service bwDataArchiv, der von Wissenschaftseinrichtungen des Lan- des zur nachhaltigen Speicherung und Archivierung von Forschungsdaten genutzt werden kann (S. 6). Neben den großen Datenmengen aus der Wissenschaft, die am SCC gespeichert und archiviert werden, bietet das SCC auch Dienste für die Smart Data-Forschung an. Das am SCC ansässige Smart Data Innovation Lab hat nun ein Projekt- jahr erfolgreich in Kooperation mit Wirtschaftsunternehmen gemeistert. Die Ergebnisse der Projekte wurden auf der ersten Smart Data Innovation Conference am KIT vorgestellt und diskutiert (S. 4). Noch etwas in eigener Sache: Unser Kollege Hannes Hartenstein lässt sein Amt im Direktorium des SCC seit Oktober diesen Jahres ruhen, um sich verstärkt der Fortentwicklung der Governance der Informationsverarbeitung und -versorgung am KIT zuwenden zu können. Wir wünschen ihm viel Erfolg und freuen uns auf die weitere gute Zusammenarbeit. Viel Freude beim Lesen. Bernhard Neumair, Achim Streit Dear reader, In the summer of this year, the Council for Information Infrastructures (RfII) published recommendations on research data manage- ment in Germany. In the recommendations, the Council proposes a National Research Data Infrastructure conceived as a network with overarching centers. Their extensive expertise in the description, processing, storage and long-term archiving of research data enables establishment of a sustainable research data management structures. Only about three months later, the Helmholtz Association announced the development of such a network of multi-thematic data centers - the Helmholtz Data Federation (HDF). With the HDF, the Helmholtz Centers emphasize their readiness to create the necessary data infrastructure, to maintain research data in the long term for future use and to make the results as open as possible (page 18). The SCC of KIT coordinates the activities of the HDF and provides its experience gained over many years in the handling of large quantities of scientific data. An important building block in this system is the bwDataArchiv service that has just been put into operati- on. The service can be used by scientific institutions of the state of Baden-Wuerttemberg and offers sustainable long term storage and archiving of research data (page 6). In addition to the large amounts of data collected and archived, the SCC also delivers services for smart data research. The Smart Data Innovation Lab conducted a successful project year with increased cooperation with business enterprises. The results were presented and discussed among participants at the first Smart Data Innovation Conference at KIT (page 4). On a final note: Our colleague Hannes Hartenstein temporary left the Board of Directors of the SCC since October in order to dedicate more time to the further development of the governance of information, communication and information technologies at KIT. We wish him lots of success and look forward to further cooperation. Enjoy reading Bernhard Neumair, Achim Streit 02 | SCCnews
Inhaltsverzeichnis DIENSTE UND INNOVATION 04 Smart Data Innovation Conference 2016 am SCC 06 Landesdienst bwDataArchiv geht in Betrieb 08 Virtuelle Graphikworkstations im Betrieb – ein Projektfazit 11 ILIAS 5 – Update des E-Learning-Systems des KIT FORSCHUNG UND PROJEKTE 13 V-FOR-WaTer – Eine virtuelle Forschungsumgebung für die Wasser- und terrestrische Umweltforschung 14 EUDAT Operations Management 16 Gründung der EUDAT Collaborative Data Infrastructure 17 bwDIM – Vereinfachter Datenfluss im Forschungsdatenmanagement 18 Ein offener Hafen für Forschungsdaten 18 Abgeschlossene Promotionsarbeit 19 Laborbuch 2.0 – digital und dezentral verfügbar 20 Sternenstaub, Wasserflöhe und Hochleistungsrechner: 3. bwHPC-Symposium am Universitätsrechenzentrum Heidelberg STUDIUM UND WISSENSVERMITTLUNG 22 „Erste Hilfe“ für Erstsemester 23 Internationale GridKa Schule – Data Science on Modern Architectures 24 Oktober 2016 – der Cyber Security Month VERSCHIEDENES 25 Schülerkolloquium Simulierte Welten am SCC 26 31. International Supercomputing Conference 27 Forschungsdaten managen – E-Science-Tage 2017 27 Inside SCC – hohes Medien- und Besucherinteresse in 2016 27 Impressum & Kontakte SCCnews | 03
DI E N STE UND I NN OVATION Smart Data Innovation Conference 2016 am SCC Das SCC hat im Oktober 2016 die erste Smart Data Innovation Conference organisiert. Im Rahmen dieser Kon- ferenz wurden die Ergebnisse aus dem ersten Projektjahr des Smart Data Innovation Labs öffentlich vorgestellt und mit dem angereisten Fachpublikum diskutiert. Nico Schlitter Das Smart Data Innovation Lab (SDIL) ist um realitätsnahe Forschung in diesen (siehe auch SCC-News 2015, S . 4 und ein seit 2014 bestehendes bundesweites strategisch wichtigen Feldern zu fördern. looKIT Ausgabe 3/2016, S. 30). Labor für Smart Data-Forschung auf Basis von In-Memory Big Data-Technologien. Die Hauptkomponenten der SDIL-Platt- Die Projektmitarbeiter am Karlsruher SDIL ist als Austausch- und Betriebsplatt- form umfassen die In-Memory Datenban- Institut für Technologie (KIT), am Deut- form konzipiert, um die Kooperation ken HANA von SAP und Terracotta der schen Forschungszentrum für Künstliche zwischen Wirtschaft, und Forschung im Software AG, sowie die Big Data-Lösun- Intelligenz (DFKI) und am Fraunhofer- Bereich Big Data- und Smart Data-Tech- gen der IBM Watson Foundation, inkl. Institut für Intelligente Analyse- und nologien zu beschleunigen. Unternehmen SPSS Modeler und BigInsights. Die not- Informationssysteme (IAIS) untersuchen und Forschungseinrichtungen haben sich wendigen Hardwareressourcen wurden wissenschaftliche Fragestellungen aus dazu als Partner in den vier SDIL-Commu- von den Projektpartnern als Leihstellung den Bereichen Dateninfrastruktur, nities Industrie 4.0, Energie, Smart Cities ins Smart Data Innovation Lab einge- -analyse, -integration, -kuratierung und und personalisierte Medizin organisiert, bracht und werden vom SCC betrieben -anonymisierung. Abb. 1: Schematische Darstellung der SDIL-Plattform 04 | SCCnews
D IE N S T E U N D IN N OVAT I O N Die Ergebnisse aus dem ersten Projektjahr des Smart Data Innovation Labs wurden am 12. und 13. Oktober 2016 im Rah- men der Smart Data Innovation Confe- rence (SDIC) öffentlich vorgestellt und mit dem angereisten Fachpublikum diskutiert. Der erste Konferenztag war durch an- geregte Diskussionen in den Innovation Communities geprägt, welche das Ziel hatten neue Projektideen zu entwickeln und entsprechende Forschungskooperati- onen zu initiieren. Am Folgetag wurden, im Rahmen von wissenschaftlichen Vorträgen, die Projektergebnisse der Pro- jektpartner präsentiert. Eine Postersession rundete das wissenschaftliche Programm des Vormittags ab. Der Nachmittag war der praktischen Abb. 2: Wissenschaftlicher Fachvortrag auf der SDIC über Big Data Analysen Einführung in die vielfältigen Möglichkei- ten der SDIL-Plattform gewidmet. In drei parallel stattfindenden Tutorials konnten Morris Riedel, vom Forschungszentrum die Teilnehmer, unter Anleitung des SDIL Jülich, gab eine praktische Einführung in Support Teams, die Plattform hautnah die Datenanalyse und demonstrierte wie kennenlernen und testen: typische Klassifikationsprobleme mit Hilfe von parallelisierten Support-Vektor-Ma- schinen auf dem mit htCondor und MP betriebenen SDIL-Cluster gelöst werden können. Michael Vössing, vom Karlsruhe Service Research Center (KSRI) am KIT, konnte den Teilnehmern näher bringen, wie die umfangreichen, im IBM SPSS Modeler enthaltenen Analyseverfahren durch Smart Data Innovation Conference die Nutzung des IBM Watson Clusters 2016 at SCC beschleunigt werden können. The Smart Data Innovation Lab (SDIL) offers big data researchers access to a Die Nutzung der SAP HANA Datenbank large variety of big data and in-memo- wurde von Markus Fath (SAP Deutsch- ry technologies. Industry and science land) demonstriert. Besonderen Eindruck collaborate closely to find hidden hinterließen dabei die Funktionalitäten, value in big data and generate smart die über die typischen Funktionen eines data. In October 2016, SCC hosted klassischen relationalen Datenbanksys- the Smart Data Innovation Confe- tems hinausgehen. rence (SDIC2016) and presented first results of the SDIL research project to Aufgrund des durchweg positiven Feed- the public. In addition, the SDIC2016 backs der Konferenzteilnehmer haben wir participants had the opportunity to beschlossen, die Smart Data Innovation participate in tutorials and hands-on Abb. 3: Projektleiter Nico Schlitter erläu- Conference auch im nächsten Jahr am trainings and get familiar with the tert die Komponenten des Smart Data Steinbuch Centre for Computing durch- unique potential of the SDIL platform. Innovation Labs. zuführen. SCCnews | 05
DI E N STE UND I NN OVATION Landesdienst bwDataArchiv geht in Betrieb bwDataArchiv, der neue Landesdienst für die Langzeitspeicherung und Archivierung von Forschungsdaten, geht in Betrieb. Mit dem neuen Dienst lassen sich große wissenschaftliche Datensätze über 10 Jahre und mehr zu- verlässig speichern. Bettina Bauer, Jos van Wezel Das Landesprojekt bwDataArchiv schließt Zeitgleich mit dem Projekt bwDataArchiv rechenzentrum (DKRZ) und verschiedenen zum Jahresende seine dreijährige Pro- und ebenso mit Beteiligung des SCC, führenden amerikanischen Rechenzentren jekttätigkeit ab und startet nun mit dem wurden weitere Langzeitspeicherdienste zum Einsatz, welche auch die Weiterent- gleichnamigen Dienst. bwDataArchiv für Forschungsdaten aufgebaut, die die wicklung des Systems verantworten. Die ermöglicht es, Wissenschaftlerinnen und Speicherinfrastruktur von bwDataAr- Infrastruktur ist hierarchisch aufgebaut Wissenschaftlern in Baden-Württemberg, chiv nutzen, jedoch über einen eigenen und bietet, neben einem schnell zugreif- Forschungsdaten zu archivieren. Erste Nutzerkreis für Spezialanwendungen baren Plattenspeicher, in einer tieferen Pilotnutzer speichern Daten, z. T. große bedienen und dafür eine eigene Nut- Speicherschicht Magnetbandspeicher, der Mengen, schon seit Mitte 2015 erfolg- zerverwaltung betreiben. bwDataArchiv am KIT über mehrere Bandbibliotheken reich mit dieser Technologie. Dabei han- arbeitet mit den Diensten RADAR2 und an zwei Standorten mit Bandlaufwerken delt es sich vor allem, aber nicht nur, um bwDataDiss3 zusammen. Eine internatio- von unterschiedlichen Herstellern verteilt Nutzer des Projektpartners HLRS1. nale Ausrichtung der Aktivitäten erfolgt ist. Die HPSS-Architektur gewährleistet durch die Einbindung eine beliebige Skalierung und einen brei- des EU-Projekts EUDAT, ten Einsatzbereich, sowohl als Speicher das ihren Nutzern mit hohem Durchsatz, als auch beim den Dienst B2SAFE Dienst bwDataArchiv, als eine verlässliche zur Verfügung stellt. und wirtschaftliche Datenablage. Zusammen mit dem Dienst B2FIND entsteht bwDataArchiv kann als Speicherkompo- so ein Archivspeicher- nente für ausgefeilte Langzeitarchivie- angebot für interna- rungslösungen begriffen werden. Der tionale Communities. Dienst bietet den Forschenden aber auch EUDAT beteiligt sich die Möglichkeit initiativ und eigenverant- auch konzeptionell am wortlich Daten auf lange Sicht zugreifbar Abb. 1: Gespeicherte Datenmengen und Anzahl an Dateien Dienst bwDataArchiv. zu machen. Gewährleistet wird dies durch seit Inbetriebnahme des HPSS-Speichersystems Es entwickelt eine Lö- ein sicheres Speicherverfahren, Bitstream sung zur Gewährleis- Preservation genannt, das neben der tung und effizienten Kontrolle der Daten durch Checksum- Preservation projects Generic archive for users of kontinuierlichen Über- men, eine sichere Übertragung und eine Universities, Libraries redundante Ablage auf Magnetbändern prüfung der Dateninte- Cultural and Scientific Institutes grität des Archivs. vorsieht. Im Vordergrund steht die trans- parente Einbindung der Archivierungs- Als Speicherinfrastruk- komponente in den Speicherungs- und tur nutzt bwDataArchiv Datensicherungsworkflow des Nutzers. ein HPSS-System (High Für bwDataArchiv kommen das universel- Performance Storage le Übertragungsprotokoll sftp4 und die im Secure Access Management) mit Grid-Umfeld verwendete Variante GridFTP Policies Bit‐Preservation theoretisch unbegrenz- zur Anwendung. Für die Übertragung mit Disk HSM tem Speicherplatz. Das GridFTP bietet bwDataArchiv mit der Ei- Tape Tape Metadata Copy 1 Copy 2 Datenmanagementsys- genentwicklung bwDAHub eine vorkonfi- Archive System / HPSS tem HPSS kommt unter gurierte Lösung auf Basis von uberftp und anderem bei der Max globus-url-copy. Die grobe Architektur der Abb. 2: bwDataArchiv bietet Wissenschaftlern von Einrich- Planck Computing and bwDataArchiv-Infrastruktur zeigt Abb. 3. tungen in Baden-Württemberg sowie unterschiedlichen Data Facility (MPCDF), Forschungsprojekten mit hohem Datenaufkommen einen dem Deutschen Klima- verlässlichen Langzeitspeicher. 06 | SCCnews
D IE N S T E U N D IN N OVAT I O N HPSS data base servers front‐end nodes (sftp, gridftp) Data Network standby production HPSS data mover nodes SAN Tape Library – IBM Tape Library – Oracle TS1140 drives 2 x 200 TB disk cache 10kD drives Abb. 3: Schematische Darstellung der bwDataArchiv-Infrastruktur Eine geplante Weiterentwicklung von Ministeriums für Wissenschaft und Kunst Dienstes haben mitgewirkt: Thomas Bö- bwDataArchiv sieht eine einfache Pub- (MWK) in das Langzeitspeicherprojekt mit nisch, Frank Scheiner und Björn Schem- likationskomponente für automatisch ein. Der Zugang zum Dienst bwDataAr- bera (HLRS). Felix Bach, Bettina Bauer, erzeugte Daten aus Messinstrumenten chiv erfolgt über das föderierte Identi- Ahmad Hammad, Dorin-Daniel Lobontu und die Funktionalität des begrenzten tätsmanagementsystem bwIDM. Nutzer und Jos van Wezel (SCC). Austauschs von Forschungsdaten in außerhalb der Föderation erhalten den Arbeitsgruppen vor. Die Anforderungen Zugang z.B. über eine, von einem KIT-Mit- für die Entwicklung dieser Komponenten arbeiter initiierte, persönliche Einladung State-wide Service bwDataArchiv basieren auf Nutzerwünschen, die unter via System-Mail. goes into Operation anderem über das Landesprojekt bwFDM- With the bwDataArchive service Communites erhoben wurden. Das Lan- Als Landesdienst wird bwDataArchiv research data can be securely stored desprojekt bwDIM (bwDataInMotion) bei ab 1.1.2017 Nutzern aus baden-würt- for many years. Scientists are offered dem das SCC, die KIT-Bibliothek und das tembergischen Hochschulen und deren an easy to use platform that integrates Leibniz Institut für Informationsinfrastruk- Projektpartnern zur Verfügung stehen. with daily scientific workflows and tur (FIZ) zusammenarbeiten, gewährleistet offers a solution to their data manage- eine Weiterentwicklung des Dienstes Weitere Informationen findet man unter ment requirements. The service that und bindet die E-Science-Initiativen des www.rda.kit.edu. Beim Aufbau des builds on the HPSS storage system, is available for members of institutes in the state of Baden-Wuerttemberg and 1 Höchstleistungsrechenzentrum Stuttgart will be used as reliable bit storage by 2 Research Data Repository (s. SCC-News 2015, S. 25) several projects and high level archival 3 Archivierung von Dissertationen (s. SCC-News 2/2014, S. 37) applications. 4 secure file transfer protocol SCCnews | 07
DI E N STE UND I NN OVATION Virtuelle Graphikworkstations im Betrieb – ein Projektfazit. Moderne Röntgentomographie, wie sie mit der ANKA-Synchrotronstrahlungsquelle durchgeführt wird, liefert enorme Datenmengen. Die zeitliche und räumliche Auflösung der Bilder erfordert leistungsfähige Analyseum- gebungen, die nicht nur in der Lage sind, hohe Datenraten zu verarbeiten, sondern diese auch graphikbeschleu- nigt in 2D/3D zu analysieren. Im Rahmen des Projekts ASTOR wurde eine innovative Hard- und Softwareumge- bung geschaffen, die Wissenschaftlern virtualisierte Graphikworkstations mit OpenGL-fähigem Remotezugang ad hoc zur Verfügung stellt. Diese einmalige Umgebung ist seit Anfang 2015 in Betrieb und wird sogar von Gastwissenschaftlern der Pennsylvania State University genutzt. Dr. Matthias Bonn, Dr. Wolfgang Mexner1 Virtuelle Graphikworkstations den üblichen virtuellen Infrastrukturen und ein Portal [1] entwickelt, das die nicht vorhanden ist, und Spezialsoftware, notwendige Orchestrierung des Clusters Das Ziel des (inzwischen abgeschlos- die in typischen virtuellen Serverinstanzen anstößt und alle Konfigurations- und senen) ASTOR-Projektes liegt darin, nicht läuft und auch nicht mit Webtech- Migrationsvorgänge der sehr komplexen wissenschaftliche Analysesoftware in niken verfügbar gemacht werden kann.2 VMware-API vor dem Nutzer versteckt.4 virtualisierten Arbeitsplätzen, ähnlich VM-Ware-Spezialisten des SCC haben Aus Nutzersicht ist lediglich eine von einer echten Workstation, schnell und un- deswegen zusammen mit Wissenschaft- verschiedenen Vorlagen für virtuelle kompliziert zur Verfügung zu stellen. Die lern der KIT-Institute IBPT und IPS einen Computer zu selektieren (VM-Templates), Darstellung von 2D/3D-Daten, wie sie die VMware vSphere-Cluster aufgebaut, der mit der gewünschten CPU-, RAM- und Röntgentomographie erzeugt, erfordert hardwareseitig mit den notwendigen Plattenkapazität zu konfigurieren und leistungsfähige Graphikhardware, die in Graphikbeschleunigern ausgestattet ist3 dann zu starten (Abb. 1). Neben speziel- len ASTOR-Templates werden allgemein gehaltene Templates, auch ohne Graphikbe- schleunigung, in ver- schiedenen Linux- und Windowsvarianten angeboten, so dass auch weniger spezielle VM-Wünsche abge- deckt werden können. Hierbei können verschiedene, auch geographisch verteilte, vSphere-Installationen integriert werden, so dass Nutzergruppen voneinander sepa- rierte Umgebungen nutzen können. Der Instanziierungsprozess einer neuen VM im ASTOR-Cluster dauert, abhängig vom Templa- te und der gewählten Festplattengröße, Abb. 1: Virtuelle Maschinen im ASTOR-Portal 5-15 Minuten. Danach 08 | SCCnews
D IE N S T E U N D IN N OVAT I O N ist der Login mit einem speziellen Client (VMware Horizon), der den graphik- beschleunigten Windows- Desktop per OpenGL oder DirectX remote zugänglich macht, möglich, und die vorinstallierte Analysesoft- ware kann genutzt werden. Der Systemzugang zu den Standard VMs ohne GPU geschieht mit den üblichen Bordmitteln Secure Shell (SSH) bzw. Remote Desktop Protocol (RDP). Die für den Nutzer gene- rierten Rohbilddaten der Röntgentomographieex- perimente werden der VM automatisch über ein nutzerspezifisches Netz- laufwerk mit einer 10 GBit/s-Netzwerkanbindung Abb. 2: Remotezugriff auf eine VM mit der Analysesoftware VGStudio MAX eingeblendet. Entspre- chende Mountpunkte und deren Einbindung sind in den Templates Konten im VMware-Orchestrierungsdienst wissenschaftler der Pennsylvania State voreingestellt. So steht innerhalb weniger für den ASTOR-Cluster freigeschaltet. University beteiligt, wobei zeitweise bis Minuten eine Arbeitsumgebung (wie in Die Authentifizierung der Nutzer an den zu 25 ASTOR-VMs existierten. Da jedoch Abb. 2) zur Verfügung, für deren Nut- Webportalen geschieht über Shibboleth nur maximal acht davon gleichzeitig zung lediglich ein Standard-Notebook, Web-SSO. Die Authentifizierung an den mit Graphikprozessor (GPU) betrieben eine gewöhnliche 16 MBit DSL-Anbin- OpenGL-Gastsystemen wird mit dem werden können, wurde ein Mechanismus dung ans Internet zur Remote-Bildüber- LDAP-Fassadenkonto durchgeführt, bei eingerichtet, der dafür sorgt, dass nicht tragung und ein KIT-Benutzerkonto den generischen Gastsystemen mit loka- benötigte VMs heruntergefahren werden, notwendig sind. Der Registrierungspro- len root/Administratorrechten. so dass die genutzten Ressourcen frei- zess läuft dabei zweistufig ab: Zunächst gegeben und von anderen VMs genutzt melden sich die Nutzer am Portal für Nutzungserfahrungen werden können.6 Dieses Verfahren ist ein Föderierte Dienste am KIT (bwidm.scc. Accounting und Billing mit sogenannten kit.edu) für den ANKA-Dienst an, so dass Seit Anfang 2015 wurden die virtuellen virtuellen Euros. Hierzu wird die Fähigkeit die Bilddatenspeicher für den Nutzer Graphikworkstations von ca. 15 Nutzern des VM-Orchestrierungsdienstes genutzt, ansprechbar werden. In einem zwei- – überwiegend Biologen – in Anspruch im einstelligen Minutentakt bis zu ca. 25 ten Schritt werden die entsprechenden genommen. Unter anderem waren Gast- Ressourcenverbrauchsmetriken pro VM zu 1 Institut für Beschleunigerphysik und Technologie (IBPT) am KIT 2 Wie z. B. die im Projektkontext eingesetzten Amira oder VG Studio MAX auf Basis von Windows Server. 3 Die Projektumgebung besteht aus zwei ESXi Hosts, die zusammen 16 3 GHZ Xeon Kerne, 700 GB RAM und 8 NVIDIA GRID K2 GPU Kerne anbieten. Für die VM-Images stehen 21 TB NFS-Speicher zur Verfügung. 4 Technisch kommt PCIPassthrough zum Einsatz, das ein physisches PCI-Device direkt in eine VM einblendet, weswegen verschiedene VMware-Automatismen wie DRS und vMotion für die betreffenden VMs nicht nutzbar sind und die Zuordnung von VM zu Host und PCI-Device selbst durchgeführt werden muss. 5 Das Mapping erfolgt hier über den Shibboleth-internen Identifier ePPN (eduPersonPrincipalName) 6 Die bei VMware normalerweise problemlose Überprovisionierung von Laufzeitressourcen, wie RAM, steht bei laufenden VMs mit PCI-Passthrough-Hardware nicht zur Verfügung. Eine gestartete VM erhält ihre Ressourcen immer exklusiv reserviert. Stehen die Ressourcen nicht zur Verfügung, kann die VM nicht gestartet werden. SCCnews | 09
DI E N STE UND I NN OVATION erfassen und über längere Zeiträume, werden vollautomatisch durchgeführt, Workstations, signifikante Verbesserun- u. a. in Stunden- und Tagesaggregati- eine einmalige oder dauerhafte Erhöhung gen. Wissenschaftler können somit ein onen, zu archivieren. Darauf aufbauend des monatlichen Budgets ist jedoch zu- flexibles System von überall aus nutzen, ist ein Kostenmodell7 erstellt worden, das sätzlich möglich. Dieser Mechanismus er- das zudem wesentlich leichter auf einem den Ressourcenverbrauch auf Stunden- höhte die Disziplin der Nutzer. Durch das aktuellen technischen Stand (Hard- und basis in virtuelle Euros umrechnet und veränderte Verhalten und den Zeitzonen- Software, inklusive Lizensierung) gehalten bei Überschreiten eines monatlichen versatz der amerikanischen Anwender, werden kann. Dies gilt nicht nur für die Grundbudgets zunächst den betreffenden konnten deutlich mehr Forscher bedient spezialisierte ASTOR-Umgebung, sondern Nutzer informiert und später dann die werden, als es mit den verfügbaren auch für damit bereitgestellte VMs, die VMs des Nutzers mit steigender Frequenz Ressourcen oder gar physischen Worksta- dem generellen Einsatz in Forschung und abschaltet. Das definierte Kostenmodell tions machbar gewesen wäre. Lehre dienen. Darüber hinaus könnten erlaubt es, eine typische GPU-VM zehn die VMs feingranular monetär abgerech- Stunden pro Tag zu nutzen, dabei bleibt Fazit net werden. es dem Nutzer überlassen, wie er das jeweilige Kontingent einsetzt. Ein Kosten- Die Implementierung der ASTOR-System- simulator erlaubt es vorab, die entstehen- umgebung stellt einzigartige Funktionen den „virtuellen Kosten“ abzuschätzen. zur Verfügung und bietet, im Vergleich zu Weitere Informationen Die Billing- und ggf. Shutdown-Prozesse traditionellen IT-Umgebungen mit lokalen [1] https://astor.kit.edu 7 Beispiel für die flexible virtuelle Abrechnung: 0.007 € pro GB RAM + 0.05 € pro CPU Core + 0.5 € pro nVidia GPU Core, stündlich und nur bei laufender VM. VM-Imagespeicher und die genutzte CPU-Takte werden erfasst, aber nicht eingerechnet. Working with Virtual Graphics Workstations – Results of the ASTOR-Project Modern X-ray tomography, as provided by the ANKA synchrotron light facility, results in immense data amounts, the temporal and spatial resolution of the resulting 3D images demands for powerful environments. These hard- and software must be able to process the high data rates and needs the capability to analyze the image data with help of accelerated graphics processing in 2D/3D. Within the ASTOR project, the SCC has implemented together with scientists of IBPT and IPS a system providing scientists virtualized workstations with an OpenGL accelerated graphics subsystem, remotely usable from everywhere in the Internet. The environment is in use since 2015, is usable cloud-like as-a-service, and it is currently also evaluated by guest scientists from Pennsylvania State University. 10 | SCCnews
D IE N S T E U N D IN N OVAT I O N ILIAS 5 – Update des E-Learning-Systems des KIT DieILIAS 5 – Update neue Version desbetriebenen 5 des am SCC E-Learning-Systems E-Learning Systemsdes ILIASKIT wurde im September 2016 eingespielt. MitDie neue ILIAS Version 5 wurden 5 des nicht nur am SCC betriebenen notwendige E-Learningdurchgeführt, Sicherheits-Updates Systems ILIASeswurde stehen im nunSeptember auch neue 2016 Funkti- eingespielt. onen Mit ILIAS 5 wurden nicht nur notwendige Sicherheits-Updates zur Verfügung. durchgeführt, Franziska esAlvar Wandelmaier, stehen Wenzel nun auch neue Funktionen zur Verfügung. Neuerungen Es ist geplant über weitere Highlights Franziska der neuen Wandelmaier, ILIAS-Version Alvar Wenzel auf der ILIAS-Startseite als „Tipp des Tages“ zu informieren. Im ILIAS 5 verfügt über eine erweiterte Funktionalität1, die z.T. auch Zuge der Weiterentwicklung von ILIAS wurde mit der Version 5 Neuerungen speziell von den ILIAS-Nutzerinnen und Nutzern am KIT ge- auch das äußere Erscheinungsbild moderner gestaltet, beispiels- 1 ILIAS 5 verfügt wünscht wurde, z.B. über eine erweiterte Funktionalität , die z.T. weise auch durch neuespeziell Icons (s. von Abb. den ILIAS-Nutzerinnen 1). Außerdem wurde das Layout und NutzernNachrücken Automatisches am KIT gewünscht wurde, z.B. von Wartelisten für mobile Anzeigegeräte weiter optimiert. Laden auch mehrerer Dateien gleichzeitig in Kursräume per Drag & rücken Drop Mitglieder auf der Warteliste eines Kurses Was bedeutet die Umstellung mit maximaler für die ILIAS-Nutzerinnen Teilnehmeranzahl schnelles Aufräumen des „Persönlichen Schreibtischs“ und Nutzer? automatisch nach, wenn sich ein Kursmitglied vom Kurs abmeldet oder abgemeldet wird; durch gleichzeitiges Löschen mehrerer Objekte Sortiermöglichkeiten, erweiterte können mehrere etwa Dateien gleichzeitig innerhalb von Gruppen per Drag & Drop inändert Grundsätzlich die Kursräume geladen werden; sich für die Nutzerinnen und Nutzer von ILIAS durch die Umstellung kann der „Persönliche Schreibtisch“ schneller aufgeräumt werden, da in ILIAS 5 an dieser und Kategorien wenig. Es hat sich gezeigt, dass die PDF-Export von Wikis (für bestimmte Seiten oder insgesamt) meisten Nutzer sich nach kurzer Zeit an das neue Erscheinungs- Stelle nun die Löschung mehrerer ausgewählter erweiterte Link-Möglichkeiten in Wikis Objekte gleichzeitig möglich ist. bild gewöhnen konnten (Vergleich s. Abb. 1) und keine gravie- Zuordnung beliebig vieler Kursbetreuer mit Kontakt- renden Probleme bei der Bedienung auftraten.2 Im Zuge der Möglichkeit überWeiterentwicklung die Info-Seite des Kursesvon ILIAS wurde mit der Version 5 auch das äußere Erscheinungsbild moderner gezielter gestaltet, Versand beispielsweise von E-Mails aus Kursen, etwadurch nur an neue Icons Fehler! (s.bereits Alle Verweisquelle in ILIAS 4.3 vorhandenen konnte nicht automatisch Kurse wurden Administratoren oder gefunden werden.). nur an Tutoren in die neue Version 5.1 überführt. Die Dozierenden selbst muss- ILIAS 5 ILIAS 4.3 Abb. 1: Neue Funktionen im veränderten Layout von ILIAS 5 (rechts); daneben zum Vergleich die Ansicht in ILIAS 4.3 Abbildung 1: Neue Icons in ILIAS 5 (rechts); daneben zum Vergleich die Icons von ILIAS 4.3 1 Zu den Neuerungen siehe auch das Feature Wiki von ILIAS: http://www.ilias.de/docu/goto.php?target=wiki_1357_Overview&lang=de 2 Was bedeutet die Umstellung für die ILIAS-Nutzerinnen und Nutzer? Um den ILIAS-Nutzerinnen und Nutzern den Umstieg zu erleichtern, bietet das Zentrum für Mediales Lernen (ZML) Schulungen, Webinare und Grundsätzlich ändert sich für die Nutzerinnen und Nutzer von ILIAS durch die Umstellung wenig. Es weitere Informationsmaterialien zur neuen Version 5 an: http://www.zml.kit.edu/e-learning-schulungen.php. hat sich gezeigt, dass die meisten Nutzer sich nach kurzer Zeit an das neue Erscheinungsbild gewöhnen konnten und keine gravierenden Probleme bei der Bedienung auftraten.2 SCCnews | 11
DI E N STE UND I NN OVATION ten daher keine Kurse übertra- gen. Bei dem Update wurde – bildlich gesprochen – der Antrieb gewechselt und mit mehr Funktionalität ausgestattet; das damit betriebene System bleibt jedoch in der Form erhalten, in der es Dozierenden und Studie- renden aus der Vergangenheit bekannt ist. Ablauf der Umstellung Beim Update auf ILIAS 5 wurden über 14.000 Kurse und ca. 65.000 Benutzerkonten transfe- riert. Das Installationsverzeichnis Abb. 2: Ladezeit der ILIAS-Startseite im Wochenüberblick (rechts oben, Maximum: 1,21 Sekun- Abbildung 2: Ladezeit der ILIAS-Startseite im Wochenüberblick (rechts oben, Maximum: 1,21 Sekunden, Mittel: 0,47 auf dem Filesystem (ca. 1 Ter- den, Mittel: 0,47 Sekunden) bei starkSekunden) beigleichzeitig wechselnder Zahl stark wechselnder aktiver Nutzer Zahl gleichzeitig (Maximum: aktiver 657 Nutzer, Nutzer Mittel: 139) 4 (Maximum: abyte) musste für das Update auf 657 Nutzer, Mittel: 139)4 eine andere Versionsverwaltung Des Weiteren eröffnen sich mit der neuen ILIAS-Version Möglichkeiten zur Anbindung aktuell (von SVN auf Github) umgestellt unterstützter Plugins an die ILIAS-Installation des KIT, wie z.B. LiveVoting und der bald schon zur Verfügung stehenden Anbindung an die Bibliothek des KIT. werden. Die komplette Datenbank (mit einer Größe von über 30 Vor der Freigabe der neuen Version für alle Nutzer wurden intern Gigabyte) wurde umstrukturiert. Der Update-Prozess verlief zwar zahlreiche, im Vorfeld erstellte Testszenarien durchgespielt. weitgehend automatisch, war aber zeitaufwändig und erforderte Fragen zum neuen ILIAS 5 beantwortet gerne der ILIAS-Support (ilias@studium.kit.edu). an vielen Stellen manuelles Eingreifen, da sich über die lange Weitere Optimierungen Laufzeit der bestehenden ILIAS-Installation an Abstractmehreren Stellen Unstimmigkeiten und sogar Fehler in derILIAS Datenbank eingeschli- 5 – Update In der neuen of KIT’s E-Learning SystemILIAS-Version stehen verschiedene Caching-Metho- chen hatten. den (wie z.B. Memcached) zur Verfügung. Durch deren Einsatz, KIT’s e-learning-system ILIAS,kombiniert which is hosted at SCC, mit einer was updated verbesserten to version 5 indes ILIAS- Programmierung Aufgrund des großen Versionssprungs, von September ILIAS 4.32016. ILIAS 5 not Source auf ILIAS only includes Codes important security (beispielsweise bei updates, it also offersund dank Datenbankabfragen) 5.1, mussten während des Update-Prozessesseveral newDatenbank- einige features (such as der drag-and-drop for uploading guten Aufstellung unserer multiple files)komplett mittlerweile and is virtualisier- tabellen von Hand hinzugefügt, gelöschtcompatible with a larger set often oder nachbearbeitet plugins. The layout3,has ILIAS-Installation können nun auch plötzliche5Nutzeranstür- also changed in version with werden. Diese Arbeiten erforderten einen modernized iconsmit langen Vorlauf and design.me Internal processes vom System were besser optimized, bewältigt including werden database2). (s. Abbildung vielen Vorarbeiten, zahlreichen kleinerenqueries and caching mechanisms, to speed up ILIAS. Test-Update-Sequenzen und einem großen Test-Update an einer Spiegelung des Produk- Diese Verbesserung macht sich besonders zu Vorlesungsbeginn tivsystems. bemerkbar, da Sprünge von so gut wie keinem angemeldeten Nutzer auf knapp 600 gleichzeitig aktiven Nutzern innerhalb Die Anpassungen des Layouts für das KIT waren in der neuen weniger Minuten keine Seltenheit darstellen. ILIAS-Version besonders zeitaufwändig, da sich an dieser Stelle die zur Verfügung stehenden Konfigurations-Möglichkeiten und Des Weiteren eröffnen sich mit der neuen ILIAS-Version Möglich- der gesamte Anpassungsprozess wesentlich verändert haben. keiten zur Anbindung aktuell unterstützter Plugins an die ILIAS- 4 Die Grafiken zeigen bereits auf bestimmte Zeitintervalle gemittelte Werte, sodass die genannten Maxima in Installation des KIT, wie z.B. LiveVoting und der bald schon zur der Grafik nicht mehr zu erkennen sind. Verfügung stehenden Anbindung an die Bibliothek des KIT. ILIAS 5 – Update of KIT’s E-Learning System Fragen zum neuen ILIAS 5 beantwortet gerne der ILIAS-Support KIT’s e-learning-system ILIAS, which is hosted at SCC, was (ilias@studium.kit.edu). updated to version 5 in September 2016. ILIAS 5 not only includes important security updates, it also offers several new features (such as drag-and-drop for uploading multiple files) and is compatible with a larger set of plugins. The layout has also changed in version 5 with modernized icons and design. 3 Vier Webserver, eine Service-Maschine sowie ein virtueller Datenbankserver Internal processes were optimized, including database que- (s. auch SCC News 2015, S. 12-13). ries and caching mechanisms, to speed up ILIAS. 4 Die Grafiken zeigen bereits auf bestimmte Zeitintervalle gemittelte Werte, sodass die genannten Maxima in der Grafik nicht mehr zu erkennen sind. 12 | SCCnews
FOR S C H U N G U N D P RO J E K T E V-FOR-WaTer – Eine virtuelle Forschungsumgebung für die Wasser- und terrestrische Umweltforschung Das Management sowie die Aufbereitung von heterogenen Datenbeständen für hydrologische Analysen und Modellie- rungen stellt oftmals eine große Herausforderung dar. Ty- pischerweise erfordert dies ein zeitintensives Umformatie- ren unterschiedlichster Daten verschiedenster Quellen für die jeweilige Fragestellung. Die virtuelle Forschungsumgebung V-FOR-WaTer ermöglicht einen einfachen Zugriff auf die Daten im benötigten Format und bietet ebenso eine Plattform, auf der Analysewerkzeuge gespeichert, geteilt und genutzt werden können. Um den Anforderungen der Umweltforschung gerecht zu werden, erfolgt die Entwicklung der Forschungsumgebung in Zusammenar- beit mit dem Institut für Wasser und Gewässerentwicklung (IWG) des KIT. Dr. Marcus Strobl, Dr. Sibylle Hassler1 „Startschuss“ des zunächst für zwei Jahre im zielgerichteten und abgestimmten Langfristig soll V-FOR-WaTer auch über finanzierten Landesprojektes V-FOR- Ausbau bestehender Forschungsein- Landesgrenzen hinaus als gutes Beispiel WaTer war am 1.7.2016, wobei bereits zugsgebiete der Universitäten unter der für den Umgang mit Umweltdaten gelten im Februar Abstimmungsgespräche mit Integration des Umweltmessnetzes der und erweitert werden. Dies wird durch den Universitäten in Baden-Württemberg Landesanstalt für Umwelt, Messungen eine modulare Ankopplung an andere, und der Landesanstalt für Umwelt, und Naturschutz Baden-Württemberg bereits bestehende Systeme, wie z.B. das Messungen und Naturschutz Baden- (LUBW) sowie der Anbindung des der LUBW, aber potentiell auch nationale Württemberg (LUBW) stattfanden. Durch Deutschen Wetterdienstes (DWD). In oder internationale Systeme, gewährleis- die frühe und intensive Zusammenarbeit diesem Observatorium betreiben die tet. mit der wissenschaftlichen Gemeinschaft Universitäten Baden-Württembergs und in diesem Forschungsbereich wird die die LUBW, wissenschaftlich koordiniert, Weitere Informationen bestmögliche Akzeptanz und Nutzbar- ihre Umweltbeobachtungsmessnetze. Die http://www.vforwater.de keit der Virtuellen Forschungsumgebung gemessenen Daten können so gemein- (VFU) erreicht. sam genutzt werden, um insbesondere langfristige Auswirkungen des globalen Der Schwerpunkt von V-FOR-WaTer liegt Wandels besser zu verstehen. Dies ist V-FOR-WaTer – a virtual research auf der Haltung hydro-meteorologischer ein wichtiger Schritt hin zur Realisierung environment for water and terrestrial Daten und dem direkten Zugriff auf der Vision eines „Landesobservatoriums environmental research Analysewerkzeuge, um Forschungsdaten Oberrheingraben“. Management and preprocessing of hetero- schnell prozessieren zu können und für geneous data pools for hydrological analy- die prognostische Modellierung nutzbar Die Speicherung der Modellparametri- ses and models often bears a big challenge. zu machen. Die erste Phase ist auf die In- sierungen und Simulationsergebnisse Typically, a time-consuming transformation tegration von Wasser- und Umweltdaten in V-FOR-WaTer für unterschiedliche of different data from various sources is aus Baden-Württemberg fokussiert. Gebiete, und die Entwicklung geeigneter required. V-FOR-WaTer provides simple Dokumentationsstandards, ermöglicht access to data in the required format and Insbesondere der Oberrheingraben ist es die Erkenntnisse aus den Modellen provides a platform to save, share and use durch seine lange Geschichte in der zu bewahren und zu teilen. Somit kann tools for data analysis. To meet the various Umweltbeobachtung und der großen Di- langfristig ein vergleichendes Lernen über requirements of environmental research, versität der Landschaftsräume und Land- die Vor- und Nachteile unterschiedlicher the V-FOR-WaTer virtual research environ- nutzungen prädestiniert für den Aufbau Modellsysteme für die Anwendung in ment is developed in close cooperation eines Langzeitobservatoriums mit einer unterschiedlichen Regionen und für un- with the Institute of Water and River Basin gemeinsamen VFU. Die Kernidee besteht terschiedliche Ziele gewährleistet werden. Management at KIT. 1 Institut für Wasser und Gewässerentwicklung (IWG) SCCnews | 13
F O R SCHUNG UN D PR OJEKTE EUDAT Operations Management Das EUDAT Konsortium ist eine internationale Kooperation, die digitale Dateninfrastrukturen, Ressourcen und Datendienste fördert, um Forschungs- und Wissenschafts-Communities beim Datenmanagement zu unter- stützen. 35 europäische Organisationen nutzen Dienste und Speicherressourcen in 15 Ländern, die eine so genannte kollaborative Dateninfrastruktur (CDI) bilden. Ziel ist es, wissenschaftliche Daten langfristig zu spei- chern, aufzufinden und in einer vertrauenswürdigen Umgebung zu verarbeiten. Durch die Einführung eines Operationsteams sowie geeigneter Managementprozesse wird die Kommunikation zwischen den Partnern auf technischer Ebene wirkungsvoll gebündelt. Das Operations Management bildet eine wichtige Schnittstelle in der CDI, die aus 13 generischen Datenzentren und einer wachsenden Anzahl von Wissenschaftsgemeinschaften und themenspezifischen Zentren besteht. Im Rahmen des Arbeitspaketes "Operations" koordiniert das SCC die Implementierung und den Betrieb von Diensten, sowie die Bereitstellung der Ressourcen. Pavel Weber EUDAT – Datendienste Inbetriebnahme der CDI unterstützt. Das Operationsteam soll für die Wissenschaft garantieren, dass die erforderlichen Res- Innerhalb des Arbeitspakets "Operations" sourcen rechtzeitig zur Verfügung gestellt EUDAT2020, das dreijährige Nachfol- werden Konzepte entwickelt, um die werden können. geprojekt von EUDAT, umfasst sieben CDI technisch zu konsolidieren. Ziel ist Kern-Communities - CLARIN, ELIXIR, es die Integrität, die Vertraulichkeit und Blick in die Projektstruktur ENES, EPOS, ICOS, LTER und VPH. Diese die sichere Aufbewahrung der von den repräsentieren ein sehr breites Spektrum Benutzern hinterlegten Daten zu gewähr- Das breite Spektrum von notwendigen aus Sozial- und Geisteswissenschaft, leisten. Hierfür wurde eine neue, verteilte Maßnahmen wurde in fünf Aufgabenbe- Geographie, Energie und Umweltwissen- IT-Infrastruktur aufgebaut. Diese besteht reiche zusammengefasst (Abb. 1) schaft, aber auch Biologie und Biowis- aus 13 generischen Datenzentren und senschaft. Für diese sehr heterogenen einer wachsenden Anzahl an Wissen- Data Project Consultancy & Enabling: Wissenschafts-Communities bietet EUDAT schafts-Communities sowie thematischen Hierunter fällt der Aufbau von Experten- IT-Dienste, die es ermöglichen wissen- Zentren. Im letzten Jahr konzentrierten wissen zur Unterstützung der Forscher schaftliche Daten effizient zu verwalten sich die Aktivitäten von "Operations" auf und Anwender bei der Nutzung der CDI sowie hochverfügbar und langfristig die Umsetzung der Datenprojekte auf die für deren Datenprojekte. zu speichern. Alle EUDAT-Aktivitäten CDI. Diese Aufgabe erfordert die Zusam- zur Erbringung dieser IT-Dienste sind in menarbeit aller Partner, die die Nutzer Helpdesk & Support: Diese Task unter- Arbeitspaketen organisiert. Hier wird das mit Werkzeugen für den IT-Betrieb, stützt die EUDAT CDI Benutzer durch ein Arbeitspaket Operations näher betrachtet. einer effektiven Kommunikation, durch zentrales Helpdesk-System und definiert Software-Monitoring und einen Helpdesk die dafür notwendigen Richtlinien. Die einlaufenden Anfragen verteilt ein „Dis- patching Officer“ über das Supportsystem CDI Data Centres an die Partnerorganisationen, die den 2nd-Level-Support leisten. EUDAT Service EUDAT Service EUDAT Services Security: Dieses Aufgabenpaket kon- zentriert sich auf die Koordinierung API der operativen Sicherheit und auf die GRNET SCC MPCDF Sicherheitsbewertung, die Vertraulichkeit, Service Portfolio API SVMON Framework API Data Project Integrität und Zugänglichkeit der Daten, (List of all EUDAT services (software versions Management Tool der Dienste und der Systeme von EUDAT. and service components) monitoring framework) (List of all projects and their services) Operational Tools & Services: Bereit- Abb. 2: Schema der automatisierten Software-Versions-Überwachung innerhalb der CDI. stellung zentraler Basisdienste wie z.B. 14 | SCCnews
FOR S C H U N G U N D P RO J E K T E Accounting, Überwachung, Inventarisie- CDI, ist nur über geeignete Werkzeuge veraltete Software zu identifizieren und rung und Authentifizierung, die benötigt und Workflows effizient zu verwalten. effizienter zu aktualisieren. werden, um die CDI zu betreiben. Es ist wichtig durch deren Nutzung die Kommunikation per E-Mail oder Telefon Ausblick Service and Resource Provisioning & zu reduzieren und stattdessen opera- Coordination: Über diese Tasks soll die tive Daten automatisch zwischen den Experten des SCC bieten neben der von den Datenprojekten erforderliche unterschiedlichen Betriebsprozessen zu Koordination bei der Bereitstellung von Überwachung der Produktivität, der Ser- übertragen. Des Weiteren soll die Vielfalt IT-Diensten und Ressourcen auch techni- vicequalität, der Sicherheit und Nachhal- der Werkzeuge konsolidiert werden und sche Unterstützung zur Installation und tigkeit der CDI koordiniert werden. Eine alle Informationen mit Hilfe von APIs in Konfiguration von EUDAT-Diensten an. weitere Aufgabe ist die Bereitstellung der einem einheitlichen Datenpool zusam- Für den EUDAT-Dienst B2SAFE wurde IT-Ressourcen und zugehörigen Services. menlaufen. Diesen Ansatz nutzt beispiels- am SCC eine automatisierte Installation weise das "Software Version Monitoring" und Konfiguration, basierend auf dem Clevere Betriebsprozesse (SVMON), das im SCC entwickelt wurde. Systemkonfigurationswerkzeug Puppet, Es stellt ein Framework zur Verfügung, entwickelt. Die Pakete für die automati- Das SCC verantwortet den Bereich Service das regelmäßig die aktuellen Software sche Installation weiterer Dienste wie z. and Resource Provisioning & Coordi- Versionen aller EUDAT-Dienste abfragt B. B2STAGE werden derzeit geschrieben nation. Die vom Operations Manager und abspeichert und mit der Service und stehen bald allen Datenzentren zur des SCC koordinierten übergreifenden Portfolio Datenbank vergleicht, ob Verfügung. Verfahren für die Planung, Steuerung und Software-Updates notwendig sind (siehe den Betrieb der Infrastruktur und Dienste Abb. 2). Die Ergebnisse werden an ein basieren auf den Service Management weiteres EUDAT-Werkzeug, das Data Pro- Standards FitSM (www.fitsm.eu). ject Management Tool, geschickt. Dieser Weitere Informationen: Ansatz erlaubt es den unterschiedlichen SCC erweitert Beteiligung in EUDAT; In Rahmen des Arbeitspakets Datenprojekten automatisch und schnell SCC-News 2015, S. 28 Operations wurden aus den 14 FitSM-Kern- prozessen die für den Service-Support wichtigen Prozesse – Incident & EUDAT Federated Operations service request, Problem, Configuration, Change und Release & deployment Data Project Consultancy & Helpdesk & Support management – für EUDAT Enabling angewendet, sowie dafür Enabling Team 1st level support: BSC (Spain) passende Richtlinien defi- CINECA (Italy) 2nd level support: Site deputies, niert. Für die erfolgreiche Koordination des EUDAT Betriebs ist eine tägli- Security che Interaktion mit den Network, Configuration • Compute Resources anderen oben aufgeführ- • Service Hosting, ten Aufgabenbereichen Service on Demand EUDAT Security Officer,Security Team • Service Deployment CSC (Finland) erforderlich. Dies wird u.a. Storage, Storage Services auch durch die Einführung cleverer und schlanker Service and Resource Operational Tools & Services (Wiki, Monitoring, Accounting, IT-Betriebsprozesse, wie sie Provisioning & Coordination Inventory DB, Auhentication) FitSM definiert, erreicht. Operations Team, Site Deputies MPCDF (Germany) KIT/SCC (Germany) Werkzeuge und Workflows im Betrieb 1 Abb. 1: Der über das Projekt EUDAT koordinierte Betrieb verteilter europäischer Datenzentren (themenspezifisch Datenzentren – rot, allgemeine Datenzentren – blau, zentrale Toolprovider – Eine so weitverteilte grün). Das Arbeitspaket ist in fünf Aufgabengebiete unterteilt. Infrastruktur, wie die >>> SCCnews | 15
F O R SCHUNG UN D PR OJEKTE >>> EUDAT Operations Management The EUDAT consortium is an international collaboration, which federates the digital capabilities, resources, and data services to engage and support multiple research communities in efficient data management. A geographically distributed, resilient network of 35 European organizations shares service and storage resources across 15 countries and builds a Collaborative Data Infrastruc- ture (CDI) to preserve, find, access and process data in a trusted environment. The EUDAT operations team organizes the co- operation of the different actors within the CDI and provides the distributed operational infrastructure with 13 generic data centers in partnership with a growing number of collaborating research communities, thematic centers and research infrastructures. The contribution of SCC to the EUDAT Operations task is focused on the coordination of deployment and operation of services as well as resource provisioning. Gründung der EUDAT Collaborative Data Infrastructure Fünfzehn Forschungseinrichtungen haben die EUDAT Collaborative Data Infrastructure gegründet. Ziel ist der Aufbau einer zuverlässigen Dateninfrastruktur für das Management von Forschungsdaten in Europa. Prof. Dr. Achim Streit, Daniel Mallmann1, Stefan Heinzel2 Fünfzehn Einrichtungen, darunter das Die Daten-Infrastruktur umfasst neben Jülich Supercomputing Center (JSC), das generischen und multi-disziplinären wis- JSC is one of fifteen European partners that Steinbuch Centre for Computing (SCC) senschaftlichen Datenzentren, wie dem recently founded the EUDAT Collaborati- und die Max Planck Computing & Data JSC und dem SCC, auch fachspezifische ve Data Infrastructure (EUDAT CDI). The Facility (MPCDF), haben kürzlich die Zentren, beispielsweise das Deutsche Kli- partners consist of European data centres EUDAT Collaborative Data Infrastructure marechenzentrum. Die daten-orientierten and operators of community repositories. (EUDAT CDI) gegründet. Ziel der EUDAT Dienste aus den Bereichen „Data Sha- EUDAT CDI is a partnership agreement that CDI ist es, eine nachhaltige Perspektive ring“, „Data Access“, „Data Storage“, evolved from the EUDAT2020 project, fun- für das Management von Forschungs- „Data Preservation“, „Data Processing“ ded by the Horizon 2020 programme. The daten in Europa zu bieten und dafür und „Data Discovery“ werden von Wis- goal of EUDAT CDI is to offer a long-term eine zuverlässige Dateninfrastruktur zu senschaftlern unterschiedlicher Diszipli- perspective beyond current project funding etablieren und langfristig zu betreiben. nen gemeinsam mit den Betreibern dieser for managing scientific data, thus beco- Die Kollaboration besteht aus europäi- Dienste entworfen und betreut. Auf ming a reliable infrastructure for scientific schen Datenzentren und Betreibern von große multi-disziplinäre Forschungsein- communities and researchers. Forschungsdatenrepositorien. Grundlage richtungen zugeschnittene Dienste sind EUDAT CDI was launched at the first EUDAT der Organisation ist eine partnerschaft- genauso Bestandteil des Portfolios, wie CDI Council meeting, which took place liche Vereinbarung, die sich aus dem in solche, die sich an kleinere Forschungs- on 27 September 2016 in Krakow. At this Horizon 2020 geförderten EUDAT2020 gruppen und einzelne Wissenschaftlerin- meeting, three new partner applications for Projekt entwickelt hat. Die EUDAT CDI nen und Wissenschaftler wenden. Das joining EUDAT CDI were accepted. bildet somit auch einen Grundstein JSC betreibt derzeit u.a. die zentrale Nut- zur Etablierung der European Open zeridentifikation und allgemeine Dienste The infrastructure comprises generic or Science Cloud (EOSC). Im Rahmen des zur Synchronisation und zum Austausch multi-domain data centres, such as JSC, ersten EUDAT CDI Council Meeting, am von Daten, das SCC und die MPCDF and community-specific data centres. The 27.09.2016 in Krakau, wurde die EUDAT betreiben Dienste zur Langzeitspeiche- infrastructure services are co-designed by CDI offiziell ins Leben gerufen. Zeitgleich rung und Archivierung. Alle Zentren der community scientists and data service de- wurden drei neue Partner aufgenommen EUDAT CDI unterstützen den Aufbau velopers. EUDAT CDI offers tailored services und weitere Organisationen haben ihr von Forschungsrepositorien gemäß den for large research communities and generic Interesse zum Beitritt erklärt. Grundsätzen von Open Access. services for small research groups and indi- vidual scientists. JSC currently operates the central user identification, a generic service for data synchronization and exchange, and 1 Jülich Supercomputing Centre (JSC) Weitere Informationen: community-specific services. 2 Max Planck Computing and Data Facility (MPCDF) https://www.eudat.eu/eudat-cdi 16 | SCCnews
FOR S C H U N G U N D P RO J E K T E bwDIM – Vereinfachter Datenfluss im Forschungsdatenmanagement Das baden-württembergische Landesprojekt bwDataInMotion (bwDIM) unterstützt Wissenschaftlerinnen und Wissenschaftler der Universitäten in Baden-Württemberg beim Forschungsdatenmanagement. Es hat zum Ziel, den Datenfluss zwischen den unterschiedlichen Systemen zu vereinfachen. Felix Bach Verfügbarkeit und Nutzbarkeit wissenschaftlicher Daten sind Schlüsselfaktoren für die weitere Entwicklung der empirischen Wissenschaften. Das Management, der langfristige Erhalt und die Zugänglichmachung dieser Daten ist jedoch eine große Herausforderung für Hochschulen und außeruniversitäre For- schungseinrichtungen. Das baden-württembergische Landesprojekt bwDIM (bwDataIn- Motion) ist eine Kooperation des Steinbuch Centre for Compu- ting mit dem Leibniz-Institut für Informationsinfrastruktur (FIZ Karlsruhe) und der KIT-Bibliothek und zielt auf den vereinfach- ten Datenfluss zwischen den unterschiedlichen Systemen zum Forschungsdatenmanagement. Es soll damit den Arbeitsalltag für die Forschenden erleichtern, indem technische und organisatori- sche Hürden bei der Archivierung, Publikation und Nachnutzung von Forschungsdaten überwunden werden (s. Abb. 1). Dabei wird auf bestehenden Bausteinen und Vorarbeiten aus anderen Projekten (u.a. bwDataArchiv, RADAR, bwDataDiss) aufgebaut. Diese werden zu einem größeren Ganzen verknüpft. Hierzu untersucht das Projekt die zentralen Arbeitsprozesse der Forscherinnen und Forscher und identifiziert bestehende Defizite auf Prozessebene und bei den technischen Basisdiensten. Darauf aufbauend werden Lösungsansätze zur Prozessoptimierung so- wie zur Optimierung und Integration der Basisdienste erarbeitet, umgesetzt und anhand bestehender Systeme und Nutzergrup- pen validiert. Abb. 1: Schematische Darstellung der Datenflüsse beim Forschungsdatenmanagement Konkret beinhaltet dies die Vereinheitlichung von Archiv- schnittstellen, Standardisierung administrativer und technischer Metadaten, föderationsübergreifende Authentifizierung und Autorisierung, Unterstützung multipler Datenübertragungs- und bwDIM – simplifying data flows in research asynchroner Datenbereitstellungsverfahren sowie die Anbindung data management der technischen Infrastruktur der Verlags- und Repositoriensys- The project bwDataInMotion (bwDIM) supports scientists of uni- teme. versities in Baden-Württemberg in managing their research data. The goal of the project is to simplify the flow of data between the diverse storage- and repository systems. This includes the unification of archive interfaces, standardisation of admin-istra- tive and technical metadata, authentification and authorization across federation borders, asynchronous data transfer methods, as well as integrating the technical infrastructure with reposito- ries and the publication systems. SCCnews | 17
Sie können auch lesen