Forschungsdatenmanagement in einem interdisziplinären Forschungsprojekt - SFB 1294-Z03 - Humboldt ...
←
→
Transkription von Seiteninhalten
Wenn Ihr Browser die Seite nicht korrekt rendert, bitte, lesen Sie den Inhalt der Seite unten
Forschungsdatenmanagement in einem interdisziplinären Forschungsprojekt Dr. Christian Riedel SFB 1294-Z03 Information Infrastructure Universität Potsdam Institut für Informatik und Computational Science
Ich habe Daten/Skripte veröffentlicht (z.B. via GitHub) Umfrage Irgendsoeine Umfrage um die Leute wach zu machen Ich habe bisher noch keine Daten/Skripte veröffentlicht 2
Ich habe Daten/Skripte von anderen genutzt (z.B. via GitHub) Umfrage Irgendsoeine Umfrage um die Leute wach zu machen Ich habe noch keine Daten/Skripte von anderen genutzt 3
Die Krise der Reproduzierbarkeit 5 https://api.hub.jhu.edu/factory/sites/default/files/styles/soft_crop_1030/public/ replication_yellow_art_102717.jpg?itok=fs2peydA
Die Reproduzierbarkeit von Forschungsergebnissen 2019 Studie von Stagge et al. Untersuchung von 360 Publikationen aus sechs Hydrologie & Water resource Journals aus 2017 Bei nur 1.7% der untersuchten Artikel konnten die Ergebnisse reproduziert werden 1.7% ! Flaschenhals: Unvollständige Daten oder schlechte Dokumentation Stagge, J., Rosenberg, D., Abdallah, A. et al. Assessing data availability and research reproducibility in 6 hydrology and water resources. Sci Data 6, 190030 (2019). https://doi.org/10.1038/sdata.2019.30
7 https://img.buzzfeed.com/buzzfeed-static/static/2020-04/8/20/asset/7b9e65c22915/sub-buzz-4225-1586376826-16.jpg
Reproduzierbarkeit im SFB 1294 (2020) • 53 Publikationen • Nur 3,8 % der Publikationen hatte • Kein Experiment konnte Daten, die auffindbar waren reproduziert werden 10
Forschungsdatenmanagement Alle Aktivitäten, die mit der • Erhebung • Speicherung • Archivierung & • Veröffentlichung von Forschungsdaten zusammenhängen. Kann erstmal alles sein • Alle digitalen Daten, die während des Forschungs- prozesses entstehen oder ihr Ergebnis sind https://wizardtechsolutions.com/wp-content/uploads/2017/03/big-data-cloud.png Maxi Kindling, Peter Schirmbacher, Elena Simukovic: Forschungsdatenmanagement an Hochschulen: das Beispiel der Humboldt-Universität 11 zu Berlin. LIBREAS. Library Ideas, 23 (2013). Online verfügbar unter: http://libreas.eu/ausgabe23/07kindling/ DOI: 10.18452/9041
Kreislauf von Forschungsdaten Notwendige Schritte, um ein datenbasiertes Forschungsprojekt durchzuführen 12
FAIR Prinzipien G20 Staaten haben sich dazu bekannt, den Zugang zu öffentlich finanzierten Forschungsdaten, anhand der FAIR Prinzipien zu gewährleisten 13
Handlungsempfehlungen - Policies Können von Institutionen, Journales, Forschungsgemeinschaften etc. kommen • „Forschungsdaten sollen […] so offen wie möglich zur Nachnutzung Institution bereitgestellt werden.“ • „Forschungsdaten, […] sind bei einer geeigneten Infrastruktur für mindestens 10 Jahre zu archivieren.“ • „Die Universität Potsdam erkennt die Aufbereitung von Forschungsdaten zur Nachnutzung sowie die Entwicklung nachnutzbarer wissenschaftlicher Software als wissenschaftliche Leistungen an” • „Forschende Studierende und der wissenschaftliche Nachwuchs haben Anspruch auf angemessene Information, Qualifizierung und Unterstützung durch Lehrende und Betreuende“ https://www.uni-potsdam.de/de/forschungsdaten/richtlinien/universitaet/policy 14 https://www.uni-potsdam.de/de/forschungsdaten/richtlinien/universitaet/recommendations
Umsetzung und Arbeit an der Basis Reminder: Wir haben Guidelines, die versuchen, viele Forschungsfelder abzudecken und Forschende, die mit unterschiedlichsten Sachverhalten konfrontiert sind: Technische Anforderungen Erwartungen Persönliche Realitäten • Unterschiedliche Daten • Datenschutz • Karriereplanung • Unterschiedliche Software • Abhängigkeiten • Kontrolle über (persönlich, Daten) Algorithmen abgeben → Beeinflussen, wie sehr Forschende FDM-Policies umsetzen Pictograms by Kukuh Wachyu Bias, Nithinan Tatah, 15 & Sumit Saengthong, CC-BY
Open Science & Kulturwandel in der Forschung • Vorteile (für Forschende und die Öffentlichkeit): • Mehr Zitationen und größere Leserschaft • Wirtschaftlichkeit • Reproduzierbarkeit • Heuristik (Aufbauende Forschung vs. Doppelter Aufwand) • Wissenschaftliche Glaubwürdigkeit, Transparenz, Integrität • Schwierig: • Akademische Realitäten, Unterschiedliche Erwartungen, Verschiedene Policies, etc. sind eine Herausforderung Wie lassen sich diese Prinzipien umsetzen? → Es brauch einen Kulturwandel! 16
…und in der Praxis? 17
Plattformen zum Wiki, Overleaf, Git, Box.UP storage, kollaborativen Arbeiten Datenarchiv, Data & Wissensbasis Management Plans 1. IT Infrastruktur Container Erweiterung durch Infrastruktur, High Einbindung von Performance Computing, CI/CD Industriestandards Pipelines 18
Mitgliedschaft bei Unterstützung bei der „The Carpentries“, Publikation von Daten durch Austausch mit Konsultationen und Initiativen (MaRDI, NFDIxCS, Workshops Länderinitiativen) 2. Vermittlung von Wissen Einstellung von Unterstützung beim Testen und wissenschaftlichen Dokumentieren, Hilfskräften zur Verbesserung Umsetzung von good der Reproduzierbarkeit coding practices 19
Fazit: Persönliche Erfahrungen Mein Eindruck: Es gibt Viele Gruppen im SFB nutzen IT Infrastruktur: erhöhte Bereitschaft, die die IT Infrastruktur Plattformen zu nutzen Großer Bedarf an Workshops Wissensvermittlung: und Konsultationen Individuelle Verantwortungen Aber: können für Forschende sehr herausfordernd sein 20
Danke für die Aufmerksamkeit Pixabay.com, CC0 1.0
Sie können auch lesen