Policy Brief - IDW online
←
→
Transkription von Seiteninhalten
Wenn Ihr Browser die Seite nicht korrekt rendert, bitte, lesen Sie den Inhalt der Seite unten
Leibniz-Institut für Agrarentwicklung Nº 42 in Transformations- ökonomien (IAMO) www.iamo.de Policy Brief Ausgabe Nr. 42 August 2021 Forschungssoftware – Nachhaltige Entwicklung und Unterstützung Forschungssoftware ist zu einem zentralen Gut der akademischen Forschung geworden. Sie ist oft das Rückgrat bestehender For- Franziska Appel schungsmethoden, ermöglicht neue Forschungsmethoden, im- Axel Loewe plementiert und bettet Forschungswissen ein und stellt selbst ein wesentliches Forschungsprodukt dar. Forschungssoftware muss nachhaltig sein, um bestehende Wissenschaft zu verste- hen, zu replizieren, zu reproduzieren und darauf aufzubauen, um neue Forschung effektiv durchzuführen. Daher ist eine Änderung der Art und Weise erforderlich, wie die Entwicklung und Wartung von Forschungssoftware derzeit motiviert, incentiviert, finan- ziert, strukturell und infrastrukturell unterstützt und rechtlich behandelt wird. Geschieht dies nicht, gefährdet dies die Qualität und Validität der Forschung. Vor diesem Hintergrund trafen sich im November 2019 mehr als 50 Wissenschaftler:innen aus ver- schiedenen Institutionen zu einem DFG-Rundgespräch am Robert- Koch-Institut, um Nachhaltigkeitsaspekte von Forschungssoft- ware zu diskutieren und auf die Notwendigkeit von Förder- instrumenten für die nachhaltige Entwicklung und Bereitstel- lung von Forschungssoftware aufmerksam zu machen. Das anschließend veröffentlichte Positionspapier (Anzt et al., 2021) wendet sich gezielt an politische und akademische Entschei- dungsträger, um das Bewusstsein für die Bedeutung und den Bedarf einer nachhaltigen Forschungssoftwarepraxis zu schär- fen. Insbesondere empfiehlt es Strategien und Maßnahmen, um ein Umfeld für nachhaltige Forschungssoftware zu schaffen. Das Rückgrat der Forschung des Projektfinanzierung weiter zu pflegen. Dies führt 21. Jahrhunderts: Aktueller Stand und zu einem höchst ineffizienten System, in dem je- offene Herausforderungen des Jahr Millionen von Codezeilen erzeugt werden, die nach dem Ende eines Projekts oder dem Aus- Die computergestützte Analyse großer Daten- laufen der Stelle des:der Entwickler:in nicht wieder- sätze, computergestützte Simulationen und Soft- verwendet werden. waretechnologie im Allgemeinen spielen eine zen- In Deutschland erkennen Fördereinrichtungen trale Rolle für praktisch alle wissenschaftlichen zunehmend die Bedeutung und den Wert nachhal- Durchbrüche des 21. Jahrhunderts. Zur gleichen Zeit tiger Forschungssoftware und damit verbundener stützen sich Forschende oft auf Software, die haus- Infrastrukturen an. Die Deutsche Forschungsge- intern oder von Freiwilligen entwickelt wurde. Viele meinschaft (DFG), die größte Fördereinrichtung für dieser Softwareumgebungen können nicht auf- Grundlagenforschung in Deutschland, hat zum Bei- rechterhalten werden – oft, weil die Forschungs- spiel Ausschreibungen für nachhaltige Forschungs- software kein benanntes und primäres Ergebnis softwareentwicklung und Qualitätsmanagement im eines Forschungsprojekts war und daher im Proto- Bereich Forschungssoftware eröffnet. Als weiteres typ-Zustand verblieb oder wegen fehlender Anreize Beispiel führt der Kodex „Leitlinien zur Sicherung und Ressourcen die Software nach dem Ende der guter wissenschaftlicher Praxis“ der DFG aus 2019 1
Software nun explizit neben anderen Forschungs- Wer ist dafür zuständig, Forschungs- ergebnissen und -daten auf. software zu erhalten? Trotz dieser positiven Entwicklungen fehlen lei- der immer noch Leitlinien und Konzepte für eine Sowohl Förderorganisationen als auch Forschungs- nachhaltige Entwicklung von Forschungssoft- einrichtungen spielen wichtige Rollen für nachhal- ware in Deutschland. Langfristige Förderstrategien tige Forschungssoftware. Förderer sollten von den fehlen ebenfalls. Die Schlussfolgerungen und Emp- Antragstellenden Überlegungen verlangen, wie die fehlungen des DFG-Rundgesprächs sind im Folgen- in einem Projekt entwickelte Software über das den in Anlehnung an Anzt et al. 2021 zusammen- Ende des geförderten Projekts hinaus aufrechter- gefasst. halten werden kann. Dies erfordert auch längerfris- tige Förderbausteine für Softwarewartung, -pflege und Nutzerunterstützung, die von Anfang an bean- Wie wird entschieden, welche Software tragt werden können. Eine Weiterverfolgung die- erhalten werden sollte? ser Pläne während und nach der Projektlaufzeit, d. h. ein dedizierter Software-Management-Plan, Die dauerhafte Förderung aller bestehenden Soft- ist entscheidend. wareprojekte ist nicht nur unmöglich, sondern Entscheidungsträger:innen sollten die Defini- würde auch das Risiko einer starken Zersplitte- tion der Forschungswirkung über traditionelle wis- rung der wissenschaftlichen Fach-Communities senschaftliche Publikationen hinaus erweitern und mit sich bringen und wäre letztendlich kontrapro- auch andere wirkungsvolle Ergebnisse (wie Soft- duktiv für die Effizienz der Forschungsgemein- ware und Daten) einbeziehen, zum Beispiel bei der schaft. Daher ist es wichtig, sich auf eine Liste trans- Rekrutierung von akademischen Positionen. Diese parenter Kriterien zu einigen, die ein Software- Erweiterung der Basis für die Bewertung von For- produkt für eine dauerhafte Förderung qualifizie- schung und Forscher:innen wird explizit in der „San ren. Eine solche Liste muss allgemein genug sein, Francisco Vereinbarung über die Forschungsbewer- um auf Forschungssoftware aus verschiedenen tung“ (SF DORA) genannt, die viele deutsche und Forschungsdisziplinen angewandt werden zu kön- internationale Förderer und Forschungseinrichtun- nen und gleichzeitig die Unterschiede zwischen den gen jüngst unterzeichnet haben. Darüber hinaus Bereichen respektieren. sollten Forschungseinrichtungen attraktive lang- Hier konzentrieren wir uns auf die obligatorischen fristige Karrieremöglichkeiten im akademischen Kriterien, die domänenübergreifend erfüllt sein soll- Umfeld schaffen, um den Gewinn von engagierten ten. Weitere zusätzliche wünschenswerte Kriterien, Forschungssoftwareentwickler:innen (Research die je nach Anwendungsfall und domänenspezifi- Software Engineers; RSE) als Schlüsselkonzept für schen Anforderungen an die Softwareentwicklung professionelle Forschungssoftware-Praktiken zu in unterschiedlichem Maße umgesetzt werden kön- nutzen. nen, werden in Anzt et al. 2021 genannt. 1) Nutzung und Bedeutung Wie kann Forschungssoftware nachhaltig a) Verwendung über eine einzelne Forschungs- finanziert werden? gruppe hinaus b) Mindestens eine begutachtete wissenschaft- Da die Finanzierung ein entscheidender Faktor für liche Veröffentlichung basierend auf der die Nachhaltigkeit von Forschungssoftware ist, Software müssen die bestehenden projektorientierten För- c) Marktanalyse (Software ist wichtig für eine derinstrumente auf lokaler, nationaler und inter- Nutzerbasis relevanter Größe und ist entweder nationaler Ebene durch Förderinstrumente ergänzt einzigartig oder einer der Hauptakteure werden, die speziell auf die nachhaltige Pflege und in einem Bereich mit mehreren bestehenden Bereitstellung von Forschungssoftware ausgerich- Lösungen) tet sind. Zum Beispiel sollten Softwareprojekte, d) Geeignete Schulungsunterlagen werden zur die die oben genannten Nachhaltigkeitskriterien Verfügung gestellt erfüllen, Zugang zu dauerhafter Förderung haben, solange sie den Standards gerecht werden und wei- 2) Transparenz und Qualität terhin zentraler Bestandteil der Forschungsland- a) Öffentliche Verfügbarkeit des Quellcodes schaft sind. b) Versionskontrollsystem Rechenzentren für die Forschung müssen zweck- c) Lizenziert gebundene Mittel für die Unterstützung nachhalti- d) Abhängigkeiten von Softwarebibliotheken ger Softwareentwicklung erhalten. Diese Mittel sind und Technologien sind definiert notwendig, um Continuous-Integration-Systeme, ein Hardwareportfolio für die Entwicklung, das Tes- 3) Reifegrad ten und das Benchmarking von Software sowie Per- a) Software-Management-Plan sonal für die Schulung von Domänenforscher:innen b) Website mit klar definierter Anlaufstelle im Softwaredesign und der richtigen Nutzung der c) Gruppe von Entwickler:innen Dienste bereitzustellen. Die Erstellung und Pflege von Schulungsmate- rialien für die allgemeine Ausbildung im Bereich 2
Software-Engineering in der Forschung sowie soft- Forschungssoftware finden, veröffentlichen ware-spezifische Dokumentation und die Erstellung und archivieren von Tutorials müssen in den Finanzierungsmöglich- Ordnungsgemäße Software-Publikation und Mög- keiten berücksichtigt werden. Dies kann entweder lichkeiten für die Community, bestehende Soft- dadurch geschehen, dass Module der Forschungs- ware-Lösungen für ein bestimmtes Problem zu fin- oder Softwareförderung dem Support und der den, sind eine Voraussetzung, um Synergien optimal Erstellung von Schulungsmaterial gewidmet werden zu nutzen und redundante Entwicklungen zu ver- oder durch die Schaffung von Förderprogrammen, meiden. Das Auffinden erfordert die Veröffentli- die sich auf die interdisziplinäre Softwareentwick- chung an einem weltweit zugänglichen Ort mit ent- lungsausbildung konzentrieren. sprechenden Metadaten, z. B. Citation File Format (CFF). Umfassende Metadaten (z. B. Mitwirkende, Kontakt, Schlagworte, verlinkte Publikationen, etc.) Welche Infrastruktur wird für nachhaltige und Publikationsplattformen können persistente Forschungssoftware benötigt? Zitierbarkeit ermöglichen, was wiederum der For- schungsevaluation zugutekommt. Insbesondere in Projektmanagement Tools interdisziplinären Umgebungen empfiehlt sich die Die Bereitstellung von Werkzeugen zur verteilten Erstellung eines Meta-Index, der wichtige (diszip- Softwareentwicklung und -verwaltung wird als linäre) Software-Indizes abdeckt, um das Auffin- zentrale Forschungsinfrastruktur empfohlen, um den relevanter Software-Standorte zu erleichtern. eine institutsübergreifende Zusammenarbeit zu er- GitLab oder GitHub (gängige kollaborative möglichen. Ein wichtiger Aspekt in diesem Zusam- Arbeitsumgebungen) in Verbindung mit Reposito- menhang ist die Katalogisierung von Forschungs- rien wie Zenodo sind geeignete Publikationsplatt- software, um doppelten Entwicklungsaufwand zu formen, da letzteres DOIs prägt, Versionierung er- reduzieren. Dies kann effizient realisiert werden, laubt und für den langfristigen Zugriff öffentlich indem die Registrierung aller Forschungssoftware gefördert wird. Metadaten und Referenzen sind es- mit einem eindeutigen Identifikator gefördert wird sentiell für Tools wie PIDgraph, DataCite.org und und ein Werkzeug entwickelt wird, das die Erkun- CrossRef, die persistente Identifikatoren (PIDs) dung der Forschungssoftwarelandschaft ermög- wie DOIs verwenden. Für Deutschland ist davon licht. Mitwirkende an Forschungssoftware sollten auszugehen, dass die Nationale Forschungsdaten- ihre ORCID iD nutzen, um eindeutig identifizierbar infrastruktur (NFDI) Anstrengungen unternimmt, an und referenzierbar zu sein. zentraler Stelle Discovery-Plattformen zu schaffen oder zu unterstützen, die das Auffinden von Infor- Entwicklerschulung, Motivation mationen erleichtern. Leider spielt Forschungs- und Wissensaustausch software in der NFDI noch nicht die zentrale Rolle, Workshops und Seminare, die einen einfachen Zu- die sie spielen sollte. gang zu praktischem Training zu softwarebezo- Die Veröffentlichung einer bestimmten Soft- genen Fragen bieten, sollten gefördert und un- wareversion als Referenz in Forschungsartikeln terstützt werden. Eine aktuelle Initiative in diese erfordert einfache Möglichkeiten, Forschungs- Richtung sind die Helmholtz-HIFIS-Events. Die lang- software langfristig zu archivieren. Die Veröffent- fristige Lösung zur Erlangung ausreichender Soft- lichung von Software, ihren Abhängigkeiten und wareentwicklungskompetenzen sollte jedoch eine ihrer Umgebung in Containern kann die Auswertung Ausbildung sein, die früh in Hochschulcurricula ein- und weitere Wiederverwendung erleichtern. Soft- bezogen wird, idealerweise bereits auf Bachelor- warekonservierung zielt darauf ab, die Lebensdauer Ebene. von Software, die nicht mehr aktiv gepflegt wird, zu Vernetzung und Community-Building können verlängern. Eine Lösung, um die Software in einem zu einer dauerhaften Etablierung von nachhalti- lauffähigen Zustand zu halten, indem ihr Kontext ger Forschungssoftware führen. Software Car- und ihre Laufzeitumgebung erhalten bleiben, ist die pentry und ähnliche Initiativen wie die Gründung Verwendung von Containern wie Docker. Eine wei- der Data Science Academy HIDA in der Helmholtz- tere Gefahr ist der Verlust von Projektrepositorien Gemeinschaft helfen, Wissen auszutauschen und auf globalen Plattformen wie GitHub oder BitBucket. zu verbreiten. Lokale RSE-Gruppen und (inter-) Hier ernten globale Plattformen wie Software Heri- nationale Konferenzen werden die Gemeinschafts- tage diese Repositorien und verhindern den Verlust bildung weiter fördern. Forschungseinrichtungen durch Langzeitarchivierung. sowie Förderorganisationen sollten die Bildung sol- cher Gruppen aktiv fördern und ideell sowie finan- ziell unterstützen. Rechtliche Aspekte Die Schaffung eines nationalen Software-Nach- haltigkeitsinstituts (mit finanzierten Stellen zum Eine wesentliche Frage im Hinblick auf Nachhaltig- Aufbau von Services und zur Erstellung von Schu- keit von Forschung betrifft die freie und offene Ver- lungsmaterial) ähnlich dem britischen Software breitung von Forschungssoftware und anderen For- Sustainability Institute (SSI), das als nationaler schungsergebnissen. Es sollte diskutiert werden, ob Ansprechpartner für alle Aspekte im Zusammen- Forschungsförderorganisationen wie die DFG erwar- hang mit Forschungssoftware dient, wird dringend ten sollten, dass alle geförderte Software unter sol- empfohlen. chen Lizenzen nach dem Paradigma „public money, 3
public code“ veröffentlicht wird. Die Verwendung Fazit einer FSF- oder OSI-anerkannten FLOSS-Lizenz würde beispielsweise ein wirklich freies Modell • Implementierung von Förderprogrammen und ermöglichen und auch rechtliche Probleme redu- Anreizen zur nachhaltigen Unterstützung der zieren. Wenn Lizenzen wie Apache oder MIT verwen- Entwicklung und Pflege von Forschungssoftware det werden, können die Forschungseinrichtungen auf der Basis klarer und transparenter Kriterien. die Software später, wenn gewünscht, immer noch • Attraktive Karrierewege für Entwickler:innen von kommerzialisieren. Eine solche Open-Source-Lizen- Forschungssoftware. zierung ist auch für Start-ups von Vorteil, die beab- • Bereitstellung einer Infrastruktur, die nachhal- sichtigen, professionelle Dienstleistungen für die tige Softwareentwicklung ermöglicht, einschließ- Software anzubieten. lich Plattformen für Software-Entdeckung, Zu- Gerade vor dem Hintergrund des neuen DFG- sammenarbeit, Continuous-Integration, Testen, Kodex ist die Installation einer Forschungssoft- und langfristige Bewahrung. ware-Task-Force für alle (deutschen) Forschungs- • Etablierung einer landesweiten Institution ähn- einrichtungen/-gemeinschaften wichtig. Als Teil lich dem Software Sustainability Institute (SSI), ihrer Aufgaben sollte eine solche Gruppe eine lokale die Projektberatung und Code-Review-Dienst- Rechtsberatungsstelle und Bildungsangebote orga- leistungen sowie Schulungen zur nachhaltigen nisieren sowie (falls noch nicht implementiert) die Softwareentwicklung anbietet. Softwarerichtlinie der Einrichtung entwickeln. Mit • Nachhaltige Softwareentwicklungspraktiken als Hilfe von Onboarding-Prozessen, die von der For- integraler Bestandteil von Lehrplänen an Hoch- schungssoftware-Task-Force durchgeführt werden, schulen. sollten RSEs zum Beispiel in der Lage sein, die Klä- • Entscheidung der Forschungsförderer, ob das rung der Rechte von Anfang an so einfach wie mög- „public money, public code“-Paradigma ange- lich zu halten. Dies hilft zu vermeiden, dass – aus wendet werden soll, welches verlangt, dass alle Unsicherheit und Angst, einen rechtlichen Fehler zu öffentlich geförderte Software unter einer Free/ machen – einige Forschungsgruppen am Ende gar Libre Open Source Software (FLOSS)-Lizenz keine Lizenz wählen, was die Wiederverwendung öffentlich verfügbar sein muss. der Software massiv behindert. Wir schlagen vor, dass die lokalen Task-Forces ein Netzwerk mit den anderen forschenden Organisationen aufbauen, um Ideen auszutauschen, aber auch um eine Bottom- up-Strategie zur Organisation von RSE-Standards für Deutschland und darüber hinaus zu generie- ren und möglicherweise der Ursprung des oben er- wähnten Software-Nachhaltigkeitsinstituts zu sein. 4
Weiterführende Informationen Literatur Kontakt Anzt, H.; Bach, F.; Druskat, S.; Löffler, F.; Loewe, A.; Renard, Dr.-Ing. Axel Loewe Dr. Franziska Appel B. Y.; Seemann, G.; Struck, A.; Achhammer, E.; Aggarwal, P.; axel.loewe@kit.edu appel@iamo.de Appel, F.; Bader, M.; Brusch, L.; Busse, C.; Chourdakis, G.; Tel.: +49 721 608-42790 Tel.: +49 345 2928-117 Dabrowski, P. W.; Ebert, P.; Flemisch, B.; Friedl, S.; Fritzsch, B.; Funk, M. D.; Gast, V.; Goth, F.; Grad, J.-N.; Hegewald, J.; Karlsruhe Institute Leibniz-Institut für Hermann, S.; Hohmann, F.; Janosch, S.; Kutra, D.; Linx- of Technology (KIT) Agrarentwicklung in weiler, J.; Muth, T.; Peters-Kottig, W.; Rack, F.; Raters, F. H. Kaiserstraße 12 Transformations- C.; Rave, S.; Reina, G.; Reißig, M.; Ropinski, T.; Schaar- 76131 Karlsruhe ökonomien (IAMO) schmidt, J.; Seibold, H.; Thiele, J. P.; Uekermann, B.; Unger, www.ibt.kit.edu Theodor-Lieser-Straße 2 S.; Weeber, R. (2021): An environment for sustainable 06120 Halle (Saale) research software in Germany and beyond: Current state, www.iamo.de open challenges, and call for action. F1000Research 9;295. URL: https://doi.org/10.12688/f1000research.23224.2 (Stand: 30. Juli 2021). Printausgabe: ISSN 23 63-5770 de-RSE e.V. – Gesellschaft für Forschungssoftware (Society ISBN 978-3-95992-123-7 for Research Software): Research Software Engineers Online-Ausgabe: ISSN 23 63-5789 (RSEs) – verantwortlich für wissenschaftliche Software. ISBN 978-3-95992-124-4 URL: https://de-rse.org/de/ (Stand: 30. Juli 2021). Das IAMO wurde im Rahmen der DFG-Ausschreibung für nachhaltige Forschungssoftwareentwicklung mit dem Projekt „AgriPoliS2020 – Sustainability of the Research Software AgriPoliS“ gefördert. 5
Leibniz-Institut für Agrarentwicklung in strukturellen und technologischen Wandels. Darü Transformationsökonomien (IAMO) ber hinaus untersucht es die daraus resultierenden Auswirkungen auf den Agrar- und Ernährungssektor Das Leibniz-Institut für Agrarentwicklung in Trans- sowie die Lebensumstände der ländlichen Bevölke- formationsökonomien (IAMO) widmet sich der Ana- rung. Für deren Bewältigung werden Strategien und lyse von wirtschaftlichen, sozialen und politischen Optionen für Unternehmen, Agrarmärkte und Politik Veränderungsprozessen in der Agrar- und Ernäh- abgeleitet und analysiert. Seit seiner Gründung im rungswirtschaft sowie in den ländlichen Räumen. Jahr 1994 gehört das IAMO als außeruniversitäre For- Sein Untersuchungsgebiet erstreckt sich von der schungseinrichtung der Leibniz-Gemeinschaft an. sich erweiternden EU über die Transformationsre- gionen Mittel-, Ost- und Südosteuropas bis nach Zen- tral- und Ostasien. Das IAMO leistet dabei einen Bei- trag zum besseren Verständnis des institutionellen, 6
Sie können auch lesen