Policy Brief - IDW online

Die Seite wird erstellt Santiago König
 
WEITER LESEN
Leibniz-Institut für
Agrarentwicklung                                                                                 Nº 42
in Transformations-
ökonomien (IAMO)
www.iamo.de

                            Policy Brief
Ausgabe Nr. 42
August 2021               Forschungssoftware – Nachhaltige
                          Entwicklung und Unterstützung
                          Forschungssoftware ist zu einem zentralen Gut der akademischen
                          Forschung geworden. Sie ist oft das Rückgrat bestehender For-
Franziska Appel
                          schungsmethoden, ermöglicht neue Forschungsmethoden, im-
Axel Loewe                plementiert und bettet Forschungswissen ein und stellt selbst
                          ein wesentliches Forschungsprodukt dar. Forschungssoftware
                          muss nachhaltig sein, um bestehende Wissenschaft zu verste-
                          hen, zu replizieren, zu reproduzieren und darauf aufzubauen, um
                          neue Forschung effektiv durchzuführen. Daher ist eine Änderung
                          der Art und Weise erforderlich, wie die Entwicklung und Wartung
                          von Forschungssoftware derzeit motiviert, incentiviert, finan-
                          ziert, strukturell und infrastrukturell unterstützt und rechtlich
                          behandelt wird. Geschieht dies nicht, gefährdet dies die Qualität
                          und Validität der Forschung. Vor diesem Hintergrund trafen sich
                          im November 2019 mehr als 50 Wissenschaftler:innen aus ver-
                          schiedenen Institutionen zu einem DFG-Rundgespräch am Robert-
                          Koch-Institut, um Nachhaltigkeitsaspekte von Forschungssoft-
                          ware zu diskutieren und auf die Notwendigkeit von Förder-
                          instrumenten für die nachhaltige Entwicklung und Bereitstel-
                          lung von Forschungssoftware aufmerksam zu machen. Das
                          anschließend veröffentlichte Positionspapier (Anzt et al., 2021)
                          wendet sich gezielt an politische und akademische Entschei-
                          dungsträger, um das Bewusstsein für die Bedeutung und den
                          Bedarf einer nachhaltigen Forschungssoftwarepraxis zu schär-
                          fen. Insbesondere empfiehlt es Strategien und Maßnahmen, um
                          ein Umfeld für nachhaltige Forschungssoftware zu schaffen.

Das Rückgrat der Forschung des                         Projektfinanzierung weiter zu pflegen. Dies führt
21. Jahrhunderts: Aktueller Stand und                  zu einem höchst ineffizienten System, in dem je-
offene Herausforderungen                               des Jahr Millionen von Codezeilen erzeugt werden,
                                                       die nach dem Ende eines Projekts oder dem Aus-
Die computergestützte Analyse großer Daten-            laufen der Stelle des:der Entwickler:in nicht wieder-
sätze, computergestützte Simulationen und Soft-        verwendet werden.
waretechnologie im Allgemeinen spielen eine zen-          In Deutschland erkennen Fördereinrichtungen
trale Rolle für praktisch alle wissenschaftlichen      zunehmend die Bedeutung und den Wert nachhal-
Durchbrüche des 21. Jahrhunderts. Zur gleichen Zeit    tiger Forschungssoftware und damit verbundener
stützen sich Forschende oft auf Software, die haus-    Infrastrukturen an. Die Deutsche Forschungsge-
intern oder von Freiwilligen entwickelt wurde. Viele   meinschaft (DFG), die größte Fördereinrichtung für
dieser Softwareumgebungen können nicht auf-            Grundlagenforschung in Deutschland, hat zum Bei-
rechterhalten werden – oft, weil die Forschungs-       spiel Ausschreibungen für nachhaltige Forschungs-
software kein benanntes und primäres Ergebnis          softwareentwicklung und Qualitätsmanagement im
eines Forschungsprojekts war und daher im Proto-       Bereich Forschungssoftware eröffnet. Als weiteres
typ-Zustand verblieb oder wegen fehlender Anreize      Beispiel führt der Kodex „Leitlinien zur Sicherung
und Ressourcen die Software nach dem Ende der          guter wissenschaftlicher Praxis“ der DFG aus 2019

                                                                                                          1
Software nun explizit neben anderen Forschungs-            Wer ist dafür zuständig, Forschungs-
ergebnissen und -daten auf.                                software zu erhalten?
  Trotz dieser positiven Entwicklungen fehlen lei-
der immer noch Leitlinien und Konzepte für eine            Sowohl Förderorganisationen als auch Forschungs-
nachhaltige Entwicklung von Forschungssoft-                einrichtungen spielen wichtige Rollen für nachhal-
ware in Deutschland. Langfristige Förderstrategien         tige Forschungssoftware. Förderer sollten von den
fehlen ebenfalls. Die Schlussfolgerungen und Emp-          Antragstellenden Überlegungen verlangen, wie die
fehlungen des DFG-Rundgesprächs sind im Folgen-            in einem Projekt entwickelte Software über das
den in Anlehnung an Anzt et al. 2021 zusammen-             Ende des geförderten Projekts hinaus aufrechter-
gefasst.                                                   halten werden kann. Dies erfordert auch längerfris-
                                                           tige Förderbausteine für Softwarewartung, -pflege
                                                           und Nutzerunterstützung, die von Anfang an bean-
Wie wird entschieden, welche Software                      tragt werden können. Eine Weiterverfolgung die-
erhalten werden sollte?                                    ser Pläne während und nach der Projektlaufzeit,
                                                           d. h. ein dedizierter Software-Management-Plan,
Die dauerhafte Förderung aller bestehenden Soft-           ist entscheidend.
wareprojekte ist nicht nur unmöglich, sondern                 Entscheidungsträger:innen sollten die Defini-
würde auch das Risiko einer starken Zersplitte-            tion der Forschungswirkung über traditionelle wis-
rung der wissenschaftlichen Fach-Communities               senschaftliche Publikationen hinaus erweitern und
mit sich bringen und wäre letztendlich kontrapro-          auch andere wirkungsvolle Ergebnisse (wie Soft-
duktiv für die Effizienz der Forschungsgemein-             ware und Daten) einbeziehen, zum Beispiel bei der
schaft. Daher ist es wichtig, sich auf eine Liste trans-   Rekrutierung von akademischen Positionen. Diese
parenter Kriterien zu einigen, die ein Software-           Erweiterung der Basis für die Bewertung von For-
produkt für eine dauerhafte Förderung qualifizie-          schung und Forscher:innen wird explizit in der „San
ren. Eine solche Liste muss allgemein genug sein,          Francisco Vereinbarung über die Forschungsbewer-
um auf Forschungssoftware aus verschiedenen                tung“ (SF DORA) genannt, die viele deutsche und
Forschungsdisziplinen angewandt werden zu kön-             internationale Förderer und Forschungseinrichtun-
nen und gleichzeitig die Unterschiede zwischen den         gen jüngst unterzeichnet haben. Darüber hinaus
Bereichen respektieren.                                    sollten Forschungseinrichtungen attraktive lang-
   Hier konzentrieren wir uns auf die obligatorischen      fristige Karrieremöglichkeiten im akademischen
Kriterien, die domänenübergreifend erfüllt sein soll-      Umfeld schaffen, um den Gewinn von engagierten
ten. Weitere zusätzliche wünschenswerte Kriterien,         Forschungssoftwareentwickler:innen (Research
die je nach Anwendungsfall und domänenspezifi-             Software Engineers; RSE) als Schlüsselkonzept für
schen Anforderungen an die Softwareentwicklung             professionelle Forschungssoftware-Praktiken zu
in unterschiedlichem Maße umgesetzt werden kön-            nutzen.
nen, werden in Anzt et al. 2021 genannt.

1) Nutzung und Bedeutung                                   Wie kann Forschungssoftware nachhaltig
a) Verwendung über eine einzelne Forschungs-               finanziert werden?
   gruppe hinaus
b) Mindestens eine begutachtete wissenschaft-              Da die Finanzierung ein entscheidender Faktor für
   liche Veröffentlichung basierend auf der                die Nachhaltigkeit von Forschungssoftware ist,
   Software                                                müssen die bestehenden projektorientierten För-
c) Marktanalyse (Software ist wichtig für eine             derinstrumente auf lokaler, nationaler und inter-
   Nutzerbasis relevanter Größe und ist entweder           nationaler Ebene durch Förderinstrumente ergänzt
   einzigartig oder einer der Hauptakteure                 werden, die speziell auf die nachhaltige Pflege und
   in einem Bereich mit mehreren bestehenden               Bereitstellung von Forschungssoftware ausgerich-
   Lösungen)                                               tet sind. Zum Beispiel sollten Softwareprojekte,
d) Geeignete Schulungsunterlagen werden zur                die die oben genannten Nachhaltigkeitskriterien
   Verfügung gestellt                                      erfüllen, Zugang zu dauerhafter Förderung haben,
                                                           solange sie den Standards gerecht werden und wei-
2) Transparenz und Qualität                                terhin zentraler Bestandteil der Forschungsland-
a)   Öffentliche Verfügbarkeit des Quellcodes              schaft sind.
b)   Versionskontrollsystem                                   Rechenzentren für die Forschung müssen zweck-
c)   Lizenziert                                            gebundene Mittel für die Unterstützung nachhalti-
d)   Abhängigkeiten von Softwarebibliotheken               ger Softwareentwicklung erhalten. Diese Mittel sind
     und Technologien sind definiert                       notwendig, um Continuous-Integration-Systeme,
                                                           ein Hardwareportfolio für die Entwicklung, das Tes-
3) Reifegrad                                               ten und das Benchmarking von Software sowie Per-
a) Software-Management-Plan                                sonal für die Schulung von Domänenforscher:innen
b) Website mit klar definierter Anlaufstelle               im Softwaredesign und der richtigen Nutzung der
c) Gruppe von Entwickler:innen                             Dienste bereitzustellen.
                                                              Die Erstellung und Pflege von Schulungsmate-
                                                           rialien für die allgemeine Ausbildung im Bereich

                                                                                                            2
Software-Engineering in der Forschung sowie soft-      Forschungssoftware finden, veröffentlichen
ware-spezifische Dokumentation und die Erstellung      und archivieren
von Tutorials müssen in den Finanzierungsmöglich-      Ordnungsgemäße Software-Publikation und Mög-
keiten berücksichtigt werden. Dies kann entweder       lichkeiten für die Community, bestehende Soft-
dadurch geschehen, dass Module der Forschungs-         ware-Lösungen für ein bestimmtes Problem zu fin-
oder Softwareförderung dem Support und der             den, sind eine Voraussetzung, um Synergien optimal
Erstellung von Schulungsmaterial gewidmet werden       zu nutzen und redundante Entwicklungen zu ver-
oder durch die Schaffung von Förderprogrammen,         meiden. Das Auffinden erfordert die Veröffentli-
die sich auf die interdisziplinäre Softwareentwick-    chung an einem weltweit zugänglichen Ort mit ent-
lungsausbildung konzentrieren.                         sprechenden Metadaten, z. B. Citation File Format
                                                       (CFF). Umfassende Metadaten (z. B. Mitwirkende,
                                                       Kontakt, Schlagworte, verlinkte Publikationen, etc.)
Welche Infrastruktur wird für nachhaltige              und Publikationsplattformen können persistente
Forschungssoftware benötigt?                           Zitierbarkeit ermöglichen, was wiederum der For-
                                                       schungsevaluation zugutekommt. Insbesondere in
Projektmanagement Tools                                interdisziplinären Umgebungen empfiehlt sich die
Die Bereitstellung von Werkzeugen zur verteilten       Erstellung eines Meta-Index, der wichtige (diszip-
Softwareentwicklung und -verwaltung wird als           linäre) Software-Indizes abdeckt, um das Auffin-
zentrale Forschungsinfrastruktur empfohlen, um         den relevanter Software-Standorte zu erleichtern.
eine institutsübergreifende Zusammenarbeit zu er-         GitLab oder GitHub (gängige kollaborative
möglichen. Ein wichtiger Aspekt in diesem Zusam-       Arbeitsumgebungen) in Verbindung mit Reposito-
menhang ist die Katalogisierung von Forschungs-        rien wie Zenodo sind geeignete Publikationsplatt-
software, um doppelten Entwicklungsaufwand zu          formen, da letzteres DOIs prägt, Versionierung er-
reduzieren. Dies kann effizient realisiert werden,     laubt und für den langfristigen Zugriff öffentlich
indem die Registrierung aller Forschungssoftware       gefördert wird. Metadaten und Referenzen sind es-
mit einem eindeutigen Identifikator gefördert wird     sentiell für Tools wie PIDgraph, DataCite.org und
und ein Werkzeug entwickelt wird, das die Erkun-       CrossRef, die persistente Identifikatoren (PIDs)
dung der Forschungssoftwarelandschaft ermög-           wie DOIs verwenden. Für Deutschland ist davon
licht. Mitwirkende an Forschungssoftware sollten       auszugehen, dass die Nationale Forschungsdaten-
ihre ORCID iD nutzen, um eindeutig identifizierbar     infrastruktur (NFDI) Anstrengungen unternimmt, an
und referenzierbar zu sein.                            zentraler Stelle Discovery-Plattformen zu schaffen
                                                       oder zu unterstützen, die das Auffinden von Infor-
Entwicklerschulung, Motivation                         mationen erleichtern. Leider spielt Forschungs-
und Wissensaustausch                                   software in der NFDI noch nicht die zentrale Rolle,
Workshops und Seminare, die einen einfachen Zu-        die sie spielen sollte.
gang zu praktischem Training zu softwarebezo-             Die Veröffentlichung einer bestimmten Soft-
genen Fragen bieten, sollten gefördert und un-         wareversion als Referenz in Forschungsartikeln
terstützt werden. Eine aktuelle Initiative in diese    erfordert einfache Möglichkeiten, Forschungs-
Richtung sind die Helmholtz-HIFIS-Events. Die lang-    software langfristig zu archivieren. Die Veröffent-
fristige Lösung zur Erlangung ausreichender Soft-      lichung von Software, ihren Abhängigkeiten und
wareentwicklungskompetenzen sollte jedoch eine         ihrer Umgebung in Containern kann die Auswertung
Ausbildung sein, die früh in Hochschulcurricula ein-   und weitere Wiederverwendung erleichtern. Soft-
bezogen wird, idealerweise bereits auf Bachelor-       warekonservierung zielt darauf ab, die Lebensdauer
Ebene.                                                 von Software, die nicht mehr aktiv gepflegt wird, zu
   Vernetzung und Community-Building können            verlängern. Eine Lösung, um die Software in einem
zu einer dauerhaften Etablierung von nachhalti-        lauffähigen Zustand zu halten, indem ihr Kontext
ger Forschungssoftware führen. Software Car-           und ihre Laufzeitumgebung erhalten bleiben, ist die
pentry und ähnliche Initiativen wie die Gründung       Verwendung von Containern wie Docker. Eine wei-
der Data Science Academy HIDA in der Helmholtz-        tere Gefahr ist der Verlust von Projektrepositorien
Gemeinschaft helfen, Wissen auszutauschen und          auf globalen Plattformen wie GitHub oder BitBucket.
zu verbreiten. Lokale RSE-Gruppen und (inter-)         Hier ernten globale Plattformen wie Software Heri-
nationale Konferenzen werden die Gemeinschafts-        tage diese Repositorien und verhindern den Verlust
bildung weiter fördern. Forschungseinrichtungen        durch Langzeitarchivierung.
sowie Förderorganisationen sollten die Bildung sol-
cher Gruppen aktiv fördern und ideell sowie finan-
ziell unterstützen.                                    Rechtliche Aspekte
   Die Schaffung eines nationalen Software-Nach-
haltigkeitsinstituts (mit finanzierten Stellen zum     Eine wesentliche Frage im Hinblick auf Nachhaltig-
Aufbau von Services und zur Erstellung von Schu-       keit von Forschung betrifft die freie und offene Ver-
lungsmaterial) ähnlich dem britischen Software         breitung von Forschungssoftware und anderen For-
Sustainability Institute (SSI), das als nationaler     schungsergebnissen. Es sollte diskutiert werden, ob
Ansprechpartner für alle Aspekte im Zusammen-          Forschungsförderorganisationen wie die DFG erwar-
hang mit Forschungssoftware dient, wird dringend       ten sollten, dass alle geförderte Software unter sol-
empfohlen.                                             chen Lizenzen nach dem Paradigma „public money,

                                                                                                          3
public code“ veröffentlicht wird. Die Verwendung Fazit
einer FSF- oder OSI-anerkannten FLOSS-Lizenz
würde beispielsweise ein wirklich freies Modell • Implementierung von Förderprogrammen und
ermöglichen und auch rechtliche Probleme redu-          Anreizen zur nachhaltigen Unterstützung der
zieren. Wenn Lizenzen wie Apache oder MIT verwen-       Entwicklung und Pflege von Forschungssoftware
det werden, können die Forschungseinrichtungen          auf der Basis klarer und transparenter Kriterien.
die Software später, wenn gewünscht, immer noch • Attraktive Karrierewege für Entwickler:innen von
kommerzialisieren. Eine solche Open-Source-Lizen-       Forschungssoftware.
zierung ist auch für Start-ups von Vorteil, die beab- • Bereitstellung einer Infrastruktur, die nachhal-
sichtigen, professionelle Dienstleistungen für die      tige Softwareentwicklung ermöglicht, einschließ-
Software anzubieten.                                    lich Plattformen für Software-Entdeckung, Zu-
   Gerade vor dem Hintergrund des neuen DFG-            sammenarbeit, Continuous-Integration, Testen,
Kodex ist die Installation einer Forschungssoft-        und langfristige Bewahrung.
ware-Task-Force für alle (deutschen) Forschungs- • Etablierung einer landesweiten Institution ähn-
einrichtungen/-gemeinschaften wichtig. Als Teil         lich dem Software Sustainability Institute (SSI),
ihrer Aufgaben sollte eine solche Gruppe eine lokale    die Projektberatung und Code-Review-Dienst-
Rechtsberatungsstelle und Bildungsangebote orga-        leistungen sowie Schulungen zur nachhaltigen
nisieren sowie (falls noch nicht implementiert) die     Softwareentwicklung anbietet.
Softwarerichtlinie der Einrichtung entwickeln. Mit • Nachhaltige Softwareentwicklungspraktiken als
Hilfe von Onboarding-Prozessen, die von der For-        integraler Bestandteil von Lehrplänen an Hoch-
schungssoftware-Task-Force durchgeführt werden,         schulen.
sollten RSEs zum Beispiel in der Lage sein, die Klä- • Entscheidung der Forschungsförderer, ob das
rung der Rechte von Anfang an so einfach wie mög-      „public money, public code“-Paradigma ange-
lich zu halten. Dies hilft zu vermeiden, dass – aus     wendet werden soll, welches verlangt, dass alle
Unsicherheit und Angst, einen rechtlichen Fehler zu     öffentlich geförderte Software unter einer Free/
machen – einige Forschungsgruppen am Ende gar           Libre Open Source Software (FLOSS)-Lizenz
keine Lizenz wählen, was die Wiederverwendung           öffentlich verfügbar sein muss.
der Software massiv behindert. Wir schlagen vor,
dass die lokalen Task-Forces ein Netzwerk mit den
anderen forschenden Organisationen aufbauen, um
Ideen auszutauschen, aber auch um eine Bottom-
up-Strategie zur Organisation von RSE-Standards
für Deutschland und darüber hinaus zu generie-
ren und möglicherweise der Ursprung des oben er-
wähnten Software-Nachhaltigkeitsinstituts zu sein.

                                                                                                       4
Weiterführende Informationen
Literatur                                                          Kontakt
Anzt, H.; Bach, F.; Druskat, S.; Löffler, F.; Loewe, A.; Renard,   Dr.-Ing. Axel Loewe       Dr. Franziska Appel
B. Y.; Seemann, G.; Struck, A.; Achhammer, E.; Aggarwal, P.;       axel.loewe@kit.edu        appel@iamo.de
Appel, F.; Bader, M.; Brusch, L.; Busse, C.; Chourdakis, G.;       Tel.: +49 721 608-42790   Tel.: +49 345 2928-117
Dabrowski, P. W.; Ebert, P.; Flemisch, B.; Friedl, S.; Fritzsch,
B.; Funk, M. D.; Gast, V.; Goth, F.; Grad, J.-N.; Hegewald, J.;    Karlsruhe Institute       Leibniz-Institut für
Hermann, S.; Hohmann, F.; Janosch, S.; Kutra, D.; Linx-            of Technology (KIT)       Agrarentwicklung in
weiler, J.; Muth, T.; Peters-Kottig, W.; Rack, F.; Raters, F. H.   Kaiserstraße 12           Transformations-
C.; Rave, S.; Reina, G.; Reißig, M.; Ropinski, T.; Schaar-         76131 Karlsruhe           ökonomien (IAMO)
schmidt, J.; Seibold, H.; Thiele, J. P.; Uekermann, B.; Unger,     www.ibt.kit.edu           Theodor-Lieser-Straße 2
S.; Weeber, R. (2021): An environment for sustainable                                        06120 Halle (Saale)
research software in Germany and beyond: Current state,                                      www.iamo.de
open challenges, and call for action. F1000Research 9;295.
URL: https://doi.org/10.12688/f1000research.23224.2
(Stand: 30. Juli 2021).
                                                                                             Printausgabe: ISSN 23 63-5770
de-RSE e.V. – Gesellschaft für Forschungssoftware (Society                                   ISBN 978-3-95992-123-7
for Research Software): Research Software Engineers                                          Online-Ausgabe: ISSN 23 63-5789
(RSEs) – verantwortlich für wissenschaftliche Software.                                      ISBN 978-3-95992-124-4
URL: https://de-rse.org/de/ (Stand: 30. Juli 2021).

Das IAMO wurde im Rahmen der DFG-Ausschreibung für nachhaltige Forschungssoftwareentwicklung mit dem Projekt
„AgriPoliS2020 – Sustainability of the Research Software AgriPoliS“ gefördert.

                                                                                                                               5
Leibniz-Institut für Agrarentwicklung in                strukturellen und technologischen Wandels. Darü­
Transformationsökonomien (IAMO)                         ber hinaus untersucht es die daraus resultierenden
                                                        Auswirkungen auf den Agrar- und Ernährungssektor
Das Leibniz-Institut für Agrarentwicklung in Trans-     sowie die Lebensumstände der ländlichen Bevölke-
formationsökonomien (IAMO) widmet sich der Ana-         rung. Für deren Bewältigung werden Strategien und
lyse von wirtschaftlichen, sozialen und politischen     Optionen für Unternehmen, Agrarmärkte und Politik
Veränderungsprozessen in der Agrar- und Ernäh-          abgeleitet und analysiert. Seit seiner Gründung im
rungswirtschaft sowie in den ländlichen Räumen.         Jahr 1994 gehört das IAMO als außeruniver­sitäre For-
Sein Untersuchungsgebiet erstreckt sich von der         schungseinrichtung der Leibniz-Gemeinschaft an.
sich erweiternden EU über die Transformationsre-
gionen Mittel-, Ost- und Südosteuropas bis nach Zen-
tral- und Ostasien. Das IAMO leistet dabei einen Bei-
trag zum besseren Verständnis des institutionellen,

                                                                                                           6
Sie können auch lesen