MASTERSTUDIENGÄNGE "DATA SCIENCE"- AUF BASIS EINES BACHELORS IN (WIRTSCHAFTS-) INFORMATIK ODER MATHEMATIK - Gesellschaft ...

Die Seite wird erstellt Joel Giese
 
WEITER LESEN
MASTERSTUDIENGÄNGE "DATA SCIENCE"- AUF BASIS EINES BACHELORS IN (WIRTSCHAFTS-) INFORMATIK ODER MATHEMATIK - Gesellschaft ...
E M P F E H LU N G E N

 MASTERSTUDIENGÄNGE
„DATA SCIENCE” –
AUF BASIS EINES BACHELORS IN
(WIRTSCHAFTS-) INFORMATIK ODER MATHEMATIK

J U L I 2021
                                            © iStock: Pinkypills

WWW.GI.DE
MASTERSTUDIENGÄNGE "DATA SCIENCE"- AUF BASIS EINES BACHELORS IN (WIRTSCHAFTS-) INFORMATIK ODER MATHEMATIK - Gesellschaft ...
EMPFEHLUNGEN FÜR
 MASTERSTUDIENGÄNGE
„DATA SCIENCE“ –
AUF BASIS EINES BACHELORS
IN (WIRTSCHAFTS-) INFORMATIK
ODER MATHEMATIK

Empfehlungen der Gesellschaft für Informatik e.V.
erarbeitet von der Task Force „Data Science”

Die Empfehlungen wurden am 26. Juni 2021 vom Präsidium
der GI verabschiedet

An diesen Empfehlungen haben mitgewirkt:
Ziawasch Abedjan (Hannover), Thomas Bendig (Berlin),
Ulf Brefeld (Lüneburg), Joachim Bürkle (Frankfurt), Jörg Desel (Hagen),
Stefan Edlich (Berlin), Thomas Eppler (Albstadt-Sigmaringen),
Michael Goedicke (Duisburg-Essen), Nils Hachmeister (Bielefeld),
Jens Heidrich (Kaiserslautern), Stephan Höppner (Berlin),
Stefan M. Kast (Dortmund), Daniel Krupka (Berlin), Klaus Lang (Bingen),
Peter Liggesmeyer (Kaiserslautern), Julia Meisner (Berlin),
Ingo Scholtes (Wuppertal), Marina Tropmann-Frick (Hamburg)

Die Empfehlungen wurden von Jörg Desel koordiniert.

Entstanden in Zusammenarbeit mit der vom Bundesministerium
für Bildung und Forschung (BMBF) und acatech initiierten Plattform
Lernende Systeme
MASTERSTUDIENGÄNGE "DATA SCIENCE"- AUF BASIS EINES BACHELORS IN (WIRTSCHAFTS-) INFORMATIK ODER MATHEMATIK - Gesellschaft ...
INHALT

    Vorwort .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  4

1   Vorbemerkung .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  5

2   Anforderungen aus der Berufspraxis  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  6

3   Begriffliche Einordnung  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  . 7

4   Data-Science-Kompetenzen  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  8

5   Lehrinhalte aus Teildisziplinen .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  . 9
    5.1 Mathematik und Statistik  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  . 9
    5.2 Informatik und Programmierung .  .  .  .  .  .  .  .  .  .  .  .  .  . 10
    5.3 Data-Science-Methoden  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  . 11
    5.4 Interdisziplinäre Aspekte .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  . 12
    5.5 Anwendung von Data Science in der Domäne .  .  .  .  .  .  . 13

6   Curriculumsempfehlungen für Masterstudiengänge
    „Data Science“ .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  . 14
    6.1 Mathematik und Statistik  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  . 14
    6.2 Informatik und Programmierung .  .  .  .  .  .  .  .  .  .  .  .  .  . 15
    6.3 Data-Science-Methoden  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  . 15
    6.4 Interdisziplinäre Aspekte .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  . 15
    6.5 Anwendung von Data Science in der Domäne .  .  .  .  .  .  . 15
    6.6 Tabellarische Darstellung des Curriculums  .  .  .  .  .  .  .  . 16
    6.7 Abschließende Empfehlungen .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  . 16

    Literatur  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  . 17

    Autorenschaft .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  .  . 19
4

VORWORT

Daten bilden die Grundlage einer zunehmend digital
vernetzten Gesellschaft. In der Wirtschaft ist Data
Science der Schlüssel der digitalen Transformation.
Daten innovativ, verantwortungsvoll und gemein-
wohlorientiert zu nutzen, kann das Zusammenleben
in Deutschland, in Europa und in der Welt bedeutsam
verbessern und natürliche Ressourcen schützen [Bundes-
regierung2021]. Der Forschung an und mit Daten kommt
dabei eine zentrale Bedeutung zu – seien es Satelliten-
bilder als Datenquellen für Navigationssysteme oder       PETER LIGGESMEYER, MICHAEL GOEDICKE, JÖRG DESEL
für die Klimaforschung, Studiendaten zur Unterstützung
von Mediziner*innen bei der Diagnose oder Daten über
Konsument*innenverhalten zur Berechnung der indivi-       gelagerten Datenbestände von Wissenschaft und For-
duell passendsten Angebote. Die Menge der täglich neu     schung in Deutschland erschließen soll. Als übergreifen-
generierten Daten ist enorm, genau wie der potenzielle    des Forschungsdatenmanagement soll die NFDI Stan-
Nutzen für Wissenschaft, Forschung, Unternehmen und       dards im Datenmanagement setzen und Forschungsdaten
Verwaltung.                                               nachhaltig nutz- und weiterverwendbar machen.

Die Fähigkeit, diese Daten zu analysieren und nutzbar     Mit diesen curricularen Empfehlungen für Data-
zu machen, ist eine wichtige Voraussetzung, um wert-      Science-Masterstudiengänge aufbauend auf einem
volle Erkenntnisse in der Wissenschaft gewinnen und       Bachelor in der (Wirtschafts-) Informatik und der
nutzbringende Anwendungen für Gesellschaft, Staat und     Mathematik sollen Mindeststandards definiert werden
Wirtschaft generieren zu können. Der interdisziplinäre    und Empfehlungen für die Akkreditierung solcher
Forschungszweig Data Science, also das Management         Studiengänge vorgelegt werden.
und die Analyse von Daten, gilt daher schon heute als
eine der wichtigsten Schlüsseldisziplinen für Wissen-
schaft und Wirtschaft. Auch für die weitere Anwendung     PETER LIGGESMEYER
von Künstlicher Intelligenz (KI) und Lernenden Systemen   Past-Präsident der Gesellschaft für Informatik,
stellt die Verfügbarkeit von Daten und die Datenverwal-   Sprecher GI-Task Force „Data Science“
tung eine zentrale Voraussetzung dar.
                                                          MICHAEL GOEDICKE
Die Bundesregierung hat deshalb die Nationale For-        Vize-Präsident der Gesellschaft für Informatik,
schungsdateninfrastruktur (NFDI) auf den Weg gebracht,    Sprecher GI-Task Force „Data Science“
die die dezentral, projektförmig und/oder temporär
                                                           JÖRG DESEL
                                                           Sprecher GI-Fachbereich
                                                          „Informatik und Ausbildung / Didaktik der Informatik“
5

1 VORBEMERKUNG
Aufgrund der wachsenden Bedeutung von Daten, dem              Wir betrachten Data-Science-Masterstudiengänge
wissenschaftlich fundierten Umgang mit diesen (Data           (Persona A aus dem Arbeitspapier zu Lern- und Ausbil-
Science) und der großen Relevanz für die Informatik hat       dungsinhalten), die entweder auf einem Bachelorab-
der Vorstand der Gesellschaft für Informatik (GI) 2018 die   schluss Mathematik, Informatik, Wirtschaftsinformatik
Task Force „Data Science/Data Literacy“ ins Leben gerufen,    oder einem vergleichbaren Bachelor mit Kompetenzen in
die sich gemeinsam mit Partnern anderer Wissenschafts-        Mathematik, Statistik und Informatik aufbauen (wie z. B.
disziplinen aus den Natur- und Lebenswissenschaften das       die Bachelorstudiengänge der Statistik sowie der Bio-
Ziel gesetzt hat, Empfehlungen für die Entwicklung von        oder Geoinformatik). Streng konsekutive Data-Science-
Studien- und Weiterbildungsangeboten auszusprechen.           Studiengänge (Bachelor und Master) werden hier nicht
                                                              adressiert. Je nach vorliegender Vorqualifikation kann
Unter Beteiligung der Plattform Lernende Systeme wurde        auf entsprechenden Kompetenzen aufgebaut werden.
das Arbeitspapier „Data Science: Lern- und Ausbildungs-       Sollte ein Masterstudiengang „Data Science“ alternative
inhalte“ (Dezember 2019) erstellt, welches ein Set an         Zugangsmöglichkeiten haben, muss gewährleistet werden,
Lern- und Ausbildungsinhalten definiert und dieses in         dass die jeweils fehlenden Kompetenzen nachgeholt
14 Kompetenzfelder strukturiert [GI2019]. Darüber hinaus      werden.
wurden drei idealtypische Personas mit verschiedenen
Bildungs- bzw. Ausbildungszielen definiert: (A) Master in     Wir betrachten nicht explizit Bachelorstudiengänge „Data
Data Science, um später als Data Scientist in der In-         Science“, auch wenn diese partiell die hier vorgestellten
dustrie oder Forschung tätig zu sein, (B) Master in einer     Inhalte eines Masterstudiums „Data Science“ behandeln
Wissenschaft aus einer Anwendungsdomäne (z. B. Natur-         können. Da diese nicht auf den oben genannten Grundla-
wissenschaften), um Data-Science-Kompetenzen für die          gen aufbauen und zusätzliche Bachelor-typische Module
Domäne zu erwerben, und (C) Berufstätige mit informati-       zu überfachlichen Kompetenzen beinhalten, können
schen und mathematischen Kenntnissen, um Data-                grundsätzlich in den etwas längeren Bachelorstudiengän-
Science-Kompetenzen für die praktische Anwendung              gen (sechs oder sieben Semester) dieselben Inhaltsberei-
im Job zu erwerben.                                           che behandelt werden wie in den Masterstudiengängen –
                                                              allerdings in einer niedrigeren Durchdringung. Bei Mas-
Das Ziel dieser Publikation liegt darin, die Empfeh-          terstudiengängen sollte die Mehrzahl der Kompetenzen
lungen zu Lern- und Ausbildungsinhalten für Persona A         mit den Lernzielen „Anwenden“ und „Analysieren“ (nach
(Master in Data Science mit einem Bachelor in Informa-        der Anderson-Krathwohl-Taxonomie) vermittelt werden.
tik, Mathematik oder verwandten Studiengängen) weiter         Bei Bachelorstudiengängen reichen die Lernziele „Verste-
zu konkretisieren und Empfehlungen für ein Curriculum         hen“ und „Anwenden“ bei der Mehrzahl der Kompetenzen
für Data-Science-Studiengänge aus Sicht der Informatik        aus. Spätestens bei Seminaren oder der Abschlussarbeit
vorzulegen. Es soll als Diskussionsgrundlage dienen, um       unterscheiden sich Bachelor- und Masterstudiengänge
mit anderen beteiligten Fachdisziplinen abgestimmte           grundsätzlich.
ASIIN-Empfehlungen für die Akkreditierung solcher
Studiengänge zu erarbeiten.                                   Auch wenn wir keine konkreten Empfehlungen für die
                                                              Aufteilung von Lerninhalten zwischen Bachelor und
Für angenommene Vorqualifikationen aus Bachelor-              Master für konsekutive Studiengänge geben, können
studiengängen in Informatik und Wirtschaftsinformatik         Lerninhalte analog zur Betrachtung von Bachelorstudi-
werden die „Empfehlungen für Bachelor- und Master-            engängen in Data Science behandelt werden. Ein*e wie
programme im Studienfach Informatik an Hochschulen“           oben beschriebene*r Bachelorabsolvent*in bringt –
[GI2016] sowie die „Rahmenempfehlung für die Ausbil-          auf einer niedrigeren Ebene der kognitiven Durchdrin-
dung in Wirtschaftsinformatik an Hochschulen“ [GI2017]        gung – bereits die wesentlichen Kompetenzen mit, die im
herangezogen. Die aktuellen Fachspezifisch Ergänzenden        Masterstudium entsprechend vertieft werden können.
Hinweise (FEH) der ASIIN beziehen sich für Informatik         Wir empfehlen, entsprechende Vertiefungsmöglichkeiten
und Wirtschaftsinformatik auf dieselben Inhalte. Für          in allen im Arbeitspapier genannten Kompetenzbereichen
angenommene Vorqualifikationen aus Bachelorstudien-           vorzusehen.
gängen der Mathematik verwenden wir die ASIIN-FEH „Zur
Akkreditierung von Bachelor- und Masterstudiengängen
der Mathematik“ vom 09.12.2016 [ASIIN2016].
6

2 A NFORDERUNGEN AUS DER                                       Die Gründe des Fachkräftemangels, englisch auch ‚Data
                                                                Science Gap‘ 4 genannt, sind jedoch vielfältig, und dem-
  BERUFSPRAXIS                                                  entsprechend gestaltet sich seine Überwindung heraus-
                                                                forderungsreich:
Aufgrund veränderter Anforderungen in der Arbeitswelt
verlangen auch immer mehr Unternehmen, Verwaltungen             An erster Stelle zu nennen sind die hohen Anforderungen
und andere Organisationen Data-Science-Kompetenzen              an das Kompetenzprofil von Data Scientists (vgl.
von ihren Beschäftigten. Es gibt nicht nur eine große           Kapitel 4): Neben fundierten mathematischen und tech-
Nachfrage, sondern auch einen spürbaren Mangel an               nischen Kompetenzen fordern Unternehmen und Orga-
qualifizierten Data Scientists, die von vielen Unterneh-        nisationen zumeist domänenspezifische Expertise sowie
men und Organisationen händeringend gesucht werden.             eine gute Kenntnis wirtschaftlicher Zusammenhänge, um
In der jüngeren Vergangenheit ist hier ein großer Kampf         aus den Ergebnissen die richtigen Schlüsse zu ziehen und
um die besten Talente entbrannt.1                               sie gewinnbringend zu kommunizieren [Lübcke2018].
                                                                Auf mathematisch-technischer Ebene erstreckt sich die
Laut einer IDC-Studie ist der prozentuale Anteil der Data       Liste wichtiger Kompetenzfelder vom Zugriff, der Trans-
Scientists an der gesamten Beschäftigtenzahl zwischen           formation und Aufbereitung von Daten über den Umgang
2013 und 2019 lediglich von 3,0 % auf 3,7 % gestiegen.2 Der     mit großen Datenmengen und komplexen Datenstruk-
Bedarf an Fachkräften im Bereich Data Science wuchs in          turen, die Identifikation, Selektion und Gewichtung
diesem Zeitraum dagegen enorm. Der IDC-Studie zufolge           von Features im Bereich Data Engineering bis hin zur
konnten im Jahr 2019 in Deutschland über 100.000 Data-          Auswahl, Anpassung und Integration von Tools und von
Science-Stellen nicht besetzt werden. Für das Jahr 2025         Data-Science-Funktionen in das Software- bzw. Systems
werden 126.000 unbesetzte Arbeitsplätze vorausgesagt.           Engineering. Neben den für diese Fertigkeiten notwen-
                                                                digen Abschlüssen in Informatik oder Mathematik sollen
In den USA sieht die Situation sehr ähnlich aus: Seit           Data Scientists auch über Soft Skills wie Kommunikati-
2017 hat das US-Amerikanische Jobportal Glassdoor               onsstärke und Kreativität verfügen, wie eine Analyse des
Data Scientist als gefragtestes Berufsbild in den USA           Jobportals joblift ermittelte.5
identifiziert. Darüber hinaus hat das U.S. Bureau of
Labor Statistics festgestellt, dass die Nachfrage nach          Zwar weisen einige größere Unternehmen und Organi-
Data-Science-Fähigkeiten bis 2026 zu einem Anstieg der          sationen umfangreiche Data Labs auf, die differenzierte
Beschäftigung in diesem Bereich um 27,9 % führen wird.          Kompetenzprofile erlauben; zumeist wird vom Berufsbild
In den USA erwartet man folglich zwei bis vier Millionen        Data Scientist jedoch erwartet, von einem vertiefenden
neue Stellenausschreibungen im Bereich Data Science.            Verständnis von Datenbanken bis hin zur fachspezifi-
                                                                schen Datenvermittlung ein breites Kompetenzprofil
Die deutsche Universitäts- und Hochschullandschaft              vorhanden ist.6 Zum einen liegt dies an der noch relati-
reagiert auf diese Entwicklung. Über den Hochschulkom-          ven Neuheit der Profession selbst, wodurch sich Unter-
pass, ein Informationsportal der Hochschulrektorenkon-          nehmen und Organisationen in vielen Fällen erst Klarheit
ferenz, lassen sich 2021 über 200 Studiengänge ermitteln,       über ihre tatsächlichen Bedarfe schaffen müssen; es ist
die Data Science im Titel enthalten.3 2018 lag die Anzahl       zu erwarten, dass sich die berufspraktischen Anforderun-
an Bachelor- und Masterstudiengängen sowie verschie-            gen an Data Scientists zukünftig verfeinern [Lübcke2018].
dener Kontaktstudienangebote bzw. Zertifikatskurse für          Zum anderen ist die Ausbildung eines breiten Kompe-
Data Science noch bei rund 30, wie eine Bestandsauf-            tenzprofils aber insofern grundsätzlich sinnvoll, als das
nahme des Studienangebots für Data Science an den               Berufsbild Data Scientist aufgrund einer rasanten tech-
deutschen Hochschulen durch das Institut für Hochschul-         nologischen Entwicklungsgeschwindigkeit einer hohen
entwicklung ergab [Lübcke2018].                                 Änderungsdynamik unterliegt und sich die Schwerpunkte
                                                                in den Aufgaben und Fertigkeiten laufend verschieben
                                                                (vgl. Kapitel 3).

1	https://quanthub.com/data-scientist-shortage-2020/
   (27. Januar 2021).
                                                                4	https://towardsdatascience.com/
2	https://datalandscape.eu/study-reports/final-study-
                                                                   the-data-science-gap-5cc4e0d19ee3 (12. April 2021).
   report-european-data-market-monitoring-tool-key-facts-
   figures-first-policy (27. Januar 2021).                      5	https://joblift.de/Presse/data-scientist (04. Februar 2021).
3	Suchergebnisse für „Data Science” über:                      6	https://www.cio.de/a/was-ein-data-scientist-wirklich-
   https://www.hochschulkompass.de/home.html (10. Juni 2021).      koennen-muss,3577657 (04. Februar 2021).
7

3 BEGRIFFLICHE EINORDNUNG
Der Begriff ‚Data Science‘ wird in der Praxis häufig recht   Diese und andere parallele Entwicklungen ziehen wie-
schwammig verwendet und adressiert unterschiedliche          derum Veränderungen von Organisationsstrukturen und
Kompetenzfelder in verschiedener Tiefe. Weitestgehende       Berufsprofilen nach sich und können durch zukünftige
Einigkeit herrscht allerdings darüber, dass es bei Data      wissenschaftliche und technische Entwicklungen auch
Science in der Hochschullehre im Wesentlichen um die         noch gänzlich andere Verläufe nehmen.
Vermittlung von Fachwissen im Hinblick auf den Um-
gang mit Daten geht – insbesondere mit Big Data. Eine        Die Begrifflichkeiten und Herausforderungen rund um
von vielen Praktiker*innen genutzte Definition stammt        das Thema Data Science sind daher – getrieben von
von Drew Conway.7 Diese stellt Data Science als eine         Technik und Wissenschaft – im Fluss und werden es auf
domänenübergreifende Disziplin dar, die in der Schnitt-      absehbare Zeit bleiben [Hachmeister2021]. Eine zu enge
menge grundlegende informatische und mathematische           begriffliche Fassung bei der Konzeption von Studien-
Kenntnisse erfordert sowie Sachkenntnis in Bezug auf die     gängen läuft daher immer Gefahr von dieser Dynamik
Anwendungsdomäne.                                            überholt zu werden.

Neben Studiengängen mit dem Namen Data Science ka-           Aus diesen Gründen raten wir zur Verwendung eines
men in der letzten Zeit verwandte Studiengänge auf den       breiten Oberbegriffs als Titel entsprechender Studien-
Markt, die gewisse Anteile von Data Science besonders        gänge. Etwaige besondere Schwerpunkte in Richtung
vertiefen oder die Perspektive aus einer Disziplin beto-     einzelner Kompetenzfelder – auf dem Arbeitsmarkt wer-
nen und deshalb andere Namen tragen wie zum Beispiel         den die oben genannten und weitere Spezialisierungen
Data Engineering, Data Analytics oder Machine Learning.      ja durchaus nachgefragt – sollten über entsprechende
Dabei wird Data Science manchmal als übergeordneter          Vertiefungen in den Studiengängen kenntlich gemacht
und manchmal als untergeordneter Begriff verwendet.          werden. Weiterhin empfehlen wir den Titel „Data Science“
                                                             für Studiengänge, sofern dies inhaltlich weitgehend
Eine einheitliche Abgrenzung verschiedener Studien-          gerechtfertigt ist, da dieser a) im allgemeinen Sprachge-
felder im Bereich Data Science kann aber gegenwärtig         brauch ohnehin eine breite Verwendung findet und b) als
schon deshalb keinen Bestand haben, weil fortwährende        Oberbegriff eine große Strahlkraft bei Arbeitgeber*innen
technologische und wissenschaftliche Entwicklungen zu        und Studieninteressierten hat.8
einer ständigen Verschiebung von Schwerpunkten und
Aufgabenfeldern führen. Dies lässt sich beispielhaft an
dem mit Data Science verknüpften Berufsbild illustrieren.

So hat sich in den letzten Jahren das Verständnis für die
Bedeutung der Datenqualität, der Vermeidung syste-
matischer Verzerrungen (Bias), der Daten-Kuration und
der Anpassung von Modellen an sich verändernde Daten
vertieft. Entsprechend wurde die Notwendigkeit erkannt,
diesen Themen mehr Zeit und Arbeit zu widmen
[Sambasivan2021]. Gleichzeitig ist das Verständnis für
die Besonderheiten verschiedener Modelle gewachsen
und parallel nimmt die (Weiter-)Entwicklung von ein-
schlägigen ML-Toolboxen Data Scientists zunehmend
Komplexität und Arbeit ab, sodass in die eigentliche
Modellbildung heute deutlich weniger Zeit investiert
werden muss als noch vor einigen Jahren.

                                                             8	Dessen ungeachtet beziehen sich die vorliegenden
7	http://drewconway.com/zia/2013/3/26/                         Empfehlungen auch auf verwandte Studiengänge mit abwei-
   the-data-science-venn-diagram (15. März 2021).               chenden Namen bzw. können für diese angepasst werden.
8

4 DATA-SCIENCE-KOMPETENZEN

Absolvent*innen eines Masterstudiums „Data Science“           Anwendungsdomäne für Data Science und die in dieser
müssen den Data Science Lifecycle (z. B. nach CRISP-DM -      Domäne relevanten Fragestellungen sowie wichtige Ak-
Business Understanding, Data Understanding, Data Pre-         teur*innen kennen und in der Lage sein, die spezifischen
paration, Modeling, Evaluation, Deployment9 - oder nach       Charakteristika der Daten in der entsprechenden Domäne
der Data-Science-Prozesskette der Plattform Lernende          zu beurteilen. Die Ebene des Domänenwissens beinhaltet
Systeme [LernendeSysteme2020]) eines Data-Science-            auch, die Rahmenbedingungen der eigenen Domäne von
Projekts vollständig und selbständig bewältigen. Das be-      jeweils anderen unterscheiden zu können und fähig zu
inhaltet, dass sie die für die einzelnen Schritte notwendi-   sein, sich in andere Domänen einzuarbeiten. Data Scien-
gen Werkzeuge und Methoden hinsichtlich ihrer Eignung         tists müssen auch imstande sein, das für verschiedene
bewerten, aussuchen und einsetzen sowie auf eine über-        Anwendungsdomänen relevante Verständnis der Daten
greifende Werkzeugunterstützung zurückgreifen können.         zu entwickeln und die Qualität sowie die Ergebnisse von
                                                              Auswertungen der Daten (statistisch) interpretieren zu
Hierfür ist eine Vielzahl unterschiedlicher Kompetenzen       können. Nur so können Data Scientists den letzten Schritt
erforderlich:                                                 des Data Science Lifecycles beherrschen: die disziplin-
Auf mathematisch-technischer Ebene müssen die                 übergreifende und zielgruppengerechte Kommunikation
mathematischen und algorithmischen Grundlagen aller           der generierten Ergebnisse.
Schritte des Data Science Lifecycles nachvollzogen
werden können, was die Beherrschung von mindestens            Im Rahmen der Arbeit innerhalb von Unternehmen und
einer für Data Science relevanten Programmiersprache          Organisationen müssen Absolvent*innen schließlich zum
(z. B. Python, R, Julia, Matlab, Octave) und Grundkenntnis-   einen die Rolle von Data-Science-Anwendungen in diesen
se in der Softwareentwicklung und dem Datenmanage-            Unternehmen und Organisationen beurteilen können,
ment voraussetzt.                                             zum anderen die ethischen und juristischen Aspekte von
                                                              Data-Science-Projekten kennen und ihr eigenes Handeln
Da Data Science ein anwendungsbezogenes Fach ist,             danach ausrichten. Und natürlich sollte ein Data Scientist
welches das Ziel hat, handlungsfähige Ergebnisse zu           in allen genannten Punkten stets interessiert daran sein,
Fragestellungen einer bestimmten Branche zu generieren,       Entwicklungen zu erkennen, zu verstehen und das eigene
müssen Absolvent*innen darüber hinaus wenigstens eine         Kompetenzportfolio entsprechend zu erweitern.

9	https://www.ibm.com/docs/de/spss-modeler/
   SaaS?topic=dm-crisp-help-overview (21. Juni 2021).
9

5 LEHRINHALTE AUS
  TEILDISZIPLINEN
Es geht hier nicht darum, was in einem Masterprogramm       Analysis
Data Science gelehrt werden soll, sondern um die Inhalte,   Aus der Data-Science-Perspektive ist die Analysis ein
die zusammen mit einem zugrundeliegenden Bachelor-          weiterer unverzichtbarer Zweig der Mathematik. Zentrale
programm gelehrt werden sollen. In Kapitel 6 schlagen       Fragen der Analysis drehen sich um Funktionen: Wie kann
wir vor, wie ein Masterprogramm strukturiert sein kann,     das Änderungsverhalten einer Funktion erfasst, verstan-
das auf unterschiedlichen konkreten Bachelorprogram-        den, beschrieben und vorhergesagt werden. Benötigte
men aufbaut. Der Bezug zu anderen Studiengängen und         Kenntnisse umfassen u. a. Mengen und Zahlen, reellwerti-
die Angaben von Leistungspunkten (LP) sollen lediglich      ge Funktionen, Grenz- und Extremwerte und Reihen sowie
ein Indikator für den Grad der Vertiefung darstellen. Es    Stetigkeit und Differenzierbarkeit.
ist in verschiedenen Kombinationen möglich, Kompeten-       Empfohlener Umfang: 2,5 LP
zen gleichzeitig in mehreren Bereichen zu erwerben (zum
Beispiel bei einer Kombination der Lehrinhalte ‚Algorith-   Stochastik
men‘ und ‚Data-Science-Methoden‘), sodass die Summe         Die Stochastik bildet einen mathematischen Rahmen
der LP auf diese Weise reduziert werden kann.               für den Umgang mit Unsicherheiten und unsicheren
                                                            Aussagen. Sie vereint die Gebiete der Wahrscheinlich-
                                                            keitsrechnung, der Kombinatorik und der mathemati-
5.1 MATHEMATIK UND STATISTIK10                              schen Statistik. Statistik und Wahrscheinlichkeitstheorie
Die Bewältigung der Komplexität von Data Science-Auf-       sind grundlegende Komponenten der Datenanalyse und
gaben erfordert Kenntnisse aus mehreren Gebieten der        bilden einen wesentlichen Teil der Kompetenzen und
Mathematik und Informatik. Es ist von enormer Bedeu-        Kenntnisse in der Data Science. Dieser Bereich soll den
tung, neben anderen Disziplinen generelle mathemati-        Studierenden einen Einblick in die wichtigsten Statistik-
sche Konzepte zu beherrschen, die für viele Methoden        und Data-Analytics-Paradigmen und -Denkschulen bieten.
aus dem Data-Science-Bereich eine Grundlage bilden.         Sie können separat oder als Teil anderer Data-Ana-
Des Weiteren kommt es auf die analytische Denkweise         lytics-bezogener Module oder Kurse unterrichtet werden.
und das Abstraktionsvermögen an – Eigenschaften, die        Zentrale Konzepte sind hier bspw. nichtparametrische,
mit dem Studium mathematischer Konzepte vermittelt          multivariate, hochdimensionale und bayesianische Ver-
werden.                                                     fahren, High-Dimensional Probability, Applied Probability,
                                                            Zufallsmatrix-Theorie sowie Markow-Prozesse.
Lineare Algebra                                             Empfohlener Umfang: 5 LP
Lineare Algebra gehört zur unverzichtbaren Basis der
mathematischen Grundausbildung. Angefangen mit              Angewandte Statistik
Lösungen linearer Gleichungssysteme bis zu den linearen     Eine wesentliche Aufgabe der Statistik ist es, Daten zu
Abbildungen ist dieser Zweig der Mathematik eine Grund-     beschreiben und Erkenntnisse für die Entscheidungsfin-
voraussetzung für das Verständnis und die Arbeit mit        dung in geeigneter Weise aufzuarbeiten und darzustellen.
vielen Machine-Learning-Algorithmen. Themen, die durch      Zu den für Data Science relevanten Inhalten gehören u. a.
lineare Algebra abgedeckt werden, umfassen u. a. Vek-       die beschreibende/deskriptive Statistik, die Konfidenz-
toren, Matrizen und Tensoren, lineare Abhängigkeit und      und Faktorenanalyse sowie die Anwendung mathemati-
Determinanten, Eigenwerte und Singulärwertzerlegung.        scher Methoden der schließenden/induktiven Statistik,
Empfohlener Umfang: 5 LP                                    die es erlauben Hypothesen zu testen und Parameter zu
                                                            schätzen.
Optimierung und Simulation                                  Empfohlener Umfang: 5 LP
Inhalte zur Linearen Optimierung werden oft mit Linearer
Algebra kombiniert, zur Nichtlinearen Optimierung oft
mit Diskreter Mathematik oder mit Numerik.
Empfohlener Umfang: 2,5 LP

10	Dieses Kapitel adressiert die Kompetenzfelder 1 und 2
    aus [GI2019].
10

5.2 INFORMATIK UND PROGRAMMIERUNG11
Um Data-Science-Methoden anwenden und dazugehö-                   nagement, Architektur und Entwurf, Qualitätssicherung
rende Systeme entwickeln und erstellen zu können, sind            (Verifikation und Validation), Software-Projektmanage-
neben mathematischen Kompetenzen auch Informa-                    ment und Software-Entwicklungsprozesse.
tik- und Programmierkenntnisse wichtig. Informatik- und           Empfohlener Umfang: 5 LP
Programmiermethoden sind im Data Science Lifecycle auf
jeder Stufe in unterschiedlicher Granularität von Bedeu-          Datenbanken und Big Data
tung. Programmier- und Datenbankkenntnisse als auch               Datenintensive Anwendungen aus dem Data-Science-
Software-Engineering-Methoden sind in der Design&-                Bereich bauen auf Datenverarbeitungsketten (Data
Build-Phase notwendig, während IT-Infrastrukturen vor             Pipelines) auf. Data Scientists benötigen Verständnis
allem in der Release- und der Integrate-Phase gefragt             und Anwendungswissen der Funktionsweise relevan-
sind.                                                             ter Algorithmen und Datenstrukturen zur Aufbereitung,
                                                                  Speicherung und Verarbeitung großer, heterogener und
Grundlagen Programmierung                                         dynamischer Datenbestände, u. a. verteilt und in Echtzeit.
Data Scientists müssen die grundlegenden Program-                 Außerdem wird ein sicherer Umgang mit unterschied-
miermethoden und -verfahren kennen und souverän                   lichen Datenquellen vorausgesetzt (z. B. Datenbanken,
anwenden können. Dazu gehören Konzepte imperativer                Repositories, Data Warehousing, NoSQL-Komponenten).
Programmiersprachen, deren Anwendung zur Program-                 Empfohlener Umfang: 5 LP
merstellung sowie Qualitätssicherungsverfahren zur
Sicherstellung einer hohen Programmgüte.                          Data Governance und IT-Sicherheit
Empfohlener Umfang: 5 LP                                          Um die Qualität, den Schutz und die Sicherheit der Daten
                                                                  gewährleisten zu können und für die Einhaltung rechtli-
Fortgeschrittene Programmierung                                   cher Vorgaben zu sorgen, werden Data Governance- und
Während Programmiergrundlagen unabhängig von spe-                 Data Policy-Verfahren verwendet. Wichtige Aspekte sind
ziellen Data-Science-Programmiersprachen und -bib-                Fragen von Sicherheit, Schutz, Zuverlässigkeit, Integrität,
liotheken die Basis für die Programmentwicklung legen,            Vertraulichkeit und Verfügbarkeit der genutzten IT-
benötigen Data Scientists weitergehende Fähigkeiten, um           Systeme und der Daten. Dies umfasst die Spezifikation
Data-Science-Methoden anwenden und Programme für                  der Anwendungsanforderungen, den Entwurf und die
die Datenanalyse entwickeln zu können. Dazu zählen Pro-           Analyse von Verfahren zur Lösung der gestellten Aufga-
grammiersprachen, z. B. Python, R oder Julia, aber auch           ben, die Entwicklung von Datenstrukturen und Algorith-
spezielle Bibliotheken für konventionelle Programmier-            men, deren Implementierung in Software und Hardware
sprachen. Die Anwendung von Data-Science-Bibliotheken             und den Nachweis dafür, dass das so konstruierte System
erfordert zudem weitergehende Programmierkonzepte,                die gestellten Anforderungen erfüllt.
z.B. aus objektorientierter oder funktionaler Programmie-         Empfohlener Umfang: 5 LP
rung sowie Parallelisierung.
Empfohlener Umfang: 2,5 LP                                        Algorithmen und Komplexität
                                                                  Die Komplexität eines Algorithmus beschreibt das
IT-Infrastrukturen                                                Laufzeitverhalten und den Speicherbedarf bei Eingaben
Für die Operationalisierung des Data-Science-Lebenszy-            wachsender Größe. Die Komplexitätsanalyse und der
klus sind Fähigkeiten im Umgang mit IT-Infrastrukturen            Entwurf möglichst effizienter Algorithmen zusammen mit
erforderlich. Dazu gehören das Container-Management               geeigneten Datenstrukturen gehören zu den Grundbau-
und Cloud Computing genauso wie Virtualisierung und               steinen jedes Informatikstudiums. Die Verarbeitung sehr
Streaming.                                                        großer Datenmengen in Data-Science-Projekten ist nur
Empfohlener Umfang: 2,5 LP                                        mit effizienten Algorithmen möglich. Data Scientists müs-
                                                                  sen daher die Komplexität der von ihnen verwendeten
Software Engineering                                              Algorithmen einschätzen können sowie Konzepte für den
Die Entwicklung und Erstellung von Data-Science-Lösun-            Entwurf effizienter Algorithmen beherrschen, besonders
gen erfordert Konzepte für die ingenieurmäßige Entwick-           im Bereich Machine Learning.
lung softwarebasierter Systeme wie Anforderungsma                 Empfohlener Umfang: 5 LP

11	Dieses Kapitel adressiert die Kompetenzfelder 3, 4, 5 und 7
    aus [GI2019].
11

5.3 DATA-SCIENCE-METHODEN 12
Viele im Bereich Data Science verwendete Methoden sind           Data Mining
nicht spezifisch für diesen Anwendungsbereich entstan-           Dieser Bereich soll die Studierenden mit den wichtigsten
den und können daher auch in anderen Bereichen (oft              Data-Mining-Algorithmen und verwandten Methoden der
Statistik) vorkommen. Data Scientists müssen aber ein            Wissensextraktion, Wissensrepräsentation und Argu-
tiefes Verständnis und Anwendungskompetenzen der                 mentation vertraut machen. Es werden mathematische
Methoden haben, wie sie im sog. Data Science Lifecycle           Modelle und Algorithmen behandelt, die auf große
vorkommen.                                                       Datenmengen angewendet werden können. Zu den
                                                                 Methoden gehören Prozesse für Häufigkeits- und Asso-
Deshalb werden diese Methoden hier als Kerngebiet des            ziationsanalysen (Rule Mining), Knowledge Discovery in
Data-Science-Studiums aufgeführt. Der Data Science               Databases (KDD), Information Retrieval, Text-, Web- und
Lifecycle wird in unterschiedlichen Formen veröffentlicht,       Process-Mining, Zeitreihenanalyse und das entsprechen-
seine Schritte haben immer wieder unterschiedliche Na-           de Reporting.
men und beruhen auf verschiedenen Methoden, die wir              Empfohlener Umfang: 5 LP
im Folgenden teilweise nebeneinander aufführen. Neben
den einzelnen Kompetenzbereichen ist die Verwendung              Maschinelles Lernen
der Methoden im Data Science Lifecycle ein wesentlicher          Den Data Scientists steht eine große Auswahl an fertigen
Lehrinhalt, der aber nicht gesondert aufgeführt wird.            Bibliotheken für Maschinelles Lernen zur Verfügung. Den-
Zu allen Methoden sind neben dem Verständnis der                 noch muss das Studium über die einfache Anwendung
Grundlagen die Kenntnis von und der Umgang mit ent-              von Algorithmen hinausgehen. Neue Probleme, mit denen
sprechenden Werkzeugen – auch im Zusammenspiel der               Studierende konfrontiert sind, erfordern oftmals ein
Methoden – notwendige Kompetenzen.                               tiefes Verständnis der theoretischen Grundlagen sowohl
                                                                 einfacher als auch fortgeschrittener Algorithmen. Diese
Datenintegration und Datenqualität                               Kompetenzen decken die Verwendung, die Analyse, den
Für die Datenintegration werden Daten aus verschiede-            Entwurf und die Anpassung von Algorithmen für Maschi-
nen Quellen gesammelt und in unterschiedlichen Forma-            nelles Lernen ab. Es werden wichtige Fragestellungen zur
ten miteinander verbunden, aufbereitet und integriert.           Behandlung und Modellierung von Daten und zur Defi-
Zur Anwendung kommen Methoden und Werkzeuge wie                  nition von Zielfunktionen sowie Optimierungsstrategien
Data Pipelines, ETL-Werkzeuge (Extrahieren/Transformie-          behandelt. Aspekte, die hier eine Rolle spielen, sind Infe-
ren/Laden), Data-Cleaning-Algorithmen, Matching-Regeln           renzmethoden, probabilistische und statistische Modelle/
und skalierbare Data-Preparation- sowie Feature-En-              Konzepte, Regressionsmodelle und Machine-Learning-
gineering-Verfahren.Weiterhin ist es erforderlich, dass          Anwendungen (wie Natural Language Processing) sowie
für die weiteren Schritte des Data Science Lifecycles die        einschlägige Programmiersprachen (z. B. Python, R, Julia)
Qualität der Daten validiert wird. Dies setzt den Umgang         und Bibliotheken (z. B. SciKitLearn, Dask).
mit fehlenden, fehlerhaften und verzerrten Daten voraus.         Empfohlener Umfang: 10 LP
Empfohlener Umfang: 5 LP
                                                                 Deep Learning und weitere KI-Methoden
Datenvisualisierung und Explorative Datenanalyse                 Deep Learning setzt Neuronale Netze mit mehreren
Sowohl die Anwendung von Visualisierungswerkzeugen               Schichten (Deep Neural Networks) ein, z. B. zur Bilder-
als auch die theoretischen Grundlagen wie Perception             kennung oder zum Natural Language Processing. Ausge-
Theory und Editorial Thinking werden hier vermittelt.            bildete Data Scientists kennen sich mit verschiedenen
Weiterhin werden auch Bezüge zu den Bereichen der                Deep-Learning-Netzen und -Architekturen aus. Gefordert
Computergrafik hinsichtlich Overlays, Interaktivität und         werden neben der Beherrschung von Deep Learning auch
Annotationen hergestellt. Explorative Analysemethoden            Kenntnisse weiterer Methoden der Künstlichen Intelli-
und Methoden der multivariaten Datenvisualisierung               genz wie dem Reinforcement Learning und generativer
gehören ebenfalls zum Modulinhalt.                               Modelle.
Empfohlener Umfang: 2,5 LP                                       Empfohlener Umfang: 5 LP

12	Dieses Kapitel adressiert die Kompetenzfelder 8, 9, 10, 11
    und 12 aus [GI2019].
12

5.4 INTERDISZIPLINÄRE ASPEKTE 13
Zentrales Wesensmerkmal der Data Science ist ihre In-            diskutiert. Aspekte, die im Rahmen eines Studiums
terdisziplinarität. Durch die zunehmende Digitalisierung         vermittelt werden sollen, sind ein entsprechendes Pro-
und Datafizierung [Filipovic2015] aller Wirtschafts- und         blembewusstsein, die Bedeutung der Erklärbarkeit von
Lebensbereiche und der damit einhergehenden wissen-              Modellen, die Auswirkung von Verzerrungen in Trainings-
schaftlichen Auseinandersetzung mit diesen Entwick-              daten, eine Technikfolgenabschätzung oder Algorith-
lungen und Phänomenen werden große Datenmengen                   mic-Accountability-Kriterien wie Fairness, Trustworthiness
erfasst, ausgewertet und für spezifische Zwecke nutzbar          etc. [AIHLEG2019].
gemacht. Der wissenschaftliche und ökonomische Um-               Empfohlener Umfang: 5 LP
gang mit Daten erfolgt also nicht im „luftleeren“ Raum,
sondern immer in bestimmten Anwendungskontexten.                 Data Privacy und weitere juristische Aspekte
Welchen Wert Daten und welche sozialen Konsequenzen              Um Datenmissbrauch zu verhindern, müssen Data Scien-
die Ergebnisse von Data-Science-Projekten entwickeln,            tists mit den wichtigsten Datenrechten und -pflichten
wird maßgeblich durch den jeweiligen Kontext ihrer               vertraut sein [BMI2019]. Dafür muss mindestens eine
Nutzung bestimmt. Dadurch können Daten, die für einen            vertiefende Auseinandersetzung mit dem nationalen und
bestimmten Zweck erhoben und verarbeitet wurden, in              internationalen Datenschutzrecht erfolgen, die Spezifika
einem anderen Anwendungsfall eine ganz andere, teils             personenbezogener bzw. nichtpersonenbezogener Daten,
missbräuchliche und schädliche Wirkung entfalten                 unterschiedliche Datenlizenzen bzw. Nutzungsbestim-
[BMI2019].                                                       mungen sowie Aspekte der Data Compliance bekannt sein
                                                                 und entsprechende Handlungskompetenzen erworben
Das Ziel einer verantwortungsvollen Datennutzung                 werden.
[Bundesregierung2021] macht vor diesem Hintergrund               Empfohlener Umfang: 2,5 LP
nicht nur die Aneignung domänenspezifischen Wissens
(vgl. Kapitel 5.5) unabdingbar, sondern erfordert auch           Projektmanagement, Soft Skills, interdisziplinäre
die fundierte Kenntnis interdisziplinärer Aspekte wie            Kommunikation
Datenethtik oder Data Privacy. So können Data Scientists         Als Teil von Organisationen müssen Data Scientists fähig
einerseits dem Anspruch gerecht werden, die Ergeb-               sein, Projekte planen, durchführen und evaluieren zu
nisse sowie den Nutzen ihrer Arbeit effektiv innerhalb           können. Der Nutzen von Data Science sowie die Vorteile
eines ökonomischen oder wissenschaftlichen Umfeldes              und Risiken der generierten Ergebnisse müssen für den
zu kommunizieren und sich andererseits ihrer gesell-             jeweiligen Anwendungskontext erkannt und interdiszip-
schaftlichen Verantwortung in der Verarbeitung sensibler         linär verständlich kommuniziert werden. Sinnvoll dafür
Daten und in der Bereitstellung von Ergebnissen mit teils        ist die Vermittlung von Kenntnissen aus den Bereichen
beträchtlichen sozialen Folgen bewusst zu sein und ent-          Projektmanagement, Marketing und Kommunikation.
sprechend zu handeln.                                            Empfohlener Umfang: 2,5 LP

Datenethik                                                       Datenökomomie
Data Scientists müssen von der Datenherkunft bis hin zur         Data Scientists müssen die ökonomischen Mechanismen
Verwertung der Ergebnisse in der Lage sein, den gesam-           und Zielsetzungen kennen, die die Sammlung und Ana-
ten Lebenszyklus aus ethischer Perspektive zu hinter-            lyse von Daten antreiben. Dabei geht es nicht nur darum,
fragen. Untersucht werden sollen u. a., ob in den ausge-         neue digitale Wertschöpfungsmodelle und Wertschöp-
wählten Datensätzen systematische Verzerrungen (Bias)            fungspotenziale von Daten erkennen und ausschöpfen
vorliegen, beispielsweise bestimmte Personengruppen              zu können. Es sollte auch ein kritisches Bewusstsein für
unter- oder überrepräsentiert sind oder unzulässig               die Marktakteur*innen und Machtverhältnisse in der
diskriminiert werden [BMI2019]. Zudem werden die Rolle           Datenökonomie und deren gesellschaftlichen Einfluss
der Algorithmen bei der Verschärfung der vorliegenden            gefördert werden.
Verzerrungen und vorgeschlagene Lösungsansätze                   Empfohlener Umfang: 2,5 LP

13 Dieses Kapitel adressiert das Kompetenzfeld 6 aus [GI2019].
13

5.5 ANWENDUNG VON DATA SCIENCE IN DER
DOMÄNE 14
Data Science ist ein anwendungsbezogenes Fach. Der                Data Scientists sind oft keine Expert*innen in einer
Anwendungskontext von Data Science differiert in den              Domäne, sondern müssen die Vielfältigkeit der Frage-
verschiedenen Anwendungsdomänen erheblich. Data                   stellungen und der Rahmenbedingungen in unterschied-
Scientists müssen in der Lage sein, selbstständig ein             lichen Domänen kennen und in der Lage sein, sich
Verständnis für die relevanten Fragestellungen innerhalb          selbstständig in eine neue Domäne einzuarbeiten. Dazu
einer Anwendungsdomäne zu gewinnen, die Möglichkei-               muss ein Domänenprojekt innerhalb des Data-Science-
ten der Gewinnung von Daten und die Bewertung ihrer               Studiums durchgeführt werden. Das Projekt kann auch
Qualität zu eruieren, ein mögliches Vorgehen juristisch,          als Vorstufe für die Masterarbeit verwendet werden. Im
ethisch und ökonomisch zu beurteilen, ein Data-Science-           Projekt werden Fragestellungen aus der Domäne gemein-
basiertes Projekt selbstständig und unter Verwendung              sam mit einschlägigen Expert*innen unter Verwendung
der geeigneten Methoden durchzuführen und die Ergeb-              von Data-Science-Werkzeugen bearbeitet.
nisse adressatengerecht zu präsentieren. Dazu ist die
selbstständige praktische Durchführung eines Projekts             Interdisziplinäre Data Labs, in denen unter Anleitung und
dieser Art im Studium in wenigstens einer Fachdomäne              selbstständig an konkreten Beispielprojekten gearbeitet
im Team mit Domänenexpert*innen erforderlich. In einer            wird, eignen sich zur agilen Adaption an methodische
wissenschaftlichen Domäne spielt das jeweilige For-               Entwicklungen, die teilweise schneller verlaufen, als uni-
schungsdatenmanagement eine wichtige Rolle.                       versitäre Curricula geändert werden können.
                                                                  Empfohlener Umfang: min. 15 LP

14	Dieses Kapitel adressiert die Kompetenzfelder 13 und 14 aus
    [GI2019].
14

6 CURRICULUMSEMPFEHLUNGEN                                   diese hinausgehen, sodass der individuelle Aufwand zur
                                                             Bearbeitung der Module vom Vorwissen abhängt. Auf den
   FÜR MASTERSTUDIENGÄNGE                                    durchschnittlichen individuellen Workload hat dies nur
 „DATA SCIENCE“                                              geringe Auswirkungen. Je nach Vorstudium stehen Modu-
                                                             len mit höherem Bearbeitungsaufwand andere Module
In den hier betrachteten Empfehlungen für Masterstudi-       gegenüber, deren Bearbeitungsaufwand aufgrund der
engänge „Data Science“ wird ein Teil der erforderlichen      Vorkenntnisse reduziert ist.
Kompetenzen in einem Bachelorstudiengang erworben,
dessen erfolgreicher Abschluss Zugangsvoraussetzung für      Im Folgenden wird für die Bachelorstudiengänge Ma-
das Masterprogramm ist. Je nach gewählten Zugangsvor-        thematik und Informatik dargestellt, welche der im
aussetzungen gestalten sich daher die Curricula für Mas-     vorhergehenden Abschnitt beschriebenen Kompeten-
terstudiengänge „Data Science“ unterschiedlich. Abhän-       zen dem Bachelor- und welche dem Masterstudiengang
gig davon, welcher Bachelorstudiengang absolviert wurde,     zugeordnet werden können und wie groß jeweils der
müssen einzelne Studierende unterschiedliche Kompe-          verbleibende Umfang für Mastermodule ist.15 Exempla-
tenzen zu Beginn des Masterstudiengangs erwerben.            risch betrachten wir zusätzlich Bachelorstudiengänge
                                                             der Wirtschaftsinformatik. Dies lässt sich entsprechend
 Im Folgenden betrachten wir den (häufigen) Fall, dass       auf andere einschlägige Studiengänge mit Mathematik-,
 der Abschluss eines Bachelorstudiengangs in Informatik,     Statistik- und/oder Informatikbezug anwenden.
 Mathematik oder verwandten Fächern eine Zugangsvo-          Wir verwenden die folgenden Abkürzungen:
 raussetzung darstellt. Die dort bereits erlernten Inhalte
 variieren je nach Hochschule, können aber aufgrund der            BM – Masterstudium Data Science nach
 einschlägigen Empfehlungen der Gesellschaft für Infor-                 Bachelorstudium Mathematik
 matik bzw. anderer Fachgesellschaften oder Akkreditie-            BI – Masterstudium Data Science nach
 rungsagenturen eingeschätzt werden. Wir gehen zudem                    Bachelorstudium Informatik
 davon aus, dass ein*e Bewerber*in für ein Masterstudium           BW – Masterstudium Data Science nach
„Data Science“ Wahlmöglichkeiten zur Abdeckung der not-                 Bachelorstudium Wirtschaftsinformatik
 wendigen Kompetenzen weitgehend ausgenutzt hat.

Sollte ein Masterstudiengang mehrere Zugangsmög-             6.1 MATHEMATIK UND STATISTIK
lichkeiten besitzen, so bringen Studierende mit ein-         Lineare Algebra
schlägigem Vorstudium bereits relevante Vorkenntnisse        Kann für BM, BI und BW als bekannt vorausgesetzt
mit, während Studierende aus anderen Fächern diese           werden.
Inhalte vor oder während des Masterstudiums nachholen
müssen. Bei der Curriculumsentwicklung eines solchen         Optimierung und Simulation
Masterstudiengangs können nicht alle eventuell aufzuho-      Kann für BM und BW als bekannt vorausgesetzt werden,
lenden Inhalte in regulären Modulen vermittelt werden,       für BI nur vereinzelt.
wenn der Durchschnitt der Vorkenntnisse der Studieren-       Empfohlener Umfang: 2,5 LP für BI.
den zu gering ist – je nach Vorstudium würden Studie-
rende zu viel wiederholen müssen. Umgekehrt kann aber        Analysis
auch nicht die Vereinigung der Inhalte aller zugelassenen    Kann für BM und BI als bekannt vorausgesetzt werden,
Bachelorprogramme vorausgesetzt werden, denn dann            für BW nur vereinzelt.
müsste jede*r Studierende trotz erfüllter Zugangsvoraus-     Empfohlener Umfang: 2,5 LP für BW.
setzungen die Inhalte der jeweils anderen Bachelorstudi-
engänge nachholen.                                           Stochastik
                                                             Kann für BM als bekannt vorausgesetzt werden,
Wir empfehlen, für diese Konstellationen passende            die Kompetenzen aus BI und BW reichen im Allgemeinen
Angebote zu machen. Sollten die noch fehlenden Inhalte       nicht aus.
im Rahmen des Masterstudiums nachgeholt werden, so           Empfohlener Umfang: 5 LP für BI und BW.
kann dies durch sogenannte Synchronisationsmodule
geschehen, also alternative Module, die je nach Bache-
lorabschluss komplementär zu den bereits erworbenen
                                                             15	Auf eine wiederholte ausführliche Beschreibung der
Kompetenzen sind. Eine andere Möglichkeit sind Modu-             einzelnen Studieninhalte wird verzichtet, sie sind in Kapitel 5
le, die inhaltlich Bachelormodule umfassen, aber über            zu finden.
15

Angewandte Statistik                                        Algorithmen und Komplexität
Kann für BW vorausgesetzt werden. Grundlagen können         Kann für BI als bekannt vorausgesetzt werden, unter Be-
für BM und BI vorausgesetzt werden, wobei viele Infor-      rücksichtigung entsprechender individueller Ausrichtung
matikstudiengänge den entsprechenden Empfehlungen           im Mathematikstudium auch für BM.
nicht folgen (vor einigen Jahren gehörte Statistik noch     Empfohlener Umfang: 5 LP für BW
nicht in den üblichen Fächerkanon der Informatik). Ex-
plizite Statistikveranstaltungen kommen im Mathematik-
studium meist nicht vor, Grundlagen der Statistik werden    6.3 DATA-SCIENCE-METHODEN
dort aber als Teil der Stochastik mitbehandelt. Darüber     Data-Science-Methoden kommen in den hier betrach-
hinaus werden auch fortgeschrittene Inhalte der Statistik   teten Bachelorstudiengängen in nicht nennenswertem
benötigt, die Absolvent*innen eines Bachelorstudiums        Umfang vor.
Mathematik sich selbst erarbeiten können.
Empfohlener Umfang: 2,5 LP für BI.                          Datenintegration
                                                            Empfohlener Umfang: 5 LP

6.2 INFORMATIK UND PROGRAMMIERUNG                           Datenvisualisierung
Grundlagen Programmierung                                   Empfohlener Umfang: 2,5 LP
Konzepte imperativer Programmierung können für BM, BI
und BW als bekannt vorausgesetzt werden.                    Data Mining
                                                            Empfohlener Umfang: 5 LP
Fortgeschrittene Programmierung
Im Bereich Data Science werden spezielle Programmier-       Maschinelles Lernen
sprachen wie Python oder R verwendet. Für BI und BW         Empfohlener Umfang: 10 LP
kann vorausgesetzt werden, dass Absolvent*innen sich
diese Sprachen ohne Aufwand selbst aneignen können.         Deep Learning und weitere KI-Methoden
Zudem sind Fertigkeiten im Umgang mit Programment-          Empfohlener Umfang: 5 LP
wicklungsumgebungen notwendig.
Empfohlener Umfang: 2,5 LP für BM (bei praktischen
Übungen mehr).                                              6.4 INTERDISZIPLINÄRE ASPEKTE
                                                            Interdisziplinäre Aspekte kommen in den hier betrach-
IT-Infrastrukturen                                          teten Bachelorstudiengängen in nicht nennenswertem
Kann nur für BI vorausgesetzt werden.                       Umfang vor.
Empfohlener Umfang: 2,5 LP für BM und BW.
                                                            Datenethik
Software Engineering                                        Empfohlener Umfang: 5 LP
Kann für BI und BW als größtenteils bekannt vorausge-
setzt werden, auch wenn nicht alle für Software Enginee-    Data Privacy und weitere juristische Aspekte
ring relevanten Konzepte (z. B. Anforderungserhebung        Empfohlener Umfang: 2,5 LP
oder Entwicklungsprozesse) überall in gleicher Tiefe
gelehrt werden.                                             Projektmanagement, Soft Skills, interdisziplinäre
Empfohlener Umfang: 5 LP für BM.                            Kommunikation
                                                            Empfohlener Umfang: 2,5 LP
Datenbanken und Big Data
Kann für BI und BW als bekannt vorausgesetzt werden,        Datenökomomie
auch wenn nicht alle für Data Science relevanten Konzep-    Empfohlener Umfang: 2,5 LP
te (NoSQL, Cloud, Big Data) überall gelehrt werden.
Empfohlener Umfang: 5 LP für BM.
                                                            6.5 ANWENDUNG VON DATA SCIENCE IN DER DOMÄNE
Data Governance und IT-Sicherheit                           Empfohlener Umfang: 15 LP
Kann für BI und BW als bekannt vorausgesetzt werden,
auch wenn nicht alle für Data Science relevanten Konzep-
te überall gelehrt werden.
Empfohlener Umfang: 5 LP für BM.
16

6.6 TABELLARISCHE DARSTELLUNG DES
     CURRICULUMS
Für die drei betrachteten Möglichkeiten eines Masterstu-
diums „Data Science“ nach Bachelor Mathematik (BM),
Informatik (BI) und Wirtschaftsinformatik (BW) werden
im Folgenden die Summen der erforderlichen Leistungs-
punkte berechnet.

KOMPETENZEN                                            LP          BM     BI     BW

Fortgeschrittene Mathematik und Statistik              20          0      10     7,5
Lineare Algebra                                        5
Optimierung und Simulation                             2,5                2,5
Analysis                                               2,5                       2,5
Stochastik                                             5                  5      5
Angewandte Statistik                                   5                  2,5

Informatik und Programmierung                          30          20     0      7,5
Grundlagen Programmierung                              5
Fortgeschrittene Programmierung                        2,5         2,5
IT-Infrastrukturen                                     2,5         2,5           2,5
Software Engineering                                   5           5
Datenbanken und Big Data                               5           5
Data Governance und IT-Sicherheit                      5           5
Algorithmen und Komplexität                            5                         5

Data-Science-Methoden                                  27,5        27,5   27,5   27,5
Datenintegration                                       5           5      5      5
Datenvisualisierung                                    2,5         2,5    2,5    2,5
Data Mining                                            5           5      5      5
Maschinelles Lernen                                    10          10     10     10
Deep Learning und weitere KI-Methoden                  5           5      5      5

Interdisziplinäre Aspekte                              12,5        12,5   12,5   12,5
Datenethik                                             5           5      5      5
Data Privacy und weitere juristische Aspekte           2,5         2,5    2,5    2,5
Projektmanagement                                      2,5         2,5    2,5    2,5
Datenökonomie                                          2,5         2,5    2,5    2,5

Domänenprojekt                                         15          15     15     15

Summe                                                  105         75     65     70
17

6.7 ABSCHLIESSENDE EMPFEHLUNGEN
Die Kompetenzen eines Masterstudiengangs „Data             Bei einem viersemestrigen Studium stehen 120 LP zur
Science“ erfordern – zusammen mit einem vorausge-          Verfügung, bei einem dreisemestrigen Studium 90 LP. Es
henden Bachelorstudiengang – für die zwingend not-         bleibt daher nur wenig Raum (25-55 LP) für vertiefende
wendigen Bestandteile 105 LP, davon fallen 30-40 LP in     Module und ein Abschlussmodul, was bei einem nicht
die Bachelorstudiengänge Mathematik, Informatik oder       streng konsekutiven Masterstudiengang allerdings nicht
Wirtschaftsinformatik. Geht man von einer zusätzlichen     überrascht. Das Abschlussmodul kann entweder eine
Vertiefung oder einem Nebenfach im Bereich der Infor-      Abschlussarbeit im Umfang von 30 LP sein, oder aber
matik in einem Mathematikstudium (und entsprechenden       eine Kombination aus Abschlussarbeit mit 15 LP und
Vertiefungen in einem Bachelorstudium der Wirtschafts-     einem Data Science Projekt in der Domäne. Unter den
informatik) aus, so verbleiben 65 LP für verpflichtende    weiteren Modulen sollte verpflichtend ein Seminar sein.
Module im Masterstudium „Data Science“. Umfasst die        Die Beschäftigung mit dem aktuellen Forschungsstand
Zugangsvoraussetzung weitere, verwandte Bachelorstu-       bereitet auf die Abschlussarbeit vor. Die Präsentation und
diengänge, dürfte diese Zahl eher höher ausfallen (bei     ggfs. Ausarbeitung stellen zusätzliche relevante Prüfungs-
einem Bachelorstudiengang „Data Science“ oder Statistik    formen dar. Ergänzende Module können zur Profilbildung
eher geringer). In diesen Fällen sollte den Studierenden   eines Masterstudiengangs „Data Science“ dienen. Dabei
die Möglichkeit angeboten werden, fehlende Kompeten-       sollen den Studierenden in angemessener Weise Wahl-
zen durch zusätzliche Brückenkurse zu erwerben.            möglichkeiten angeboten werden.
18

LITERATUR

[AIHLEG2019] High-Level Expert Group on Artificial           [GI2017] Gesellschaft für Informatik e.V. (2017):
Intelligence (2019): Ethics Guidelines for Trustworthy AI,   Rahmenempfehlungen für die Ausbildung in Wirtschafts-
https://digital-strategy.ec.europa.eu/en/library/            informatik an Hochschulen,
ethics-guidelines-trustworthy-ai.                            https://dl.gi.de/handle/20.500.12116/2352.
(Abgerufen am 21.06.2021).                                   (Abgerufen am: 10.06.2021).

[ASIIN2016] ASIIN e.V. (2016): Fachspezifisch Ergänzende     [GI2019] Gesellschaft für Informatik e.V. (2019):
Hinweise des Fachausschusses 12 – Mathematik – zur           Arbeitspapier Data Science: Lern- und Ausbildungsinhalte,
Akkreditierung von Bachelor- und Masterstudiengängen         https://gi.de/fileadmin/GI/Allgemein/PDF/GI_Arbeitspa-
Mathematik,                                                  pier_Data-Science_2019-12_01.pdf.
https://www.asiin.de/files/content/kriterien/ASIIN_          (Abgerufen am: 10.06.2021).
FEH_12_Mathematik_2016-12-09.pdf.
(Abgerufen am: 10.06.2021).                                  [Hachmeister2021] Hachmeister, N., Theiß, J., Weiß, K.,
                                                             & Decker, R. (2021): Balancing Plurality and Educational
[BMI2019] Bundesministerium des Innern, für Bau und          Essence: Higher Education Between Data-Competent
Heimat (2019): Gutachten der Datenethikkommission,           Professionals and Data Self-Empowered Citizens, Data,
https://www.bmi.bund.de/SharedDocs/downloads/DE/             6, 2, 1-15. DOI: https://doi.org/10.3390/data6020010.
publikationen/themen/it-digitalpolitik/gutachten-
datenethikkommission.html.                                   [LernendeSysteme2020] Lernende Systeme –
(Abgerufen am: 13.04.2021).                                  Die Plattform für Künstliche Intelligenz (2020):
                                                             Von Daten zu KI. Intelligentes Datenmanagement als Ba-
[Bundesregierung2021] Die Bundesregierung (2021):            sis für Data Science und den Einsatz Lernender Systeme,
Datenstrategie der Bundesregierung,                          https://www.plattform-lernende-systeme.de/files/
https://www.bundesregierung.de/breg-de/suche/                Downloads/Publikationen/AG1_Whitepaper_Von_
datenstrategie-der-bundesregierung-1845632.                  Daten_zu_KI.pdf.
(Abgerufen am: 21.06.2021).                                  (Abgerufen am 21.06.2021).

[Filipovic2015] Filipovic, A. (2015):                        [Lübcke2018] Lübcke, M.; Wannemacher, K.: Vermittlung
Die Datafizierung der Welt. Eine ethische Vermessung des     von Datenkompetenzen an den Hochschulen: Studien-
digitalen Wandels, Communicatio Socialis, 48, 1, 6–15.       angebote im Bereich Data Science, Forum Hochschulent-
DOI: 10.5771/0010-3497-2015-1-6.                             wicklung 01/2018.

[GI2016] Gesellschaft für Informatik e.V. (2016):           [Sambasivan2021] Sambasivan, N., Kapania, S., Highfill, H.,
Empfehlungen für Bachelor- und Masterprogramme im           Akrong, D., Paritosh, P. K., & Aroyo, L. M. (2021): “Everyone
Studienfach Informatik an Hochschulen,                       wants to do the model work, not the data work”:
https://dl.gi.de/bitstream/handle/20.500.12116/              Data Cascades in High-Stakes AI, CHI Conference on
2351/58-GI-Empfehlungen_Bachelor-Master-                     Human Factors in Computing Systems, CHI ’21.
Informatik2016.pdf?sequence=1&isAllowed=y.
(Abgerufen am: 10.06.2021).
Sie können auch lesen