MASTERSTUDIENGÄNGE "DATA SCIENCE"- AUF BASIS EINES BACHELORS IN (WIRTSCHAFTS-) INFORMATIK ODER MATHEMATIK - Gesellschaft ...
←
→
Transkription von Seiteninhalten
Wenn Ihr Browser die Seite nicht korrekt rendert, bitte, lesen Sie den Inhalt der Seite unten
E M P F E H LU N G E N MASTERSTUDIENGÄNGE „DATA SCIENCE” – AUF BASIS EINES BACHELORS IN (WIRTSCHAFTS-) INFORMATIK ODER MATHEMATIK J U L I 2021 © iStock: Pinkypills WWW.GI.DE
EMPFEHLUNGEN FÜR MASTERSTUDIENGÄNGE „DATA SCIENCE“ – AUF BASIS EINES BACHELORS IN (WIRTSCHAFTS-) INFORMATIK ODER MATHEMATIK Empfehlungen der Gesellschaft für Informatik e.V. erarbeitet von der Task Force „Data Science” Die Empfehlungen wurden am 26. Juni 2021 vom Präsidium der GI verabschiedet An diesen Empfehlungen haben mitgewirkt: Ziawasch Abedjan (Hannover), Thomas Bendig (Berlin), Ulf Brefeld (Lüneburg), Joachim Bürkle (Frankfurt), Jörg Desel (Hagen), Stefan Edlich (Berlin), Thomas Eppler (Albstadt-Sigmaringen), Michael Goedicke (Duisburg-Essen), Nils Hachmeister (Bielefeld), Jens Heidrich (Kaiserslautern), Stephan Höppner (Berlin), Stefan M. Kast (Dortmund), Daniel Krupka (Berlin), Klaus Lang (Bingen), Peter Liggesmeyer (Kaiserslautern), Julia Meisner (Berlin), Ingo Scholtes (Wuppertal), Marina Tropmann-Frick (Hamburg) Die Empfehlungen wurden von Jörg Desel koordiniert. Entstanden in Zusammenarbeit mit der vom Bundesministerium für Bildung und Forschung (BMBF) und acatech initiierten Plattform Lernende Systeme
INHALT Vorwort . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 1 Vorbemerkung . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 2 Anforderungen aus der Berufspraxis . . . . . . . . . . . . . . . 6 3 Begriffliche Einordnung . . . . . . . . . . . . . . . . . . . . . . . 7 4 Data-Science-Kompetenzen . . . . . . . . . . . . . . . . . . . . 8 5 Lehrinhalte aus Teildisziplinen . . . . . . . . . . . . . . . . . . . 9 5.1 Mathematik und Statistik . . . . . . . . . . . . . . . . . . . 9 5.2 Informatik und Programmierung . . . . . . . . . . . . . . 10 5.3 Data-Science-Methoden . . . . . . . . . . . . . . . . . . . 11 5.4 Interdisziplinäre Aspekte . . . . . . . . . . . . . . . . . . . 12 5.5 Anwendung von Data Science in der Domäne . . . . . . . 13 6 Curriculumsempfehlungen für Masterstudiengänge „Data Science“ . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 6.1 Mathematik und Statistik . . . . . . . . . . . . . . . . . . 14 6.2 Informatik und Programmierung . . . . . . . . . . . . . . 15 6.3 Data-Science-Methoden . . . . . . . . . . . . . . . . . . . 15 6.4 Interdisziplinäre Aspekte . . . . . . . . . . . . . . . . . . . 15 6.5 Anwendung von Data Science in der Domäne . . . . . . . 15 6.6 Tabellarische Darstellung des Curriculums . . . . . . . . 16 6.7 Abschließende Empfehlungen . . . . . . . . . . . . . . . . 16 Literatur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 Autorenschaft . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
4 VORWORT Daten bilden die Grundlage einer zunehmend digital vernetzten Gesellschaft. In der Wirtschaft ist Data Science der Schlüssel der digitalen Transformation. Daten innovativ, verantwortungsvoll und gemein- wohlorientiert zu nutzen, kann das Zusammenleben in Deutschland, in Europa und in der Welt bedeutsam verbessern und natürliche Ressourcen schützen [Bundes- regierung2021]. Der Forschung an und mit Daten kommt dabei eine zentrale Bedeutung zu – seien es Satelliten- bilder als Datenquellen für Navigationssysteme oder PETER LIGGESMEYER, MICHAEL GOEDICKE, JÖRG DESEL für die Klimaforschung, Studiendaten zur Unterstützung von Mediziner*innen bei der Diagnose oder Daten über Konsument*innenverhalten zur Berechnung der indivi- gelagerten Datenbestände von Wissenschaft und For- duell passendsten Angebote. Die Menge der täglich neu schung in Deutschland erschließen soll. Als übergreifen- generierten Daten ist enorm, genau wie der potenzielle des Forschungsdatenmanagement soll die NFDI Stan- Nutzen für Wissenschaft, Forschung, Unternehmen und dards im Datenmanagement setzen und Forschungsdaten Verwaltung. nachhaltig nutz- und weiterverwendbar machen. Die Fähigkeit, diese Daten zu analysieren und nutzbar Mit diesen curricularen Empfehlungen für Data- zu machen, ist eine wichtige Voraussetzung, um wert- Science-Masterstudiengänge aufbauend auf einem volle Erkenntnisse in der Wissenschaft gewinnen und Bachelor in der (Wirtschafts-) Informatik und der nutzbringende Anwendungen für Gesellschaft, Staat und Mathematik sollen Mindeststandards definiert werden Wirtschaft generieren zu können. Der interdisziplinäre und Empfehlungen für die Akkreditierung solcher Forschungszweig Data Science, also das Management Studiengänge vorgelegt werden. und die Analyse von Daten, gilt daher schon heute als eine der wichtigsten Schlüsseldisziplinen für Wissen- schaft und Wirtschaft. Auch für die weitere Anwendung PETER LIGGESMEYER von Künstlicher Intelligenz (KI) und Lernenden Systemen Past-Präsident der Gesellschaft für Informatik, stellt die Verfügbarkeit von Daten und die Datenverwal- Sprecher GI-Task Force „Data Science“ tung eine zentrale Voraussetzung dar. MICHAEL GOEDICKE Die Bundesregierung hat deshalb die Nationale For- Vize-Präsident der Gesellschaft für Informatik, schungsdateninfrastruktur (NFDI) auf den Weg gebracht, Sprecher GI-Task Force „Data Science“ die die dezentral, projektförmig und/oder temporär JÖRG DESEL Sprecher GI-Fachbereich „Informatik und Ausbildung / Didaktik der Informatik“
5 1 VORBEMERKUNG Aufgrund der wachsenden Bedeutung von Daten, dem Wir betrachten Data-Science-Masterstudiengänge wissenschaftlich fundierten Umgang mit diesen (Data (Persona A aus dem Arbeitspapier zu Lern- und Ausbil- Science) und der großen Relevanz für die Informatik hat dungsinhalten), die entweder auf einem Bachelorab- der Vorstand der Gesellschaft für Informatik (GI) 2018 die schluss Mathematik, Informatik, Wirtschaftsinformatik Task Force „Data Science/Data Literacy“ ins Leben gerufen, oder einem vergleichbaren Bachelor mit Kompetenzen in die sich gemeinsam mit Partnern anderer Wissenschafts- Mathematik, Statistik und Informatik aufbauen (wie z. B. disziplinen aus den Natur- und Lebenswissenschaften das die Bachelorstudiengänge der Statistik sowie der Bio- Ziel gesetzt hat, Empfehlungen für die Entwicklung von oder Geoinformatik). Streng konsekutive Data-Science- Studien- und Weiterbildungsangeboten auszusprechen. Studiengänge (Bachelor und Master) werden hier nicht adressiert. Je nach vorliegender Vorqualifikation kann Unter Beteiligung der Plattform Lernende Systeme wurde auf entsprechenden Kompetenzen aufgebaut werden. das Arbeitspapier „Data Science: Lern- und Ausbildungs- Sollte ein Masterstudiengang „Data Science“ alternative inhalte“ (Dezember 2019) erstellt, welches ein Set an Zugangsmöglichkeiten haben, muss gewährleistet werden, Lern- und Ausbildungsinhalten definiert und dieses in dass die jeweils fehlenden Kompetenzen nachgeholt 14 Kompetenzfelder strukturiert [GI2019]. Darüber hinaus werden. wurden drei idealtypische Personas mit verschiedenen Bildungs- bzw. Ausbildungszielen definiert: (A) Master in Wir betrachten nicht explizit Bachelorstudiengänge „Data Data Science, um später als Data Scientist in der In- Science“, auch wenn diese partiell die hier vorgestellten dustrie oder Forschung tätig zu sein, (B) Master in einer Inhalte eines Masterstudiums „Data Science“ behandeln Wissenschaft aus einer Anwendungsdomäne (z. B. Natur- können. Da diese nicht auf den oben genannten Grundla- wissenschaften), um Data-Science-Kompetenzen für die gen aufbauen und zusätzliche Bachelor-typische Module Domäne zu erwerben, und (C) Berufstätige mit informati- zu überfachlichen Kompetenzen beinhalten, können schen und mathematischen Kenntnissen, um Data- grundsätzlich in den etwas längeren Bachelorstudiengän- Science-Kompetenzen für die praktische Anwendung gen (sechs oder sieben Semester) dieselben Inhaltsberei- im Job zu erwerben. che behandelt werden wie in den Masterstudiengängen – allerdings in einer niedrigeren Durchdringung. Bei Mas- Das Ziel dieser Publikation liegt darin, die Empfeh- terstudiengängen sollte die Mehrzahl der Kompetenzen lungen zu Lern- und Ausbildungsinhalten für Persona A mit den Lernzielen „Anwenden“ und „Analysieren“ (nach (Master in Data Science mit einem Bachelor in Informa- der Anderson-Krathwohl-Taxonomie) vermittelt werden. tik, Mathematik oder verwandten Studiengängen) weiter Bei Bachelorstudiengängen reichen die Lernziele „Verste- zu konkretisieren und Empfehlungen für ein Curriculum hen“ und „Anwenden“ bei der Mehrzahl der Kompetenzen für Data-Science-Studiengänge aus Sicht der Informatik aus. Spätestens bei Seminaren oder der Abschlussarbeit vorzulegen. Es soll als Diskussionsgrundlage dienen, um unterscheiden sich Bachelor- und Masterstudiengänge mit anderen beteiligten Fachdisziplinen abgestimmte grundsätzlich. ASIIN-Empfehlungen für die Akkreditierung solcher Studiengänge zu erarbeiten. Auch wenn wir keine konkreten Empfehlungen für die Aufteilung von Lerninhalten zwischen Bachelor und Für angenommene Vorqualifikationen aus Bachelor- Master für konsekutive Studiengänge geben, können studiengängen in Informatik und Wirtschaftsinformatik Lerninhalte analog zur Betrachtung von Bachelorstudi- werden die „Empfehlungen für Bachelor- und Master- engängen in Data Science behandelt werden. Ein*e wie programme im Studienfach Informatik an Hochschulen“ oben beschriebene*r Bachelorabsolvent*in bringt – [GI2016] sowie die „Rahmenempfehlung für die Ausbil- auf einer niedrigeren Ebene der kognitiven Durchdrin- dung in Wirtschaftsinformatik an Hochschulen“ [GI2017] gung – bereits die wesentlichen Kompetenzen mit, die im herangezogen. Die aktuellen Fachspezifisch Ergänzenden Masterstudium entsprechend vertieft werden können. Hinweise (FEH) der ASIIN beziehen sich für Informatik Wir empfehlen, entsprechende Vertiefungsmöglichkeiten und Wirtschaftsinformatik auf dieselben Inhalte. Für in allen im Arbeitspapier genannten Kompetenzbereichen angenommene Vorqualifikationen aus Bachelorstudien- vorzusehen. gängen der Mathematik verwenden wir die ASIIN-FEH „Zur Akkreditierung von Bachelor- und Masterstudiengängen der Mathematik“ vom 09.12.2016 [ASIIN2016].
6 2 A NFORDERUNGEN AUS DER Die Gründe des Fachkräftemangels, englisch auch ‚Data Science Gap‘ 4 genannt, sind jedoch vielfältig, und dem- BERUFSPRAXIS entsprechend gestaltet sich seine Überwindung heraus- forderungsreich: Aufgrund veränderter Anforderungen in der Arbeitswelt verlangen auch immer mehr Unternehmen, Verwaltungen An erster Stelle zu nennen sind die hohen Anforderungen und andere Organisationen Data-Science-Kompetenzen an das Kompetenzprofil von Data Scientists (vgl. von ihren Beschäftigten. Es gibt nicht nur eine große Kapitel 4): Neben fundierten mathematischen und tech- Nachfrage, sondern auch einen spürbaren Mangel an nischen Kompetenzen fordern Unternehmen und Orga- qualifizierten Data Scientists, die von vielen Unterneh- nisationen zumeist domänenspezifische Expertise sowie men und Organisationen händeringend gesucht werden. eine gute Kenntnis wirtschaftlicher Zusammenhänge, um In der jüngeren Vergangenheit ist hier ein großer Kampf aus den Ergebnissen die richtigen Schlüsse zu ziehen und um die besten Talente entbrannt.1 sie gewinnbringend zu kommunizieren [Lübcke2018]. Auf mathematisch-technischer Ebene erstreckt sich die Laut einer IDC-Studie ist der prozentuale Anteil der Data Liste wichtiger Kompetenzfelder vom Zugriff, der Trans- Scientists an der gesamten Beschäftigtenzahl zwischen formation und Aufbereitung von Daten über den Umgang 2013 und 2019 lediglich von 3,0 % auf 3,7 % gestiegen.2 Der mit großen Datenmengen und komplexen Datenstruk- Bedarf an Fachkräften im Bereich Data Science wuchs in turen, die Identifikation, Selektion und Gewichtung diesem Zeitraum dagegen enorm. Der IDC-Studie zufolge von Features im Bereich Data Engineering bis hin zur konnten im Jahr 2019 in Deutschland über 100.000 Data- Auswahl, Anpassung und Integration von Tools und von Science-Stellen nicht besetzt werden. Für das Jahr 2025 Data-Science-Funktionen in das Software- bzw. Systems werden 126.000 unbesetzte Arbeitsplätze vorausgesagt. Engineering. Neben den für diese Fertigkeiten notwen- digen Abschlüssen in Informatik oder Mathematik sollen In den USA sieht die Situation sehr ähnlich aus: Seit Data Scientists auch über Soft Skills wie Kommunikati- 2017 hat das US-Amerikanische Jobportal Glassdoor onsstärke und Kreativität verfügen, wie eine Analyse des Data Scientist als gefragtestes Berufsbild in den USA Jobportals joblift ermittelte.5 identifiziert. Darüber hinaus hat das U.S. Bureau of Labor Statistics festgestellt, dass die Nachfrage nach Zwar weisen einige größere Unternehmen und Organi- Data-Science-Fähigkeiten bis 2026 zu einem Anstieg der sationen umfangreiche Data Labs auf, die differenzierte Beschäftigung in diesem Bereich um 27,9 % führen wird. Kompetenzprofile erlauben; zumeist wird vom Berufsbild In den USA erwartet man folglich zwei bis vier Millionen Data Scientist jedoch erwartet, von einem vertiefenden neue Stellenausschreibungen im Bereich Data Science. Verständnis von Datenbanken bis hin zur fachspezifi- schen Datenvermittlung ein breites Kompetenzprofil Die deutsche Universitäts- und Hochschullandschaft vorhanden ist.6 Zum einen liegt dies an der noch relati- reagiert auf diese Entwicklung. Über den Hochschulkom- ven Neuheit der Profession selbst, wodurch sich Unter- pass, ein Informationsportal der Hochschulrektorenkon- nehmen und Organisationen in vielen Fällen erst Klarheit ferenz, lassen sich 2021 über 200 Studiengänge ermitteln, über ihre tatsächlichen Bedarfe schaffen müssen; es ist die Data Science im Titel enthalten.3 2018 lag die Anzahl zu erwarten, dass sich die berufspraktischen Anforderun- an Bachelor- und Masterstudiengängen sowie verschie- gen an Data Scientists zukünftig verfeinern [Lübcke2018]. dener Kontaktstudienangebote bzw. Zertifikatskurse für Zum anderen ist die Ausbildung eines breiten Kompe- Data Science noch bei rund 30, wie eine Bestandsauf- tenzprofils aber insofern grundsätzlich sinnvoll, als das nahme des Studienangebots für Data Science an den Berufsbild Data Scientist aufgrund einer rasanten tech- deutschen Hochschulen durch das Institut für Hochschul- nologischen Entwicklungsgeschwindigkeit einer hohen entwicklung ergab [Lübcke2018]. Änderungsdynamik unterliegt und sich die Schwerpunkte in den Aufgaben und Fertigkeiten laufend verschieben (vgl. Kapitel 3). 1 https://quanthub.com/data-scientist-shortage-2020/ (27. Januar 2021). 4 https://towardsdatascience.com/ 2 https://datalandscape.eu/study-reports/final-study- the-data-science-gap-5cc4e0d19ee3 (12. April 2021). report-european-data-market-monitoring-tool-key-facts- figures-first-policy (27. Januar 2021). 5 https://joblift.de/Presse/data-scientist (04. Februar 2021). 3 Suchergebnisse für „Data Science” über: 6 https://www.cio.de/a/was-ein-data-scientist-wirklich- https://www.hochschulkompass.de/home.html (10. Juni 2021). koennen-muss,3577657 (04. Februar 2021).
7 3 BEGRIFFLICHE EINORDNUNG Der Begriff ‚Data Science‘ wird in der Praxis häufig recht Diese und andere parallele Entwicklungen ziehen wie- schwammig verwendet und adressiert unterschiedliche derum Veränderungen von Organisationsstrukturen und Kompetenzfelder in verschiedener Tiefe. Weitestgehende Berufsprofilen nach sich und können durch zukünftige Einigkeit herrscht allerdings darüber, dass es bei Data wissenschaftliche und technische Entwicklungen auch Science in der Hochschullehre im Wesentlichen um die noch gänzlich andere Verläufe nehmen. Vermittlung von Fachwissen im Hinblick auf den Um- gang mit Daten geht – insbesondere mit Big Data. Eine Die Begrifflichkeiten und Herausforderungen rund um von vielen Praktiker*innen genutzte Definition stammt das Thema Data Science sind daher – getrieben von von Drew Conway.7 Diese stellt Data Science als eine Technik und Wissenschaft – im Fluss und werden es auf domänenübergreifende Disziplin dar, die in der Schnitt- absehbare Zeit bleiben [Hachmeister2021]. Eine zu enge menge grundlegende informatische und mathematische begriffliche Fassung bei der Konzeption von Studien- Kenntnisse erfordert sowie Sachkenntnis in Bezug auf die gängen läuft daher immer Gefahr von dieser Dynamik Anwendungsdomäne. überholt zu werden. Neben Studiengängen mit dem Namen Data Science ka- Aus diesen Gründen raten wir zur Verwendung eines men in der letzten Zeit verwandte Studiengänge auf den breiten Oberbegriffs als Titel entsprechender Studien- Markt, die gewisse Anteile von Data Science besonders gänge. Etwaige besondere Schwerpunkte in Richtung vertiefen oder die Perspektive aus einer Disziplin beto- einzelner Kompetenzfelder – auf dem Arbeitsmarkt wer- nen und deshalb andere Namen tragen wie zum Beispiel den die oben genannten und weitere Spezialisierungen Data Engineering, Data Analytics oder Machine Learning. ja durchaus nachgefragt – sollten über entsprechende Dabei wird Data Science manchmal als übergeordneter Vertiefungen in den Studiengängen kenntlich gemacht und manchmal als untergeordneter Begriff verwendet. werden. Weiterhin empfehlen wir den Titel „Data Science“ für Studiengänge, sofern dies inhaltlich weitgehend Eine einheitliche Abgrenzung verschiedener Studien- gerechtfertigt ist, da dieser a) im allgemeinen Sprachge- felder im Bereich Data Science kann aber gegenwärtig brauch ohnehin eine breite Verwendung findet und b) als schon deshalb keinen Bestand haben, weil fortwährende Oberbegriff eine große Strahlkraft bei Arbeitgeber*innen technologische und wissenschaftliche Entwicklungen zu und Studieninteressierten hat.8 einer ständigen Verschiebung von Schwerpunkten und Aufgabenfeldern führen. Dies lässt sich beispielhaft an dem mit Data Science verknüpften Berufsbild illustrieren. So hat sich in den letzten Jahren das Verständnis für die Bedeutung der Datenqualität, der Vermeidung syste- matischer Verzerrungen (Bias), der Daten-Kuration und der Anpassung von Modellen an sich verändernde Daten vertieft. Entsprechend wurde die Notwendigkeit erkannt, diesen Themen mehr Zeit und Arbeit zu widmen [Sambasivan2021]. Gleichzeitig ist das Verständnis für die Besonderheiten verschiedener Modelle gewachsen und parallel nimmt die (Weiter-)Entwicklung von ein- schlägigen ML-Toolboxen Data Scientists zunehmend Komplexität und Arbeit ab, sodass in die eigentliche Modellbildung heute deutlich weniger Zeit investiert werden muss als noch vor einigen Jahren. 8 Dessen ungeachtet beziehen sich die vorliegenden 7 http://drewconway.com/zia/2013/3/26/ Empfehlungen auch auf verwandte Studiengänge mit abwei- the-data-science-venn-diagram (15. März 2021). chenden Namen bzw. können für diese angepasst werden.
8 4 DATA-SCIENCE-KOMPETENZEN Absolvent*innen eines Masterstudiums „Data Science“ Anwendungsdomäne für Data Science und die in dieser müssen den Data Science Lifecycle (z. B. nach CRISP-DM - Domäne relevanten Fragestellungen sowie wichtige Ak- Business Understanding, Data Understanding, Data Pre- teur*innen kennen und in der Lage sein, die spezifischen paration, Modeling, Evaluation, Deployment9 - oder nach Charakteristika der Daten in der entsprechenden Domäne der Data-Science-Prozesskette der Plattform Lernende zu beurteilen. Die Ebene des Domänenwissens beinhaltet Systeme [LernendeSysteme2020]) eines Data-Science- auch, die Rahmenbedingungen der eigenen Domäne von Projekts vollständig und selbständig bewältigen. Das be- jeweils anderen unterscheiden zu können und fähig zu inhaltet, dass sie die für die einzelnen Schritte notwendi- sein, sich in andere Domänen einzuarbeiten. Data Scien- gen Werkzeuge und Methoden hinsichtlich ihrer Eignung tists müssen auch imstande sein, das für verschiedene bewerten, aussuchen und einsetzen sowie auf eine über- Anwendungsdomänen relevante Verständnis der Daten greifende Werkzeugunterstützung zurückgreifen können. zu entwickeln und die Qualität sowie die Ergebnisse von Auswertungen der Daten (statistisch) interpretieren zu Hierfür ist eine Vielzahl unterschiedlicher Kompetenzen können. Nur so können Data Scientists den letzten Schritt erforderlich: des Data Science Lifecycles beherrschen: die disziplin- Auf mathematisch-technischer Ebene müssen die übergreifende und zielgruppengerechte Kommunikation mathematischen und algorithmischen Grundlagen aller der generierten Ergebnisse. Schritte des Data Science Lifecycles nachvollzogen werden können, was die Beherrschung von mindestens Im Rahmen der Arbeit innerhalb von Unternehmen und einer für Data Science relevanten Programmiersprache Organisationen müssen Absolvent*innen schließlich zum (z. B. Python, R, Julia, Matlab, Octave) und Grundkenntnis- einen die Rolle von Data-Science-Anwendungen in diesen se in der Softwareentwicklung und dem Datenmanage- Unternehmen und Organisationen beurteilen können, ment voraussetzt. zum anderen die ethischen und juristischen Aspekte von Data-Science-Projekten kennen und ihr eigenes Handeln Da Data Science ein anwendungsbezogenes Fach ist, danach ausrichten. Und natürlich sollte ein Data Scientist welches das Ziel hat, handlungsfähige Ergebnisse zu in allen genannten Punkten stets interessiert daran sein, Fragestellungen einer bestimmten Branche zu generieren, Entwicklungen zu erkennen, zu verstehen und das eigene müssen Absolvent*innen darüber hinaus wenigstens eine Kompetenzportfolio entsprechend zu erweitern. 9 https://www.ibm.com/docs/de/spss-modeler/ SaaS?topic=dm-crisp-help-overview (21. Juni 2021).
9 5 LEHRINHALTE AUS TEILDISZIPLINEN Es geht hier nicht darum, was in einem Masterprogramm Analysis Data Science gelehrt werden soll, sondern um die Inhalte, Aus der Data-Science-Perspektive ist die Analysis ein die zusammen mit einem zugrundeliegenden Bachelor- weiterer unverzichtbarer Zweig der Mathematik. Zentrale programm gelehrt werden sollen. In Kapitel 6 schlagen Fragen der Analysis drehen sich um Funktionen: Wie kann wir vor, wie ein Masterprogramm strukturiert sein kann, das Änderungsverhalten einer Funktion erfasst, verstan- das auf unterschiedlichen konkreten Bachelorprogram- den, beschrieben und vorhergesagt werden. Benötigte men aufbaut. Der Bezug zu anderen Studiengängen und Kenntnisse umfassen u. a. Mengen und Zahlen, reellwerti- die Angaben von Leistungspunkten (LP) sollen lediglich ge Funktionen, Grenz- und Extremwerte und Reihen sowie ein Indikator für den Grad der Vertiefung darstellen. Es Stetigkeit und Differenzierbarkeit. ist in verschiedenen Kombinationen möglich, Kompeten- Empfohlener Umfang: 2,5 LP zen gleichzeitig in mehreren Bereichen zu erwerben (zum Beispiel bei einer Kombination der Lehrinhalte ‚Algorith- Stochastik men‘ und ‚Data-Science-Methoden‘), sodass die Summe Die Stochastik bildet einen mathematischen Rahmen der LP auf diese Weise reduziert werden kann. für den Umgang mit Unsicherheiten und unsicheren Aussagen. Sie vereint die Gebiete der Wahrscheinlich- keitsrechnung, der Kombinatorik und der mathemati- 5.1 MATHEMATIK UND STATISTIK10 schen Statistik. Statistik und Wahrscheinlichkeitstheorie Die Bewältigung der Komplexität von Data Science-Auf- sind grundlegende Komponenten der Datenanalyse und gaben erfordert Kenntnisse aus mehreren Gebieten der bilden einen wesentlichen Teil der Kompetenzen und Mathematik und Informatik. Es ist von enormer Bedeu- Kenntnisse in der Data Science. Dieser Bereich soll den tung, neben anderen Disziplinen generelle mathemati- Studierenden einen Einblick in die wichtigsten Statistik- sche Konzepte zu beherrschen, die für viele Methoden und Data-Analytics-Paradigmen und -Denkschulen bieten. aus dem Data-Science-Bereich eine Grundlage bilden. Sie können separat oder als Teil anderer Data-Ana- Des Weiteren kommt es auf die analytische Denkweise lytics-bezogener Module oder Kurse unterrichtet werden. und das Abstraktionsvermögen an – Eigenschaften, die Zentrale Konzepte sind hier bspw. nichtparametrische, mit dem Studium mathematischer Konzepte vermittelt multivariate, hochdimensionale und bayesianische Ver- werden. fahren, High-Dimensional Probability, Applied Probability, Zufallsmatrix-Theorie sowie Markow-Prozesse. Lineare Algebra Empfohlener Umfang: 5 LP Lineare Algebra gehört zur unverzichtbaren Basis der mathematischen Grundausbildung. Angefangen mit Angewandte Statistik Lösungen linearer Gleichungssysteme bis zu den linearen Eine wesentliche Aufgabe der Statistik ist es, Daten zu Abbildungen ist dieser Zweig der Mathematik eine Grund- beschreiben und Erkenntnisse für die Entscheidungsfin- voraussetzung für das Verständnis und die Arbeit mit dung in geeigneter Weise aufzuarbeiten und darzustellen. vielen Machine-Learning-Algorithmen. Themen, die durch Zu den für Data Science relevanten Inhalten gehören u. a. lineare Algebra abgedeckt werden, umfassen u. a. Vek- die beschreibende/deskriptive Statistik, die Konfidenz- toren, Matrizen und Tensoren, lineare Abhängigkeit und und Faktorenanalyse sowie die Anwendung mathemati- Determinanten, Eigenwerte und Singulärwertzerlegung. scher Methoden der schließenden/induktiven Statistik, Empfohlener Umfang: 5 LP die es erlauben Hypothesen zu testen und Parameter zu schätzen. Optimierung und Simulation Empfohlener Umfang: 5 LP Inhalte zur Linearen Optimierung werden oft mit Linearer Algebra kombiniert, zur Nichtlinearen Optimierung oft mit Diskreter Mathematik oder mit Numerik. Empfohlener Umfang: 2,5 LP 10 Dieses Kapitel adressiert die Kompetenzfelder 1 und 2 aus [GI2019].
10 5.2 INFORMATIK UND PROGRAMMIERUNG11 Um Data-Science-Methoden anwenden und dazugehö- nagement, Architektur und Entwurf, Qualitätssicherung rende Systeme entwickeln und erstellen zu können, sind (Verifikation und Validation), Software-Projektmanage- neben mathematischen Kompetenzen auch Informa- ment und Software-Entwicklungsprozesse. tik- und Programmierkenntnisse wichtig. Informatik- und Empfohlener Umfang: 5 LP Programmiermethoden sind im Data Science Lifecycle auf jeder Stufe in unterschiedlicher Granularität von Bedeu- Datenbanken und Big Data tung. Programmier- und Datenbankkenntnisse als auch Datenintensive Anwendungen aus dem Data-Science- Software-Engineering-Methoden sind in der Design&- Bereich bauen auf Datenverarbeitungsketten (Data Build-Phase notwendig, während IT-Infrastrukturen vor Pipelines) auf. Data Scientists benötigen Verständnis allem in der Release- und der Integrate-Phase gefragt und Anwendungswissen der Funktionsweise relevan- sind. ter Algorithmen und Datenstrukturen zur Aufbereitung, Speicherung und Verarbeitung großer, heterogener und Grundlagen Programmierung dynamischer Datenbestände, u. a. verteilt und in Echtzeit. Data Scientists müssen die grundlegenden Program- Außerdem wird ein sicherer Umgang mit unterschied- miermethoden und -verfahren kennen und souverän lichen Datenquellen vorausgesetzt (z. B. Datenbanken, anwenden können. Dazu gehören Konzepte imperativer Repositories, Data Warehousing, NoSQL-Komponenten). Programmiersprachen, deren Anwendung zur Program- Empfohlener Umfang: 5 LP merstellung sowie Qualitätssicherungsverfahren zur Sicherstellung einer hohen Programmgüte. Data Governance und IT-Sicherheit Empfohlener Umfang: 5 LP Um die Qualität, den Schutz und die Sicherheit der Daten gewährleisten zu können und für die Einhaltung rechtli- Fortgeschrittene Programmierung cher Vorgaben zu sorgen, werden Data Governance- und Während Programmiergrundlagen unabhängig von spe- Data Policy-Verfahren verwendet. Wichtige Aspekte sind ziellen Data-Science-Programmiersprachen und -bib- Fragen von Sicherheit, Schutz, Zuverlässigkeit, Integrität, liotheken die Basis für die Programmentwicklung legen, Vertraulichkeit und Verfügbarkeit der genutzten IT- benötigen Data Scientists weitergehende Fähigkeiten, um Systeme und der Daten. Dies umfasst die Spezifikation Data-Science-Methoden anwenden und Programme für der Anwendungsanforderungen, den Entwurf und die die Datenanalyse entwickeln zu können. Dazu zählen Pro- Analyse von Verfahren zur Lösung der gestellten Aufga- grammiersprachen, z. B. Python, R oder Julia, aber auch ben, die Entwicklung von Datenstrukturen und Algorith- spezielle Bibliotheken für konventionelle Programmier- men, deren Implementierung in Software und Hardware sprachen. Die Anwendung von Data-Science-Bibliotheken und den Nachweis dafür, dass das so konstruierte System erfordert zudem weitergehende Programmierkonzepte, die gestellten Anforderungen erfüllt. z.B. aus objektorientierter oder funktionaler Programmie- Empfohlener Umfang: 5 LP rung sowie Parallelisierung. Empfohlener Umfang: 2,5 LP Algorithmen und Komplexität Die Komplexität eines Algorithmus beschreibt das IT-Infrastrukturen Laufzeitverhalten und den Speicherbedarf bei Eingaben Für die Operationalisierung des Data-Science-Lebenszy- wachsender Größe. Die Komplexitätsanalyse und der klus sind Fähigkeiten im Umgang mit IT-Infrastrukturen Entwurf möglichst effizienter Algorithmen zusammen mit erforderlich. Dazu gehören das Container-Management geeigneten Datenstrukturen gehören zu den Grundbau- und Cloud Computing genauso wie Virtualisierung und steinen jedes Informatikstudiums. Die Verarbeitung sehr Streaming. großer Datenmengen in Data-Science-Projekten ist nur Empfohlener Umfang: 2,5 LP mit effizienten Algorithmen möglich. Data Scientists müs- sen daher die Komplexität der von ihnen verwendeten Software Engineering Algorithmen einschätzen können sowie Konzepte für den Die Entwicklung und Erstellung von Data-Science-Lösun- Entwurf effizienter Algorithmen beherrschen, besonders gen erfordert Konzepte für die ingenieurmäßige Entwick- im Bereich Machine Learning. lung softwarebasierter Systeme wie Anforderungsma Empfohlener Umfang: 5 LP 11 Dieses Kapitel adressiert die Kompetenzfelder 3, 4, 5 und 7 aus [GI2019].
11 5.3 DATA-SCIENCE-METHODEN 12 Viele im Bereich Data Science verwendete Methoden sind Data Mining nicht spezifisch für diesen Anwendungsbereich entstan- Dieser Bereich soll die Studierenden mit den wichtigsten den und können daher auch in anderen Bereichen (oft Data-Mining-Algorithmen und verwandten Methoden der Statistik) vorkommen. Data Scientists müssen aber ein Wissensextraktion, Wissensrepräsentation und Argu- tiefes Verständnis und Anwendungskompetenzen der mentation vertraut machen. Es werden mathematische Methoden haben, wie sie im sog. Data Science Lifecycle Modelle und Algorithmen behandelt, die auf große vorkommen. Datenmengen angewendet werden können. Zu den Methoden gehören Prozesse für Häufigkeits- und Asso- Deshalb werden diese Methoden hier als Kerngebiet des ziationsanalysen (Rule Mining), Knowledge Discovery in Data-Science-Studiums aufgeführt. Der Data Science Databases (KDD), Information Retrieval, Text-, Web- und Lifecycle wird in unterschiedlichen Formen veröffentlicht, Process-Mining, Zeitreihenanalyse und das entsprechen- seine Schritte haben immer wieder unterschiedliche Na- de Reporting. men und beruhen auf verschiedenen Methoden, die wir Empfohlener Umfang: 5 LP im Folgenden teilweise nebeneinander aufführen. Neben den einzelnen Kompetenzbereichen ist die Verwendung Maschinelles Lernen der Methoden im Data Science Lifecycle ein wesentlicher Den Data Scientists steht eine große Auswahl an fertigen Lehrinhalt, der aber nicht gesondert aufgeführt wird. Bibliotheken für Maschinelles Lernen zur Verfügung. Den- Zu allen Methoden sind neben dem Verständnis der noch muss das Studium über die einfache Anwendung Grundlagen die Kenntnis von und der Umgang mit ent- von Algorithmen hinausgehen. Neue Probleme, mit denen sprechenden Werkzeugen – auch im Zusammenspiel der Studierende konfrontiert sind, erfordern oftmals ein Methoden – notwendige Kompetenzen. tiefes Verständnis der theoretischen Grundlagen sowohl einfacher als auch fortgeschrittener Algorithmen. Diese Datenintegration und Datenqualität Kompetenzen decken die Verwendung, die Analyse, den Für die Datenintegration werden Daten aus verschiede- Entwurf und die Anpassung von Algorithmen für Maschi- nen Quellen gesammelt und in unterschiedlichen Forma- nelles Lernen ab. Es werden wichtige Fragestellungen zur ten miteinander verbunden, aufbereitet und integriert. Behandlung und Modellierung von Daten und zur Defi- Zur Anwendung kommen Methoden und Werkzeuge wie nition von Zielfunktionen sowie Optimierungsstrategien Data Pipelines, ETL-Werkzeuge (Extrahieren/Transformie- behandelt. Aspekte, die hier eine Rolle spielen, sind Infe- ren/Laden), Data-Cleaning-Algorithmen, Matching-Regeln renzmethoden, probabilistische und statistische Modelle/ und skalierbare Data-Preparation- sowie Feature-En- Konzepte, Regressionsmodelle und Machine-Learning- gineering-Verfahren.Weiterhin ist es erforderlich, dass Anwendungen (wie Natural Language Processing) sowie für die weiteren Schritte des Data Science Lifecycles die einschlägige Programmiersprachen (z. B. Python, R, Julia) Qualität der Daten validiert wird. Dies setzt den Umgang und Bibliotheken (z. B. SciKitLearn, Dask). mit fehlenden, fehlerhaften und verzerrten Daten voraus. Empfohlener Umfang: 10 LP Empfohlener Umfang: 5 LP Deep Learning und weitere KI-Methoden Datenvisualisierung und Explorative Datenanalyse Deep Learning setzt Neuronale Netze mit mehreren Sowohl die Anwendung von Visualisierungswerkzeugen Schichten (Deep Neural Networks) ein, z. B. zur Bilder- als auch die theoretischen Grundlagen wie Perception kennung oder zum Natural Language Processing. Ausge- Theory und Editorial Thinking werden hier vermittelt. bildete Data Scientists kennen sich mit verschiedenen Weiterhin werden auch Bezüge zu den Bereichen der Deep-Learning-Netzen und -Architekturen aus. Gefordert Computergrafik hinsichtlich Overlays, Interaktivität und werden neben der Beherrschung von Deep Learning auch Annotationen hergestellt. Explorative Analysemethoden Kenntnisse weiterer Methoden der Künstlichen Intelli- und Methoden der multivariaten Datenvisualisierung genz wie dem Reinforcement Learning und generativer gehören ebenfalls zum Modulinhalt. Modelle. Empfohlener Umfang: 2,5 LP Empfohlener Umfang: 5 LP 12 Dieses Kapitel adressiert die Kompetenzfelder 8, 9, 10, 11 und 12 aus [GI2019].
12 5.4 INTERDISZIPLINÄRE ASPEKTE 13 Zentrales Wesensmerkmal der Data Science ist ihre In- diskutiert. Aspekte, die im Rahmen eines Studiums terdisziplinarität. Durch die zunehmende Digitalisierung vermittelt werden sollen, sind ein entsprechendes Pro- und Datafizierung [Filipovic2015] aller Wirtschafts- und blembewusstsein, die Bedeutung der Erklärbarkeit von Lebensbereiche und der damit einhergehenden wissen- Modellen, die Auswirkung von Verzerrungen in Trainings- schaftlichen Auseinandersetzung mit diesen Entwick- daten, eine Technikfolgenabschätzung oder Algorith- lungen und Phänomenen werden große Datenmengen mic-Accountability-Kriterien wie Fairness, Trustworthiness erfasst, ausgewertet und für spezifische Zwecke nutzbar etc. [AIHLEG2019]. gemacht. Der wissenschaftliche und ökonomische Um- Empfohlener Umfang: 5 LP gang mit Daten erfolgt also nicht im „luftleeren“ Raum, sondern immer in bestimmten Anwendungskontexten. Data Privacy und weitere juristische Aspekte Welchen Wert Daten und welche sozialen Konsequenzen Um Datenmissbrauch zu verhindern, müssen Data Scien- die Ergebnisse von Data-Science-Projekten entwickeln, tists mit den wichtigsten Datenrechten und -pflichten wird maßgeblich durch den jeweiligen Kontext ihrer vertraut sein [BMI2019]. Dafür muss mindestens eine Nutzung bestimmt. Dadurch können Daten, die für einen vertiefende Auseinandersetzung mit dem nationalen und bestimmten Zweck erhoben und verarbeitet wurden, in internationalen Datenschutzrecht erfolgen, die Spezifika einem anderen Anwendungsfall eine ganz andere, teils personenbezogener bzw. nichtpersonenbezogener Daten, missbräuchliche und schädliche Wirkung entfalten unterschiedliche Datenlizenzen bzw. Nutzungsbestim- [BMI2019]. mungen sowie Aspekte der Data Compliance bekannt sein und entsprechende Handlungskompetenzen erworben Das Ziel einer verantwortungsvollen Datennutzung werden. [Bundesregierung2021] macht vor diesem Hintergrund Empfohlener Umfang: 2,5 LP nicht nur die Aneignung domänenspezifischen Wissens (vgl. Kapitel 5.5) unabdingbar, sondern erfordert auch Projektmanagement, Soft Skills, interdisziplinäre die fundierte Kenntnis interdisziplinärer Aspekte wie Kommunikation Datenethtik oder Data Privacy. So können Data Scientists Als Teil von Organisationen müssen Data Scientists fähig einerseits dem Anspruch gerecht werden, die Ergeb- sein, Projekte planen, durchführen und evaluieren zu nisse sowie den Nutzen ihrer Arbeit effektiv innerhalb können. Der Nutzen von Data Science sowie die Vorteile eines ökonomischen oder wissenschaftlichen Umfeldes und Risiken der generierten Ergebnisse müssen für den zu kommunizieren und sich andererseits ihrer gesell- jeweiligen Anwendungskontext erkannt und interdiszip- schaftlichen Verantwortung in der Verarbeitung sensibler linär verständlich kommuniziert werden. Sinnvoll dafür Daten und in der Bereitstellung von Ergebnissen mit teils ist die Vermittlung von Kenntnissen aus den Bereichen beträchtlichen sozialen Folgen bewusst zu sein und ent- Projektmanagement, Marketing und Kommunikation. sprechend zu handeln. Empfohlener Umfang: 2,5 LP Datenethik Datenökomomie Data Scientists müssen von der Datenherkunft bis hin zur Data Scientists müssen die ökonomischen Mechanismen Verwertung der Ergebnisse in der Lage sein, den gesam- und Zielsetzungen kennen, die die Sammlung und Ana- ten Lebenszyklus aus ethischer Perspektive zu hinter- lyse von Daten antreiben. Dabei geht es nicht nur darum, fragen. Untersucht werden sollen u. a., ob in den ausge- neue digitale Wertschöpfungsmodelle und Wertschöp- wählten Datensätzen systematische Verzerrungen (Bias) fungspotenziale von Daten erkennen und ausschöpfen vorliegen, beispielsweise bestimmte Personengruppen zu können. Es sollte auch ein kritisches Bewusstsein für unter- oder überrepräsentiert sind oder unzulässig die Marktakteur*innen und Machtverhältnisse in der diskriminiert werden [BMI2019]. Zudem werden die Rolle Datenökonomie und deren gesellschaftlichen Einfluss der Algorithmen bei der Verschärfung der vorliegenden gefördert werden. Verzerrungen und vorgeschlagene Lösungsansätze Empfohlener Umfang: 2,5 LP 13 Dieses Kapitel adressiert das Kompetenzfeld 6 aus [GI2019].
13 5.5 ANWENDUNG VON DATA SCIENCE IN DER DOMÄNE 14 Data Science ist ein anwendungsbezogenes Fach. Der Data Scientists sind oft keine Expert*innen in einer Anwendungskontext von Data Science differiert in den Domäne, sondern müssen die Vielfältigkeit der Frage- verschiedenen Anwendungsdomänen erheblich. Data stellungen und der Rahmenbedingungen in unterschied- Scientists müssen in der Lage sein, selbstständig ein lichen Domänen kennen und in der Lage sein, sich Verständnis für die relevanten Fragestellungen innerhalb selbstständig in eine neue Domäne einzuarbeiten. Dazu einer Anwendungsdomäne zu gewinnen, die Möglichkei- muss ein Domänenprojekt innerhalb des Data-Science- ten der Gewinnung von Daten und die Bewertung ihrer Studiums durchgeführt werden. Das Projekt kann auch Qualität zu eruieren, ein mögliches Vorgehen juristisch, als Vorstufe für die Masterarbeit verwendet werden. Im ethisch und ökonomisch zu beurteilen, ein Data-Science- Projekt werden Fragestellungen aus der Domäne gemein- basiertes Projekt selbstständig und unter Verwendung sam mit einschlägigen Expert*innen unter Verwendung der geeigneten Methoden durchzuführen und die Ergeb- von Data-Science-Werkzeugen bearbeitet. nisse adressatengerecht zu präsentieren. Dazu ist die selbstständige praktische Durchführung eines Projekts Interdisziplinäre Data Labs, in denen unter Anleitung und dieser Art im Studium in wenigstens einer Fachdomäne selbstständig an konkreten Beispielprojekten gearbeitet im Team mit Domänenexpert*innen erforderlich. In einer wird, eignen sich zur agilen Adaption an methodische wissenschaftlichen Domäne spielt das jeweilige For- Entwicklungen, die teilweise schneller verlaufen, als uni- schungsdatenmanagement eine wichtige Rolle. versitäre Curricula geändert werden können. Empfohlener Umfang: min. 15 LP 14 Dieses Kapitel adressiert die Kompetenzfelder 13 und 14 aus [GI2019].
14 6 CURRICULUMSEMPFEHLUNGEN diese hinausgehen, sodass der individuelle Aufwand zur Bearbeitung der Module vom Vorwissen abhängt. Auf den FÜR MASTERSTUDIENGÄNGE durchschnittlichen individuellen Workload hat dies nur „DATA SCIENCE“ geringe Auswirkungen. Je nach Vorstudium stehen Modu- len mit höherem Bearbeitungsaufwand andere Module In den hier betrachteten Empfehlungen für Masterstudi- gegenüber, deren Bearbeitungsaufwand aufgrund der engänge „Data Science“ wird ein Teil der erforderlichen Vorkenntnisse reduziert ist. Kompetenzen in einem Bachelorstudiengang erworben, dessen erfolgreicher Abschluss Zugangsvoraussetzung für Im Folgenden wird für die Bachelorstudiengänge Ma- das Masterprogramm ist. Je nach gewählten Zugangsvor- thematik und Informatik dargestellt, welche der im aussetzungen gestalten sich daher die Curricula für Mas- vorhergehenden Abschnitt beschriebenen Kompeten- terstudiengänge „Data Science“ unterschiedlich. Abhän- zen dem Bachelor- und welche dem Masterstudiengang gig davon, welcher Bachelorstudiengang absolviert wurde, zugeordnet werden können und wie groß jeweils der müssen einzelne Studierende unterschiedliche Kompe- verbleibende Umfang für Mastermodule ist.15 Exempla- tenzen zu Beginn des Masterstudiengangs erwerben. risch betrachten wir zusätzlich Bachelorstudiengänge der Wirtschaftsinformatik. Dies lässt sich entsprechend Im Folgenden betrachten wir den (häufigen) Fall, dass auf andere einschlägige Studiengänge mit Mathematik-, der Abschluss eines Bachelorstudiengangs in Informatik, Statistik- und/oder Informatikbezug anwenden. Mathematik oder verwandten Fächern eine Zugangsvo- Wir verwenden die folgenden Abkürzungen: raussetzung darstellt. Die dort bereits erlernten Inhalte variieren je nach Hochschule, können aber aufgrund der BM – Masterstudium Data Science nach einschlägigen Empfehlungen der Gesellschaft für Infor- Bachelorstudium Mathematik matik bzw. anderer Fachgesellschaften oder Akkreditie- BI – Masterstudium Data Science nach rungsagenturen eingeschätzt werden. Wir gehen zudem Bachelorstudium Informatik davon aus, dass ein*e Bewerber*in für ein Masterstudium BW – Masterstudium Data Science nach „Data Science“ Wahlmöglichkeiten zur Abdeckung der not- Bachelorstudium Wirtschaftsinformatik wendigen Kompetenzen weitgehend ausgenutzt hat. Sollte ein Masterstudiengang mehrere Zugangsmög- 6.1 MATHEMATIK UND STATISTIK lichkeiten besitzen, so bringen Studierende mit ein- Lineare Algebra schlägigem Vorstudium bereits relevante Vorkenntnisse Kann für BM, BI und BW als bekannt vorausgesetzt mit, während Studierende aus anderen Fächern diese werden. Inhalte vor oder während des Masterstudiums nachholen müssen. Bei der Curriculumsentwicklung eines solchen Optimierung und Simulation Masterstudiengangs können nicht alle eventuell aufzuho- Kann für BM und BW als bekannt vorausgesetzt werden, lenden Inhalte in regulären Modulen vermittelt werden, für BI nur vereinzelt. wenn der Durchschnitt der Vorkenntnisse der Studieren- Empfohlener Umfang: 2,5 LP für BI. den zu gering ist – je nach Vorstudium würden Studie- rende zu viel wiederholen müssen. Umgekehrt kann aber Analysis auch nicht die Vereinigung der Inhalte aller zugelassenen Kann für BM und BI als bekannt vorausgesetzt werden, Bachelorprogramme vorausgesetzt werden, denn dann für BW nur vereinzelt. müsste jede*r Studierende trotz erfüllter Zugangsvoraus- Empfohlener Umfang: 2,5 LP für BW. setzungen die Inhalte der jeweils anderen Bachelorstudi- engänge nachholen. Stochastik Kann für BM als bekannt vorausgesetzt werden, Wir empfehlen, für diese Konstellationen passende die Kompetenzen aus BI und BW reichen im Allgemeinen Angebote zu machen. Sollten die noch fehlenden Inhalte nicht aus. im Rahmen des Masterstudiums nachgeholt werden, so Empfohlener Umfang: 5 LP für BI und BW. kann dies durch sogenannte Synchronisationsmodule geschehen, also alternative Module, die je nach Bache- lorabschluss komplementär zu den bereits erworbenen 15 Auf eine wiederholte ausführliche Beschreibung der Kompetenzen sind. Eine andere Möglichkeit sind Modu- einzelnen Studieninhalte wird verzichtet, sie sind in Kapitel 5 le, die inhaltlich Bachelormodule umfassen, aber über zu finden.
15 Angewandte Statistik Algorithmen und Komplexität Kann für BW vorausgesetzt werden. Grundlagen können Kann für BI als bekannt vorausgesetzt werden, unter Be- für BM und BI vorausgesetzt werden, wobei viele Infor- rücksichtigung entsprechender individueller Ausrichtung matikstudiengänge den entsprechenden Empfehlungen im Mathematikstudium auch für BM. nicht folgen (vor einigen Jahren gehörte Statistik noch Empfohlener Umfang: 5 LP für BW nicht in den üblichen Fächerkanon der Informatik). Ex- plizite Statistikveranstaltungen kommen im Mathematik- studium meist nicht vor, Grundlagen der Statistik werden 6.3 DATA-SCIENCE-METHODEN dort aber als Teil der Stochastik mitbehandelt. Darüber Data-Science-Methoden kommen in den hier betrach- hinaus werden auch fortgeschrittene Inhalte der Statistik teten Bachelorstudiengängen in nicht nennenswertem benötigt, die Absolvent*innen eines Bachelorstudiums Umfang vor. Mathematik sich selbst erarbeiten können. Empfohlener Umfang: 2,5 LP für BI. Datenintegration Empfohlener Umfang: 5 LP 6.2 INFORMATIK UND PROGRAMMIERUNG Datenvisualisierung Grundlagen Programmierung Empfohlener Umfang: 2,5 LP Konzepte imperativer Programmierung können für BM, BI und BW als bekannt vorausgesetzt werden. Data Mining Empfohlener Umfang: 5 LP Fortgeschrittene Programmierung Im Bereich Data Science werden spezielle Programmier- Maschinelles Lernen sprachen wie Python oder R verwendet. Für BI und BW Empfohlener Umfang: 10 LP kann vorausgesetzt werden, dass Absolvent*innen sich diese Sprachen ohne Aufwand selbst aneignen können. Deep Learning und weitere KI-Methoden Zudem sind Fertigkeiten im Umgang mit Programment- Empfohlener Umfang: 5 LP wicklungsumgebungen notwendig. Empfohlener Umfang: 2,5 LP für BM (bei praktischen Übungen mehr). 6.4 INTERDISZIPLINÄRE ASPEKTE Interdisziplinäre Aspekte kommen in den hier betrach- IT-Infrastrukturen teten Bachelorstudiengängen in nicht nennenswertem Kann nur für BI vorausgesetzt werden. Umfang vor. Empfohlener Umfang: 2,5 LP für BM und BW. Datenethik Software Engineering Empfohlener Umfang: 5 LP Kann für BI und BW als größtenteils bekannt vorausge- setzt werden, auch wenn nicht alle für Software Enginee- Data Privacy und weitere juristische Aspekte ring relevanten Konzepte (z. B. Anforderungserhebung Empfohlener Umfang: 2,5 LP oder Entwicklungsprozesse) überall in gleicher Tiefe gelehrt werden. Projektmanagement, Soft Skills, interdisziplinäre Empfohlener Umfang: 5 LP für BM. Kommunikation Empfohlener Umfang: 2,5 LP Datenbanken und Big Data Kann für BI und BW als bekannt vorausgesetzt werden, Datenökomomie auch wenn nicht alle für Data Science relevanten Konzep- Empfohlener Umfang: 2,5 LP te (NoSQL, Cloud, Big Data) überall gelehrt werden. Empfohlener Umfang: 5 LP für BM. 6.5 ANWENDUNG VON DATA SCIENCE IN DER DOMÄNE Data Governance und IT-Sicherheit Empfohlener Umfang: 15 LP Kann für BI und BW als bekannt vorausgesetzt werden, auch wenn nicht alle für Data Science relevanten Konzep- te überall gelehrt werden. Empfohlener Umfang: 5 LP für BM.
16 6.6 TABELLARISCHE DARSTELLUNG DES CURRICULUMS Für die drei betrachteten Möglichkeiten eines Masterstu- diums „Data Science“ nach Bachelor Mathematik (BM), Informatik (BI) und Wirtschaftsinformatik (BW) werden im Folgenden die Summen der erforderlichen Leistungs- punkte berechnet. KOMPETENZEN LP BM BI BW Fortgeschrittene Mathematik und Statistik 20 0 10 7,5 Lineare Algebra 5 Optimierung und Simulation 2,5 2,5 Analysis 2,5 2,5 Stochastik 5 5 5 Angewandte Statistik 5 2,5 Informatik und Programmierung 30 20 0 7,5 Grundlagen Programmierung 5 Fortgeschrittene Programmierung 2,5 2,5 IT-Infrastrukturen 2,5 2,5 2,5 Software Engineering 5 5 Datenbanken und Big Data 5 5 Data Governance und IT-Sicherheit 5 5 Algorithmen und Komplexität 5 5 Data-Science-Methoden 27,5 27,5 27,5 27,5 Datenintegration 5 5 5 5 Datenvisualisierung 2,5 2,5 2,5 2,5 Data Mining 5 5 5 5 Maschinelles Lernen 10 10 10 10 Deep Learning und weitere KI-Methoden 5 5 5 5 Interdisziplinäre Aspekte 12,5 12,5 12,5 12,5 Datenethik 5 5 5 5 Data Privacy und weitere juristische Aspekte 2,5 2,5 2,5 2,5 Projektmanagement 2,5 2,5 2,5 2,5 Datenökonomie 2,5 2,5 2,5 2,5 Domänenprojekt 15 15 15 15 Summe 105 75 65 70
17 6.7 ABSCHLIESSENDE EMPFEHLUNGEN Die Kompetenzen eines Masterstudiengangs „Data Bei einem viersemestrigen Studium stehen 120 LP zur Science“ erfordern – zusammen mit einem vorausge- Verfügung, bei einem dreisemestrigen Studium 90 LP. Es henden Bachelorstudiengang – für die zwingend not- bleibt daher nur wenig Raum (25-55 LP) für vertiefende wendigen Bestandteile 105 LP, davon fallen 30-40 LP in Module und ein Abschlussmodul, was bei einem nicht die Bachelorstudiengänge Mathematik, Informatik oder streng konsekutiven Masterstudiengang allerdings nicht Wirtschaftsinformatik. Geht man von einer zusätzlichen überrascht. Das Abschlussmodul kann entweder eine Vertiefung oder einem Nebenfach im Bereich der Infor- Abschlussarbeit im Umfang von 30 LP sein, oder aber matik in einem Mathematikstudium (und entsprechenden eine Kombination aus Abschlussarbeit mit 15 LP und Vertiefungen in einem Bachelorstudium der Wirtschafts- einem Data Science Projekt in der Domäne. Unter den informatik) aus, so verbleiben 65 LP für verpflichtende weiteren Modulen sollte verpflichtend ein Seminar sein. Module im Masterstudium „Data Science“. Umfasst die Die Beschäftigung mit dem aktuellen Forschungsstand Zugangsvoraussetzung weitere, verwandte Bachelorstu- bereitet auf die Abschlussarbeit vor. Die Präsentation und diengänge, dürfte diese Zahl eher höher ausfallen (bei ggfs. Ausarbeitung stellen zusätzliche relevante Prüfungs- einem Bachelorstudiengang „Data Science“ oder Statistik formen dar. Ergänzende Module können zur Profilbildung eher geringer). In diesen Fällen sollte den Studierenden eines Masterstudiengangs „Data Science“ dienen. Dabei die Möglichkeit angeboten werden, fehlende Kompeten- sollen den Studierenden in angemessener Weise Wahl- zen durch zusätzliche Brückenkurse zu erwerben. möglichkeiten angeboten werden.
18 LITERATUR [AIHLEG2019] High-Level Expert Group on Artificial [GI2017] Gesellschaft für Informatik e.V. (2017): Intelligence (2019): Ethics Guidelines for Trustworthy AI, Rahmenempfehlungen für die Ausbildung in Wirtschafts- https://digital-strategy.ec.europa.eu/en/library/ informatik an Hochschulen, ethics-guidelines-trustworthy-ai. https://dl.gi.de/handle/20.500.12116/2352. (Abgerufen am 21.06.2021). (Abgerufen am: 10.06.2021). [ASIIN2016] ASIIN e.V. (2016): Fachspezifisch Ergänzende [GI2019] Gesellschaft für Informatik e.V. (2019): Hinweise des Fachausschusses 12 – Mathematik – zur Arbeitspapier Data Science: Lern- und Ausbildungsinhalte, Akkreditierung von Bachelor- und Masterstudiengängen https://gi.de/fileadmin/GI/Allgemein/PDF/GI_Arbeitspa- Mathematik, pier_Data-Science_2019-12_01.pdf. https://www.asiin.de/files/content/kriterien/ASIIN_ (Abgerufen am: 10.06.2021). FEH_12_Mathematik_2016-12-09.pdf. (Abgerufen am: 10.06.2021). [Hachmeister2021] Hachmeister, N., Theiß, J., Weiß, K., & Decker, R. (2021): Balancing Plurality and Educational [BMI2019] Bundesministerium des Innern, für Bau und Essence: Higher Education Between Data-Competent Heimat (2019): Gutachten der Datenethikkommission, Professionals and Data Self-Empowered Citizens, Data, https://www.bmi.bund.de/SharedDocs/downloads/DE/ 6, 2, 1-15. DOI: https://doi.org/10.3390/data6020010. publikationen/themen/it-digitalpolitik/gutachten- datenethikkommission.html. [LernendeSysteme2020] Lernende Systeme – (Abgerufen am: 13.04.2021). Die Plattform für Künstliche Intelligenz (2020): Von Daten zu KI. Intelligentes Datenmanagement als Ba- [Bundesregierung2021] Die Bundesregierung (2021): sis für Data Science und den Einsatz Lernender Systeme, Datenstrategie der Bundesregierung, https://www.plattform-lernende-systeme.de/files/ https://www.bundesregierung.de/breg-de/suche/ Downloads/Publikationen/AG1_Whitepaper_Von_ datenstrategie-der-bundesregierung-1845632. Daten_zu_KI.pdf. (Abgerufen am: 21.06.2021). (Abgerufen am 21.06.2021). [Filipovic2015] Filipovic, A. (2015): [Lübcke2018] Lübcke, M.; Wannemacher, K.: Vermittlung Die Datafizierung der Welt. Eine ethische Vermessung des von Datenkompetenzen an den Hochschulen: Studien- digitalen Wandels, Communicatio Socialis, 48, 1, 6–15. angebote im Bereich Data Science, Forum Hochschulent- DOI: 10.5771/0010-3497-2015-1-6. wicklung 01/2018. [GI2016] Gesellschaft für Informatik e.V. (2016): [Sambasivan2021] Sambasivan, N., Kapania, S., Highfill, H., Empfehlungen für Bachelor- und Masterprogramme im Akrong, D., Paritosh, P. K., & Aroyo, L. M. (2021): “Everyone Studienfach Informatik an Hochschulen, wants to do the model work, not the data work”: https://dl.gi.de/bitstream/handle/20.500.12116/ Data Cascades in High-Stakes AI, CHI Conference on 2351/58-GI-Empfehlungen_Bachelor-Master- Human Factors in Computing Systems, CHI ’21. Informatik2016.pdf?sequence=1&isAllowed=y. (Abgerufen am: 10.06.2021).
Sie können auch lesen