Weiterbildungsprogramm Statistical Data Science
←
→
Transkription von Seiteninhalten
Wenn Ihr Browser die Seite nicht korrekt rendert, bitte, lesen Sie den Inhalt der Seite unten
Weiterbildungsprogramm Statistical Data Science CAS in Statistical Data Science 2020/2021 CAS in Advanced Statistical Data Science 2021/2022 DAS / MAS in Statistical Data Science 753095730157340153740388273817107019837530009034175134057430578101780785734857284572 572385738573897589347583758784738752710871874857081758197981738785787872875184657146 7560374263476014712453207845037245703275426987332426348WAHRSCHEINLICHKEIT38462340 49823642984KLASSIFIKATION431982462346234706243641046013244602374636410283641304632 84352845230482515234603926423984620431563265382576013423000009832436248946832642387 403726423764230742735472034523074632046230403249823043243943264182SIGNIFIKANZ643284 843192841389624896402938463298746290364320984689234639264329846320984609249328642908 62389463208964208964890264024887462903643209846892346392133355968635161684523264975 848465135SCHÄTZUNG648435135135464798435132135963246284672364236482462348623413298 301246283091462084601964786324098632890643VERTRAUENSINTERVALL2013246281046120976 89326420398462308946237575132073135469751354384354351346835142301461234750713412364 6487254345454321STATISTIKSOFTWARE518045230874532805180451072845237045237457124501 32547321543245320473048724258452370453242537313546879843513546584768473131358468731 1324572342580718235172074353745732543254237457354275357453PRÄDIKTION284325487235432 572547324537284527345237451238704532845237845271035478123547832547832154128734512780 246328563345337MODELL4632074632704620374607182364723642013784620718346230745720342 452037840234520374235724083207483805754354357204573254702345702345237045372045372457 24532078450372457032754324725373473245345VISUALISIERUNG872648326432864374574578234 45304325078432845320784507238457382453078408434863784384538453208435704340832548034 30937ZUSAMMENHANG089543564308564389506438095630489653084650836501670516057610235 7524307564057485475463750463754635784365784365704836ZUFALLSVARIABLE574385430540354 634057403570436504750435607438305640738385674083564736574365746574657283483650873658 734657834655783483054354830567483254356478568746547567843654765475647865745640856043 44319824623462347062436410460132446023746364102836413046328654170123843528452304825 392642398462043156326538257601342300000983243624894683264238764326040372642376423074
Weiterbildungsprogramm Statistical Data Science In Naturwissenschaft, Technik, Politik, Soziologie, Wirtschaft, Medizin usw. spielt die Analyse von Daten eine immer wichtigere Rolle, und auch in den Medien werden viele Themen anhand von Grafiken und statistischen Analysen erläutert. Grundlagen der Statistik sind dementsprechend heute Bestandteil vieler Studiengänge, und ein grundlegendes Verständnis für Zahlen und numerische Argumentationen wird als selbstverständlich vorausgesetzt. Viele WissenschaftlerInnen sehen sich aber in der Praxis mit sehr umfassenden Fragen konfrontiert, die mit Grundlagenkenntnissen nicht mehr lösbar sind. Zwar können heute mit dem Computer und entsprechender Software auch komplexe Datenanalysen leicht durchgeführt werden, aber eine sinnvolle Interpretation der Resultate ist ohne Sachverständnis kaum mehr möglich. Unser Weiterbildungsprogramm richtet sich deshalb an wissenschaftlich tätige Frauen und Männer an Hochschulen, in der Privatwirtschaft und in der öffentlichen Verwaltung, die in ihrer täglichen Arbeit bei der Datenauswertung an ihre Grenzen stossen. Das Programm bietet die Möglichkeit, die bestehenden statistischen Grundkenntnisse deutlich zu erweitern, aus der statistischen Perspektive einen Einblick ins weite Feld der Data Science zu erhalten und die Methodenkenntnisse in angewandter Statistik dem eigenen Bedarf entsprechend zu vertiefen. Die Programmleitung Prof. Dr. Johanna F. Ziegel Prof. em. Dr. Jürg Hüsler Prof. Dr. Ilya Molchanov Dr. Michael Vock 2 Weiterbildungsprogramm Statistical Data Science 2020–2023
Das Weiterbildungsprogramm in Stichworten Modular: Den Kern des Weiterbildungs- Praxisorientiert: Das Weiterbildungs- programms bilden zwei aufeinander programm umfasst eine Einführung in die aufbauende CAS-Studiengänge Programmierung mit der Statistik- (Certificate of Advanced Studies). Wer Software R, die gratis verfügbar ist und beide CAS-Studiengänge absolviert hat, fast unbegrenzte statistische Möglich- kann diese zu einem DAS (Diploma of keiten bietet. Programmiererfahrung wird Advanced Studies) ausbauen; dieses dabei nicht vorausgesetzt. Die vor- lässt sich wiederum zu einem MAS gestellten Methoden werden mit Hilfe von (Master of Advanced Studies) erweitern. passenden R-Paketen auf Beispiele aus Teilnehmende mit entsprechenden Wissenschaft und Alltag angewendet. Auf Vorkenntnissen (z. B. aus einem anderen weitere Software-Tools wird wenn immer CAS-Studiengang) können auch direkt in möglich verzichtet, um technische den zweiten CAS-Studiengang Hürden zu vermeiden. einsteigen. Der Besuch einzelner Module Theoretisch fundiert: Die Studiengänge aus den CAS-Studiengängen ist sind universitäre Weiterbildungen mit ent- ebenfalls möglich. sprechendem Niveau. Neben der prakti- Vielseitig anwendbar: Das Programm schen Anwendung der Methoden werden richtet sich an HochschulabsolventInnen auch die wichtigsten theoretischen aller Fachrichtungen mit statistischen Grundlagen besprochen. Dies ermöglicht Grundkenntnissen. Die CAS- und DAS- den Teilnehmenden ein vertieftes Ver- Studiengänge decken eine breite Palette ständnis der verschiedenen Methoden statistischer Methoden und Modelle ab. sowie deren Möglichkeiten und Grenzen. Im MAS-Studiengang, für den zusätzliche Berufsbegleitend: In den CAS- mathematische Vorkenntnisse vorausge- Studiengängen findet pro Woche ein setzt werden, lässt sich dieses Spektrum Kurstag statt (Freitag). nochmals erweitern und vertiefen. Bewährt: Dieses Programm ist eine Flexibel: In den CAS-Studiengängen Weiterentwicklung des bisherigen Weiter- wählen die Teilnehmenden neben den bildungsprogramms in angewandter Pflichtmodulen eines von zwei bzw. Statistik am Institut für mathematische drei von fünf angebotenen Wahlmodulen Statistik und Versicherungslehre (IMSV), und können dadurch eigene thematische an dem seit 1994 über 400 Personen Schwerpunkte setzen. teilgenommen haben. Inhalt Übersicht über die Studiengänge 4 Kursdaten CAS-/DAS-Studiengänge 2020–2023 6 Praktische Informationen und Organisatorisches 8 Administrative Informationen 11 Modulbeschreibungen CAS SDS 2020/2021 13 Modulbeschreibungen CAS ASDS 2021/2022 16 Weiterbildungsprogramm Statistical Data Science 2020–2023 3
Übersicht über die Studiengänge Das Weiterbildungsprogramm umfasst zwei aufeinander aufbauende CAS-Studiengänge, CAS SDS die zusammen mit einer Diplomarbeit zu einem DAS-Studiengang ausgebaut werden können. Dieser DAS-Studiengang kann CAS ASDS wiederum zu einem MAS-Studiengang DAS SDS erweitert werden. Soweit freie Plätze vorhanden sind, können MAS SDS die Module der beiden CAS-Studiengänge auch einzeln besucht werden (siehe Seite 12). CAS in Statistical Data Science (CAS SDS) 16 ECTS-Credits September 2020 bis Juni 2021 Die Teilnehmenden lernen die zentralen Methoden und 24 Kurstage Modelle der angewandten Statistik, Methoden zur verteilt auf 26 Kalendertage Visualisierung von Daten sowie die Grundlagen der (jeweils Freitag, siehe Seite 6) Programmierung in der Statistik-Software R kennen. Anmeldefrist: 31.05.2020 Pflichtmodule: Kursgeld: 5500 CHF (ohne Projektarbeit) / • Deskriptive Statistik und Wahrscheinlichkeitsrechnung 6200 CHF (mit Projektarbeit) • Statistik-Software und Visualisierung von Daten • Schliessende Statistik • Einführung in lineare Modelle • Nichtparametrische Methoden • Einführung in die Klassifikation Wahlmodule (fürs CAS SDS ist 1 Wahlmodul erforderlich): • Vertiefung lineare und verallgemeinerte lineare Modelle • Vertiefung Klassifikation und maschinelles Lernen Als freiwillige Ergänzung des Studiengangs kann unter der Leitung einer Dozentin oder eines Dozenten in einer Projektarbeit eine Problemstellung aus dem persönlichen, beruflichen bzw. wissenschaftlichen Umfeld bearbeitet werden. Für die Betreuung wird eine zusätzliche Gebühr verrechnet. 4 Weiterbildungsprogramm Statistical Data Science 2020–2023
CAS in Advanced Statistical Data Science 16 ECTS-Credits (CAS ASDS) September 2021 bis Juni 2022 21.5 Kurstage Aufbauend auf den Vorkenntnissen aus dem CAS SDS verteilt auf 24 Kalendertage (oder äquivalenten Vorkenntnissen) lernen die (jeweils Freitag, siehe Seite 7) Teilnehmenden fortgeschrittene und spezialisierte Anmeldefrist: 31.05.2021 statistische Methoden und Modelle kennen. Kursgeld: 5500 CHF (3 bis 4 Wahlmodule) / Pflichtmodule: 6100 CHF (5 Wahlmodule) • Unüberwachtes Lernen und Dimensionsreduktion • Lineare gemischte Modelle • Analyse kategorieller Daten • Rechenintensive Verfahren • Bayes-Statistik • Prädiktion • Praxismodul mit Fragestellungen der Teilnehmenden Wahlmodule (fürs CAS ASDS sind 3 Wahlmodule erforderlich): • Analyse hochdimensionaler Daten • Zeitreihenanalyse • Analyse von Ereigniszeiten • Versuchsplanung • Fortgeschrittene nichtparametrische Methoden In einem Praxismodul werden ausserdem die Methoden aus den Modulen beider CAS-Studiengängen auf Daten und Fragestellungen der Teilnehmenden angewendet. DAS in Statistical Data Science (DAS SDS) 36 ECTS-Credits September 2020 Der DAS-Studiengang umfasst das Programm der bis August 2022 oder Januar 2023 beiden CAS-Studiengänge, ergänzt durch eine DAS- 47.5 Kurstage Arbeit. In dieser bearbeiten die Teilnehmerinnen und verteilt auf 52 Kalendertage Teilnehmer in der Regel Probleme, die aus dem eigenen (in der Regel Freitag, siehe Seiten 6–7) Arbeitsbereich stammen oder mit diesem zusammen- Anmeldefrist für die Erweiterung zum DAS: 31.10.2021 hängen. Die DAS-Arbeit wird entweder parallel zum zweiten Semester des CAS ASDS oder im Anschluss Kursgeld: 1750 CHF (zusätzlich zu den CAS-Kursgeldern) daran verfasst und an der Diplomprüfung in einem Vortrag mit anschliessender Diskussion vorgestellt. MAS in Statistical Data Science (MAS SDS) 60 ECTS-Credits Individuelles Programm Zusätzlich zum Programm des DAS-Studiengangs nach Abschluss des DAS SDS umfasst der MAS-Studiengang Lehrveranstaltungen aus (weitere 3 bis 5 Semester) dem regulären Masterprogramm in Statistik und Data Kursgeld: 6000 CHF Science im Umfang von 18 ECTS-Credits sowie eine (zusätzlich zu den CAS- und DAS-Kursgeldern) MAS-Arbeit. Weiterbildungsprogramm Statistical Data Science 2020–2023 5
Kursdaten CAS-/DAS-Studiengänge Provisorisches Programm: Bei kurzfristiger Verhinderung der Dozierenden werden die Module nach Möglichkeit anders auf die geplanten Kurstage verteilt. Nur wenn ein solcher Abtausch zwischen den Modulen nicht möglich ist, werden die „Reserve“-Tage belegt. Kursdaten/Detailprogramm CAS SDS 2020/2021 Vormittag Nachmittag Fr, 18.09.2020 Fr, 25.09.2020 Deskriptive Statistik Fr, 02.10.2020 und Fr, 09.10.2020 Wahrscheinlichkeitsrechnung Fr, 16.10.2020 Fr, 23.10.2020 Reserve (voraussichtlich frei) Fr, 30.10.2020 Leistungskontrolle Fr, 06.11.2020 Statistik- Fr, 13.11.2020 Software Fr, 20.11.2020 Schliessende und Fr, 27.11.2020 Statistik Visualisierung Fr, 04.12.2020 von Daten Fr, 11.12.2020 Fr, 18.12.2020 Reserve (voraussichtlich frei) Fr, 22.01.2021 Leistungskontrolle Fr, 26.02.2021 Fr, 05.03.2021 Fr, 12.03.2021 Einführung Fr, 19.03.2021 in Nicht- Fr, 26.03.2021 lineare parametrische Fr, 02.04.2021 Karfreitag (frei) Fr, 09.04.2021 Modelle Methoden Fr, 16.04.2021 Reserve (vor. frei) Fr, 23.04.2021 Leistungskontrollen Fr, 30.04.2021 Einführung in die Fr, 07.05.2021 Klassifikation Fr, 14.05.2021 Freitag nach Auffahrt (frei) Fr, 21.05.2021 Vertiefung lineare/verallg. lin. Modelle Fr, 28.05.2021 Vertiefung Klassifikation Fr, 04.06.2021 Vertiefung lineare/verallg. lin. Modelle Fr, 11.06.2021 Vertiefung Klassifikation Fr, 18.06.2021 Reserve (voraussichtlich frei) Fr, 25.06.2021 Leistungskontrollen 6 Weiterbildungsprogramm Statistical Data Science 2020–2023
Kursdaten CAS ASDS 2021/2022 Vormittag Nachmittag Fr, 17.09.2021 Fr, 24.09.2021 Pflicht- Pflicht- Fr, 01.10.2021 modul modul Fr, 08.10.2021 Fr, 15.10.2021 Reserve (voraussichtlich frei) Fr, 22.10.2021 Leistungskontrollen Fr, 29.10.2021 Fr, 05.11.2021 Pflicht- Pflicht- Fr, 12.11.2021 modul modul Fr, 19.11.2021 Fr, 26.11.2021 Wahlmodul A Fr, 03.12.2021 Wahlmodul B Fr, 10.12.2021 Wahlmodul A Fr, 17.12.2021 Wahlmodul B Fr, 21.01.2022 Leistungskontrollen Fr, 25.02.2022 Fr, 04.03.2022 Pflicht- Pflicht- Fr, 11.03.2022 modul modul Fr, 18.03.2022 Fr, 25.03.2022 Reserve (voraussichtlich frei) Fr, 01.04.2022 Leistungskontrollen Fr, 08.04.2022 Wahlmodul C Fr, 15.04.2022 Karfreitag (frei) Fr, 22.04.2022 Wahlmodul D Fr, 29.04.2022 Wahlmodul E Fr, 06.05.2022 Wahlmodul C Fr, 13.05.2022 Wahlmodul D Fr, 20.05.2022 Wahlmodul E Fr, 27.05.2022 Freitag nach Auffahrt (vorauss. frei) Fr, 03.06.2022 Leistungskontrollen Fr, 10.06.2022 Praxis- Fr, 17.06.2022 modul Die Zuteilung der Module auf diese Daten erfolgt später. Zusätzliche Kursdaten DAS SDS 2020–2023 Do, 25.08.2022 Diplomprüfung Fr, 26.08.2022 Gruppe 1 Do, 26.01.2023 Diplomprüfung Fr, 27.01.2023 Gruppe 2 Die effektiv benötigte Anzahl der Diplomprüfungs-Tage hängt von der Anzahl Teilnehmender pro Gruppe ab. Weiterbildungsprogramm Statistical Data Science 2020–2023 7
Praktische Informationen und Organisatorisches Unterrichtsform und -sprache, Tagesablauf, Kursort Die Präsenzzeit ist für die meisten Module der CAS- Studiengänge in Theorie- und Übungsstunden gegliedert. In den Übungsstunden wenden die Teilnehmenden die erlernten Methoden auf Beispieldaten an. Zum besseren Verständnis werden einfache Beispiele Schritt für Schritt auf Papier bzw. mit dem Taschenrechner gelöst; daneben wird die praxisnahe Anwendung der Methoden mit Statistik-Software auf dem Laptop geübt. Die Übungs- stunden werden von Assistierenden des IMSV betreut und mit ausführlichen Musterlösungen dokumentiert. Pro Kurstag findet üblicherweise am Vor- und Nachmittag je eine Doppelstunde Theorie statt, dazu kommen insgesamt drei Übungslektionen, verteilt auf Vor- und Nachmittag: 09:15–11:00 Theorieblock 1 11:15–12:15 Übungsblock 1 13:15–15:00 Theorieblock 2 15:15–16:45 Übungsblock 2 Der Aufwand für die Vor- und Nachbereitung ausserhalb der Präsenzzeit hängt stark von der Vorbildung ab; er beträgt in der Regel mindestens einen Tag pro Kurstag. Unterrichtssprache ist in den CAS- und DAS-Studien- gängen in der Regel Deutsch, in einzelnen Fällen Englisch. Die Veranstaltungen finden in Räumlichkeiten der Universität Bern statt, die vom Hauptbahnhof aus zu Fuss innert 5 bis 10 Minuten erreichbar sind. Die zusätzlichen Lehrveranstaltungen im Rahmen des MAS-Studiengangs werden in der Regel auf Englisch durchgeführt und umfassen neben den Theoriestunden häufig ebenfalls Übungsstunden. Dozierende Die einzelnen Module werden von Hochschuldozierenden sowie von erfahrenen Expertinnen und Experten aus der Praxis unterrichtet. 8 Weiterbildungsprogramm Statistical Data Science 2020–2023
Statistik-Software und Computer Im Rahmen des CAS SDS findet eine Einführung in die Statistik-Software R statt, die in den weiteren Modulen beider CAS-Studiengänge verwendet wird und gratis verfügbar ist (www.r-project.org). Die Teilnehmenden benutzen R auf ihren eigenen Laptops; die Universität Bern stellt keine Computer zur Verfügung. Wahlmodule Im CAS SDS muss eines der beiden angebotenen Wahlmodule besucht und erfolgreich abgeschlossen werden, im CAS ASDS drei der fünf angebotenen Wahlmodule. (Das Angebot an Wahlmodulen im CAS ASDS wird jeweils pro Durchführung festgelegt.) Die Teilnehmenden geben ihre Wahlmodule bei der Anmeldung zum jeweiligen CAS-Studiengang an. Solange freie Plätze verfügbar sind, kann ein gewähltes Modul nachträglich durch ein anderes ersetzt werden (bis spätestens einen Monat vor Modulbeginn). Der Besuch zusätzlicher Wahlmodule des jeweiligen Studiengangs ist möglich. Pro CAS-Studiengang kann ein zusätzliches Wahlmodul ohne weitere Kosten besucht werden; beim Besuch aller fünf Wahlmodule im CAS ASDS wird eine zusätzliche Gebühr verrechnet. Werden mehr Wahlmodule besucht, als für den Abschluss erforderlich sind, so genügt es, wenn die gemäss Reglement benötigte Anzahl Wahlmodule mit einer bestandenen Leistungskontrolle abgeschlossen wird. Weiterbildungsprogramm Statistical Data Science 2020–2023 9
Abschlussarbeiten (DAS-/MAS-Studiengang) In der DAS- bzw. MAS-Arbeit bearbeiten die Teilnehmenden in der Regel Problemstellungen, die aus dem eigenen Arbeitsbereich stammen oder mit diesem zusammenhängen, in der MAS-Arbeit allenfalls auch solche im Zusammenhang mit einer der besuchten Lehr- veranstaltungen. Der Bearbeitungsaufwand soll bei der DAS-Arbeit ca. 2.5 bis 3 Arbeitswochen, bei der MAS- Arbeit ca. 4 Arbeitswochen betragen. Die Abschlussarbeiten werden durch eine Expertin bzw. einen Experten aus der Wissenschaft oder der Praxis betreut und beurteilt. In der Regel handelt es sich dabei um Dozierende des Weiterbildungsprogramms. Nach der Abgabe der schriftlichen Arbeit wird diese durch die Teilnehmerin bzw. den Teilnehmer in einem Vortrag mit anschliessender Diskussion vorgestellt. Die Bewertung dieser Diplom- bzw. Masterprüfung fliesst in die Bewertung der DAS- bzw. MAS-Arbeit ein. Projektarbeit (CAS SDS) Teilnehmende des CAS SDS können freiwillig ein statistisches Problem aus ihrem eigenen Arbeitsgebiet bearbeiten; die Anmeldung dafür erfolgt während dem Studiengang. Die Projektarbeit soll einen Arbeitsaufwand von ungefähr einer Arbeitswoche umfassen und wird von einer Dozentin oder einem Dozenten betreut. Dafür wird eine zusätzliche Gebühr verrechnet. 10 Weiterbildungsprogramm Statistical Data Science 2020–2023
Administrative Informationen Zulassungsbedingungen Präsentation und einem schriftlichen Für alle Studiengänge werden ein Bericht besteht. abgeschlossenes Hochschulstudium Die zusätzlichen Lehrveranstaltungen im (Universität/Fachhochschule) und MAS-Studiengang werden mit elementare Vorkenntnisse in Statistik im schriftlichen oder mündlichen Prüfungen Umfang einer Einführungsvorlesung an abgeschlossen. einer Hochschule vorausgesetzt. Nicht bestandene Leistungskontrollen Fürs CAS ASDS ist ausserdem ein können einmal wiederholt werden. erfolgreicher Abschluss des CAS SDS Die Teilnehmenden sollten sich die erforderlich (oder dazu äquivalente Termine der Leistungskontrollen Vorkenntnisse). Teilnehmende des CAS unbedingt freihalten. Insbesondere ASDS können im Hinblick auf die können Abwesenheiten aus beruflichen Erweiterung zum DAS SDS die DAS- Gründen nicht als Entschuldigung Arbeit beginnen, sobald sie mindestens akzeptiert werden. Es ist deshalb die Leistungskontrollen zu den Pflicht- empfehlenswert, diese Termine frühzeitig modulen des ersten Semesters des CAS mit dem Arbeitgeber abzusprechen. ASDS bestanden haben. Für die Erweiterung vom DAS SDS zum MAS Präsenzpflicht SDS wird die Eignung bezüglich Die Teilnahme an den Veranstaltungen mathematischer Vorkenntnisse vor der (Pflichtmodule, gewählte Wahlmodule, Zulassung zu den weiterführenden Lehr- Leistungskontrollen inkl. Diplom- bzw. veranstaltungen und der MAS-Arbeit Masterprüfungen) ist grundsätzlich vertieft abgeklärt. obligatorisch. Für die Veranstaltungen Ausnahmen von den Zulassungs- eines Studiengangs sind insgesamt bedingungen kann die Programmleitung mindestens 80% Präsenzzeit „sur dossier“ genehmigen. erforderlich. Darüber hinausgehende Absenzen können in Absprache mit der Leistungskontrollen zu den Studienleitung kompensiert werden. Bei Modulen den Leistungskontrollen werden nur Die meisten Module der CAS- Absenzen aus schwer wiegenden Studiengänge werden mit schriftlichen Gründen akzeptiert (insbesondere bei Leistungskontrollen abgeschlossen. Krankheit, die mit einem Arztzeugnis Ausnahmen sind das Modul zur Statistik- belegt wird). Software und Visualisierung von Daten (CAS SDS), das mit einer Hausarbeit abgeschlossen wird, sowie das Praxismodul (CAS ASDS), bei dem der Leistungsnachweis aus einer Weiterbildungsprogramm Statistical Data Science 2020–2023 11
Besuch einzelner Module Die Erweiterung der beiden CAS- Der Besuch einzelner Module ist grund- Studiengänge zum DAS kostet zusätzlich sätzlich möglich. Bei grosser Nachfrage 1750 CHF, die Erweiterung vom DAS haben Teilnehmende eines ganzen CAS- zum MAS weitere 6000 CHF. Studiengangs Priorität. Die Modul- auswahl muss unter Berücksichtigung Anmeldung der fachlichen Voraussetzungen und der Der Einstieg ins Weiterbildungs- freien Plätze mit der Studienleitung programm erfolgt im Normalfall über das abgesprochen werden. CAS SDS. Das entsprechende Anmeldeformular liegt dieser Broschüre Teilnehmende mit weitergehenden bei. Die Anmeldefrist läuft bis am 31. Mai statistischen Vorkenntnissen 2020. Statistik-Grundkenntnisse im Umfang InteressentInnen mit weitergehenden einer Einführungsvorlesung werden als Vorkenntnissen, die direkt in andere Grundlage für den Einstieg ins CAS SDS Programmteile einsteigen möchten, vorausgesetzt. Diese Grundlagen werden kontaktieren bitte frühzeitig die zu Beginn aufgefrischt und, wo nötig, Studienleitung. ergänzt. Die Anzahl der Kursplätze ist beschränkt. Teilnehmende, die deutlich um- Über die Durchführung entscheidet die fassendere Vorkenntnisse mitbringen Programmleitung nach Ablauf der (beispielsweise aufgrund eines Studiums Anmeldefrist. Ein Rückzug der An- oder einer Weiterbildung zu einem meldung vor dem Anmeldeschluss ist ähnlichen Thema), können sich unter ohne Kostenfolge möglich. Bei Rücktritt gewissen Bedingungen externe nach Ablauf der Anmeldefrist muss das Leistungen an einen der hier beschrie- ganze Kursgeld bezahlt werden. Falls mit benen Studiengänge anrechnen lassen Einverständnis der Kursleitung ein Ersatz bzw. brauchen bereits erbrachte gefunden werden kann, wird ein Leistungen nicht nochmals zu erbringen Verwaltungskostenhonorar von 200 CHF (Erlass). Weitere Angaben finden sich in in Rechnung gestellt. Art. 21–24 des Reglements; genauere Auskunft gibt die Studienleitung. Weitere Informationen, Reglement, Kontakt Kosten, Rechnungsstellung Auf der Website zum Weiterbildungs- Die Kosten betragen 5500 CHF für einen programm (www.imsv.unibe.ch/wbp) sind CAS-Studiengang (CAS SDS oder CAS zusätzliche und ggf. aktualisierte ASDS) mit allen obligatorischen Studien- Informationen verfügbar. Dort sind auch gangselementen. Für die freiwillige das Reglement für die Weiterbildungs- Projektarbeit werden zusätzlich 700 CHF studiengänge in Statistical Data Science verrechnet, für den freiwilligen Besuch sowie die darauf basierenden Studien- von mehr als einem zusätzlichen pläne zu den einzelnen Studiengängen Wahlmodul im Rahmen eines CAS- abrufbar. Weitere Kontaktangaben finden Studiengangs 600 CHF. sich auf der Umschlagrückseite. 12 Weiterbildungsprogramm Statistical Data Science 2020–2023
Modulbeschreibungen CAS SDS 2020/2021 Deskriptive Statistik und 3 ECTS-Credits, 10 Halbtage Wahrscheinlichkeitsrechnung Stichworte: Skalenniveaus, Diagramme, wichtige Kenn- Dieses Modul dient dazu, eine gemeinsame Basis aus zahlen, Grundbegriffe der einfachen Begriffen der Statistik und aus den Grund- Wahrscheinlichkeitsrechnung, lagen der Wahrscheinlichkeitstheorie zu schaffen. Im wichtige diskrete und absolut stetige Verteilungen und ihre ersten Teil wird die deskriptive Statistik repetiert. Eigenschaften, mathematische Insbesondere werden die verschiedenen Arten von Grundbegriffe Daten, die Kennzahlen einer Stichprobe und die Voraussichtlicher Dozent: typischen Darstellungsformen behandelt. Der zweite Prof. em. Dr. Jürg Hüsler Teil ist der Wahrscheinlichkeitsrechnung gewidmet. Das Hauptaugenmerk gilt den Zufallsvariablen, ihren Verteilungen und ihren Kennzahlen. Ausserdem werden wichtige mathematische Grundlagen repetiert, die in diesem und weiteren Modulen benötigt werden. Statistik-Software und Visualisierung von 2.5 ECTS-Credits, 7 Halbtage Daten Stichworte: Grundlagen der Programmierung in der Software In diesem Modul erwerben die Teilnehmenden R, Datenaufbereitung in R, Grundkenntnisse zur Programmierung in einer beschreibende Statistik in R, Statistik-Software, die in den weiteren Modulen fortgeschrittene Visualisierungs- methoden verwendet wird. Im Vordergrund stehen die Datenaufbereitung und die deskriptive Statistik. Aus Voraussichtlicher Dozent: Dr. Michael Vock dem vorangehenden Modul bereits bekannte Diagramme sowie fortgeschrittene Visualisierungen werden mit Hilfe der Software erzeugt, und allgemeine Grundregeln der Visualisierung werden eingeführt. Schliessende Statistik 2.5 ECTS-Credits, 6 Halbtage Dieses Modul behandelt die Grundfragen der Stichworte: Punktschätzung, Intervallschätzung, Testtheorie, schliessenden Statistik: (i) Welcher Parameter passt Vertrauensintervalle für am besten zu den Daten? (ii) Sind die Daten mit einem Erwartungswerte, Alternativtests bestimmten Parameterwert vereinbar? (iii) Welche und Signifikanztests, Lokationstests für eine und für Parameterwerte sind mit den Beobachtungen zwei Stichproben, Quantil- vereinbar? Die dazugehörigen statistischen Verfahren Quantil-Diagramm sind das Schätzen, das Testen und das Bilden eines Voraussichtlicher Dozent: Vertrauensintervalls. Nach diesem Modul können Prof. em. Dr. Jürg Hüsler univariate und bivariate Datensätze unter der klassischen Annahme von normalverteilten Daten ausgewertet werden. Weiterbildungsprogramm Statistical Data Science 2020–2023 13
Einführung in lineare Modelle 3 ECTS-Credits, 9 Halbtage In diesem Modul werden lineare Modelle eingeführt, Stichworte: Einweg-ANOVA, einfache lineare Regression, eine Familie von Modellen, die es erlauben, den Wert allgemeines lineares Modell, eines Merkmals durch die Werte mehrerer anderer Vorhersage, Variablenselektion, beobachtbarer Grössen zu erklären und voraus- Überprüfung der Modell- voraussetzungen, Kontraste, zusagen. Der Zusammenhang zwischen den Vektoren und Matrizen Einflussgrössen und der Zielgrösse ist dabei in einem Voraussichtlicher Dozent: zu klärenden Sinn linear. Als wichtige Spezialfälle Dr. Michael Mayer werden die lineare Regression und die Varianzanalyse (ANOVA) betrachtet. Die linearen Modelle bilden den Ausgangspunkt für die Definition allgemeinerer Modellfamilien, die in verschiedenen späteren Modulen des Weiterbildungsprogramms eingeführt werden. Im Rahmen dieses Moduls werden auch weitere mathematische Grundlagen (Vektor- und Matrix- rechnung) aufgefrischt, die für die Arbeit mit linearen Modellen und in späteren Modulen hilfreich sind. Nichtparametrische Methoden 1.5 ECTS-Credits, 4 Halbtage Parametrische Tests erfordern relativ starke Annahmen Stichworte: Tests für den Ein- und Zweistichprobenfall, nicht- über die Verteilung von Messgrössen. Wenn man diese parametrische Schätzmethoden, Annahmen abschwächt, wird die Klasse der in Frage nichtparametrische Varianz- kommenden Verteilungen so gross, dass sie keine analyse, Tests für kategorielle Daten, Korrelation und einfache Parametrisierung mehr hat. Deshalb spricht Abhängigkeit, man von nichtparametrischen Tests. Zwei bekannte nichtparametrische Beispiele nichtparametrischer Tests sind der Vor- Anpassungstests zeichentest und der Wilcoxon-Test. In diesem Modul Voraussichtlicher Dozent: werden univariate Verfahren präsentiert, die nicht von Prof. em. Dr. Jürg Hüsler einer bestimmten Verteilungsfamilie ausgehen. 14 Weiterbildungsprogramm Statistical Data Science 2020–2023
Einführung in die Klassifikation 1.5 ECTS-Credits, 4 Halbtage Das Ziel der Klassifikation ist es, Beobachtungs- Stichworte: Qualität von Klassifikatoren, Trainingsdaten, einheiten anhand ihrer Eigenschaften mit Hilfe einer Nearest-Neighbor-Verfahren, geeigneten Regel einer bestimmten Gruppe lineare Diskriminanzanalyse, zuzuordnen, also zu klassifizieren. Die Gruppen- logistische Regression zugehörigkeit ist dabei für eine Stichprobe („Trainings- Voraussichtlicher Dozent: daten“) bekannt. Das Problem ist auch unter dem Dr. Niki Zumbrunnen Namen „überwachtes Lernen“ (supervised learning) bekannt. In diesem Modul werden grundlegende Begriffe und einfache Klassifikationsmethoden eingeführt. Ausserdem wird für den Fall zweier Gruppen das Verfahren der logistischen Regression betrachtet, das auf den linearen Modellen aufbaut. Vertiefung lineare und verallgemeinerte 2 ECTS-Credits, 4 Halbtage lineare Modelle (Wahlmodul) Stichworte: Zweiweg-ANOVA, Mehrweg-ANOVA, verallge- In diesem Modul werden einerseits Spezialfälle linearer meinerte lineare Modelle, Modelle vertieft betrachtet, insbesondere die Zweiweg- Poisson-Regression, Logit- und Mehrweg-Varianzanalyse, bei welcher der Modelle für mehrstufige Zielgrössen, Negativbinomial- kombinierte Einfluss zweier bzw. mehrerer und Gamma-Modelle Gruppenvariablen untersucht werden soll. Andererseits Voraussichtlicher Dozent: wird die Familie der verallgemeinerten linearen Modelle Dr. Michael Vock betrachtet. Bei diesen wird im Gegensatz zu den klassischen linearen Modellen nicht vorausgesetzt, dass die Zielgrösse normalverteilt ist, und es sind flexiblere, nicht-lineare Zusammenhänge zugelassen. Sowohl das klassische lineare Modell als auch die logistische Regression gehören zu dieser Familie der verallgemeinerten linearen Modelle, aber beispielsweise auch Modelle für absolute Häufigkeiten und für mehrstufige kategorielle Zielgrössen. Vertiefung Klassifikation und maschinelles 2 ECTS-Credits, 4 Halbtage Lernen (Wahlmodul) Stichworte: Klassifikationsbäume, Random Zusätzlich zu den bereits bekannten Methoden zur Forests, neuronale Netze Klassifikation werden in diesem Modul weitere Voraussichtlicher Dozent: Methoden verwendet. Klassische statistische Ansätze Dr. Niki Zumbrunnen und solche aus dem Bereich des maschinellen Lernens werden einander gegenübergestellt, und ihre Vor- und Nachteile werden besprochen. Weiterbildungsprogramm Statistical Data Science 2020–2023 15
Modulbeschreibungen CAS ASDS 2021/2022 Unüberwachtes Lernen und 1.5 ECTS-Credits, 4 Halbtage Dimensionsreduktion Stichworte: Clusteranalyse, Ähnlichkeits- und Distanzmasse, In diesem Modul geht es darum, Strukturen von Daten Hauptkomponentenanalyse, herauszuarbeiten und so zu neuen Erkenntnissen zu Faktoranalyse, Rotation, latente gelangen. Beim unüberwachten Lernen versucht man Variablen (z. B. mit einer Clusteranalyse), Beobachtungen zu Voraussichtlicher Dozent: sinnvollen Gruppen zusammenzufassen. Bei der Prof. Dr. Lutz Dümbgen Hauptkomponenten- und der Faktoranalyse ist das Ziel, komplexes multivariates Datenmaterial übersichtlich und leichter interpretierbar aufzubereiten, indem höherdimensionale Daten mit möglichst wenig Informationsverlust in wenigen Dimensionen repräsentiert werden. Lineare gemischte Modelle 1.5 ECTS-Credits, 4 Halbtage Gemischte Modelle beinhalten sowohl feste Effekte, Stichworte: Feste und zufällige Effekte, Abhängigkeits- wie sie in klassischen linearen Modellen verwendet strukturen, Modellbildung, werden, als auch zufällige Effekte. Zufällige Effekte Modelldiagnostik, Mehrebenen- verwendet man, wenn in einer Untersuchung nur eine Modelle/hierarchische Modelle zufällige Auswahl der theoretisch denkbaren Stufen Voraussichtlicher Dozent: eines Faktors vorkommt. Gemischte Modelle sind in Dr. Michael Vock vielen Situationen nützlich, in denen Abhängigkeiten zwischen verschiedenen Beobachtungen bestehen. Analyse kategorieller Daten 1.5 ECTS-Credits, 4 Halbtage Kategorielle Daten können nicht normalverteilt Stichworte: Zusammenhangs- und Übereinstimmungsmasse sein, so dass viele bekannte statistische für kategorielle Variablen, strati- Verfahren nicht verwendet werden können. fizierte Tabellen, verbundene Dieses Modul stellt passende Modelle für die Merkmale, abhängige Beob- achtungen, verallgemeinerte Analyse kategorieller Daten vor, mit denen u. a. lineare gemischte Modelle Abhängigkeiten zwischen kategoriellen Grössen Voraussichtlicher Dozent: untersucht werden können. Es baut dabei auf Dr. Daniel Dietrich Ansätzen aus vorangehenden Modulen auf. Rechenintensive Verfahren 1.5 ECTS-Credits, 4 Halbtage Neuere statistische Methoden sind nur dank der Stichworte: Monte-Carlo- Methode, exakte Tests, Entwicklung passender Software und genügend Bootstrap, Jackknife, schneller Rechner entstanden. Einfache exakte fehlende Werte, Imputation statistische Verfahren, wie der exakte Test von Fisher, Voraussichtlicher Dozent: erreichten erst dank dem Computer ihre heutige Dr. Michael Vock 16 Weiterbildungsprogramm Statistical Data Science 2020–2023
Verbreitung. Neben den exakten Tests werden in diesem Modul weitere rechenintensive Methoden behandelt, wie das Bootstrap-Verfahren, das Jackknife- Verfahren oder die multiple Imputation als Verfahren zur Analyse von Daten mit fehlenden Werten. Bayes-Statistik 1.5 ECTS-Credits, 4 Halbtage Nach der Durchführung eines Experiments oder einer Stichworte: Satz von Bayes, konjugierte Verteilungen, Bayes- Studie sind die Daten bekannt, aber der interessie- Schätzung, Kredibilitätsbereich, rende Parameter unbekannt. In der Bayes-Statistik soll Test, Simulationsmethoden, die Unsicherheit über diesen Parameter durch eine Markov Chain Monte Carlo, hierarchische Modelle Wahrscheinlichkeitsverteilung quantifiziert werden. Vorkenntnisse (oder zumindest Vermutungen) über Voraussichtlicher Dozent: Dr. Yves Laurent Grize den Parameter, die bereits vor der Durchführung vorliegen, werden mit einer a-priori-Wahrscheinlich- keitsverteilung erfasst. Die Kombination der a-priori- Verteilung und der Information der Daten mittels Bayes-Theorem liefert die a-posteriori-Verteilung des unbekannten Parameters. Daraus lassen sich Schlüsse ziehen, ähnlich wie mit den klassischen (frequentistischen) Methoden. Prädiktion 1.5 ECTS-Credits, 4 Halbtage Vorhersagen für unsichere zukünftige Ereignisse sind Stichworte: Punkt- und Verteilungsvorhersagen, allgegenwärtig. Normalerweise werden Vorhersagen Evaluation und Vergleich als Punktvorhersagen gegeben, die in irgendeinem von Vorhersagen, Sinne eine „beste Vermutung“ darstellen. Um der Prädiktionsbereiche vs. Konfidenzbereiche Unsicherheit Rechnung zu tragen, sind probabilistische Vorhersagen zu bevorzugen, das heisst es wird eine Voraussichtliche Dozentin: Prof. Dr. Johanna F. Ziegel Wahrscheinlichkeitsverteilung für das zukünftige Ereignis angegeben. Bei Punktvorhersagen ist es unabdingbar zu spezifizieren, was genau eine „beste Vermutung“ bedeutet. In diesem Modul werden die entscheidungstheoretischen Grundlagen behandelt, um sinnvolle Vorhersagen zu machen, die Qualität gegebener Vorhersagen zu evaluieren und Vorhersagen zu vergleichen. Praxismodul 1 ECTS-Credit, 3 Halbtage Dieses Modul unterstützt die Teilnehmenden bei der Voraussichtlicher Dozent: Dr. Michael Vock Vernetzung der Inhalte der vorangehenden Module und bei der Übertragung in die Praxis. Die Teilnehmenden stellen eigene Daten und dazugehörige statistische Herausforderungen im Plenum vor. Basierend auf den Modulen der beiden CAS-Studiengänge (CAS in Statistical Data Science und CAS in Advanced Weiterbildungsprogramm Statistical Data Science 2020–2023 17
Statistical Data Science) werden mögliche Analyse- methoden im Plenum besprochen. Anschliessend dokumentieren die Teilnehmenden diese Diskussion in einem schriftlichen Bericht. Analyse hochdimensionaler Daten 2 ECTS-Credits, 4 Halbtage (Wahlmodul) Stichworte: Ridge Regression, Lasso, Elastic Net, Boosting, Von hochdimensionalen Daten spricht man Variablenselektion insbesondere dann, wenn mehr Variablen als Voraussichtlicher Dozent: Beobachtungseinheiten vorliegen. Klassische Dr. Nicolas Städler statistische Verfahren können in solchen Situationen oft gar nicht angewendet werden, oder aber sie liefern Ergebnisse, die sich viel zu eng an die vorliegenden Daten anlehnen und deshalb nicht verallgemeinerbar sind. Um eine solche Überanpassung („overfitting“) zu vermeiden, kann man beispielsweise das Kriterium zur Anpassung eines linearen Modells so verändern, dass einfachere Modelle bevorzugt werden. Zeitreihenanalyse (Wahlmodul) 2 ECTS-Credits, 4 Halbtage Die Wissenschaft der Zeitreihen entspringt dem alten Stichworte: Zerlegung einer Zeitreihe in Trend, zyklische Wunsch, die Zukunft voraussagen zu können. Das Komponente und Rest, Wetter oder der Verlauf der Aktienkurse von morgen saisonale Effekte, hängen erfahrungsgemäss mit den Werten von heute autoregressive (AR-)Modelle, Moving-Average-(MA-)Modelle, zusammen. Zeitreihen-Modelle berücksichtigen diese ARMA-Modelle, Vorhersage Korrelation aufeinander folgender Werte und Voraussichtliche Dozentin: ermöglichen dadurch eine Analyse der Zusammen- Dr. Stefanie Hayoz hänge und eine Prognose zukünftiger Werte. 18 Weiterbildungsprogramm Statistical Data Science 2020–2023
Analyse von Ereigniszeiten (Wahlmodul) 2 ECTS-Credits, 4 Halbtage In vielen Anwendungsbereichen ist die Zeitdauer bis Stichworte: Ausfallrate, Überlebenskurve, Kaplan-Meier- zum Eintreten eines bestimmten Ereignisses von Schätzung, Logrank-Test, Cox- Interesse. Je nach Kontext spricht man auch von einer Regression, parametrische Verweildauer (in einem bestimmten Zustand) oder Modelle, Stratifizierung, konkurrierende Risiken, Frailty- einer Überlebenszeit; in technischen Anwendungen hat Modelle sich für entsprechende Methoden der Begriff der Voraussichtliche Dozentin: Zuverlässigkeitsanalyse etabliert. Die interessierende Dr. Shu-Fang Hsu Schmitz Zeitdauer ist zum Zeitpunkt der Datenauswertung oft nicht bei allen Beobachtungseinheiten bekannt, weil bei einigen das entsprechende Ereignis noch nicht eingetreten ist. Solche Daten sind zensiert. Dieses Modul bietet eine Einführung in die Analyse von Ereigniszeiten und umfasst u. a. Verfahren zum Vergleich von Gruppen und zur Beurteilung des Zusammenhangs von quantitativen oder qualitativen Einflussgrössen mit einer Ereigniszeit als Zielgrösse. Versuchsplanung (Wahlmodul) 2 ECTS-Credits, 4 Halbtage Je nach Fachgebiet und Fragestellung kann man nicht Stichworte: Beobachtungs- studien und experimentelle nur in Beobachtungsstudien erheben, was ohnehin Studien, Nicht-Unterlegenheit/ geschehen würde, sondern man kann auch in Äquivalenz, Randomisierung, experimentellen Studien gezielt die Werte gewisser Stichprobenumfang, klassische Versuchspläne und deren Grössen festlegen. Dieses Modul befasst sich Analyse, unvollständige mehrheitlich mit solchen Versuchen, mit verschiedenen Blöcke, Wirkungsflächen gebräuchlichen Versuchsplänen und der Analyse der Voraussichtlicher Dozent: damit erhobenen Daten. Daneben werden Themen Dr. Michael Vock behandelt, die auch für die Planung einer Beobachtungsstudie relevant sein können, wie etwa verschiedene Arten von Hypothesen und die Bestimmung des benötigten Stichprobenumfangs. Fortgeschrittene nichtparametrische 2 ECTS-Credits, 4 Halbtage Methoden (Wahlmodul) Stichworte: Allgemeine nichtparametrische Dieses Modul setzt das Modul „Nichtparametrische Varianzanalyse, relative Methoden“ aus dem CAS in Statistical Data Science Marginal-Effekte, Daten- fort, wobei hauptsächlich nichtparametrische Methoden Alignment, longitudinale Daten, multivariate Verfahren bei multivariaten Daten und bei zeitlich abhängigen Variablen diskutiert werden. Zudem werden weitere Voraussichtlicher Dozent: Prof. em. Dr. Jürg Hüsler allgemeinere, nichtparametrische Methoden ausführlich behandelt. Weiterbildungsprogramm Statistical Data Science 2020–2023 19
Universität Bern Institut für mathematische Statistik und Versicherungslehre Alpeneggstrasse 22 3012 Bern Sekretariat: Telefon +41 31 631 88 11 office@stat.unibe.ch Studienleiter: Telefon +41 31 631 88 05 michael.vock@stat.unibe.ch www.imsv.unibe.ch/wbp 20 Weiterbildungsprogramm Statistical Data Science 2020–2023
Sie können auch lesen