Statistische Datenanalyse
←
→
Transkription von Seiteninhalten
Wenn Ihr Browser die Seite nicht korrekt rendert, bitte, lesen Sie den Inhalt der Seite unten
Statistische Datenanalyse WS 2018/19 1 Statistische Datenanalyse Die Mitwirkenden im Modul Statistische Datenanalyse heißen alle Studierenden herzlich willkommen. Die Lehrveranstaltungen des Moduls werden dieses Seme- ster von den beiden Modulverantwortlichen Janette Walde und Gabriele Steckel- Berger gemeinsam mit einem Team weiterer LehrveranstaltungsleiterInnen ange- boten. Die VO-Leiterin • Janette Walde Die PS-LeiterInnen • Daniel Gstrein • Lisa Schlosser • Gabriele Steckel-Berger Die StudienassistentInnen • Tobias Eppacher • Nina Prantl • Moritz Schasching
Statistische Datenanalyse WS 2018/19 2 1 Inhalt des Moduls Der Inhalt des Moduls Statistische Datenanalyse umfasst die Deskriptive Stati- ” stik“, die Wahrscheinlichkeitsrechnung“, eine Einführung in die Induktive Sta- ” ” tistik“ sowie in die Regressionsanalyse“. Die Themenbereiche sind im Folgenden ” aufgelistet: • Einführung in die Software R • Deskriptive Statistik • Vertiefung der Wahrscheinlichkeitsrechnung • Spezielle Verteilungen von Zufallsvariablen (Normalverteilung, Binomial- verteilung, . . .) • Mehrdimensionale Zufallsvariablen • Induktive Statistik (Ein- und Zwei-Stichproben-t-Tests, approximativer Bi- nomialtest, ANOVA, robuste Verfahren, Chi-Quadrat Test) • Regressionsanalyse In allen Lehrveranstaltungen des Moduls wird die Software R verwendet.
Statistische Datenanalyse WS 2018/19 3 Datum Veranstaltung Montag, 01.10.2018, 800 - 1000 1. VO Montag, 01.10.2018, 900 Ende 1. Vergaberunde Dienstag, 02.10.2018 1. PS Freitag, 05.10.2018, 1300 Ende 2. Vergaberunde Montag, 08.10.2018, 800 - 1000 2. VO Dienstag, 09.10.2018 2. PS bis Dienstag, 09.10.2018, 1200 Antrag auf Restplatz Freitag, 12.10.2018, 2000 Deadline Fragebogenbeantwortung Montag, 15.10.2018, 800 - 1000 3. VO Dienstag, 16.10.2018 3. PS Montag, 22.10.2018, 800 - 1000 4. VO Dienstag, 23.10.2018 4. PS Montag, 29.10.2018, 800 - 1000 5. VO Dienstag, 30.10.2018 5. PS Montag, 05.11.2018, 800 - 1000 6. VO Dienstag, 06.11.2018 6. PS Montag, 12.11.2018, 800 - 1000 7. VO Dienstag, 13.11.2018 7. PS Freitag, 16.11.2018, 800 - 1200 1. PS Klausur, Campus Technik Montag, 19.11.2018, 800 - 1000 8. VO Dienstag, 20.11.2018 8. PS Montag, 26.11.2018, 800 - 1000 9. VO Dienstag, 27.11.2018 9. PS Montag, 03.12.2018, 800 - 1000 10. VO Dienstag, 04.12.2018 10. PS Montag, 10.12.2018, 800 - 1000 11. VO Dienstag, 11.12.2018 11. PS Mittwoch, 12.12.2018, 800 - Freitag, 14.12.2018, 2000 Onlinetest Montag, 07.01.2019, 800 - 1000 12. VO Dienstag, 08.01.2019 12. PS Montag, 14.01.2019, 800 - 1000 13. VO Dienstag, 15.01.2019 13. PS Freitag, 18.01.2019 Onlineabgabe Projektarbeit Montag, 21.01.2019, 800 - 1000 14. VO Dienstag, 22.01.2019 14. PS Freitag, 25.01.2019, 800 - 1200 2. PS Klausur, Campus Technik Montag, 28.01.2019, 800 - 1000 15. VO Dienstag, 29.01.2019 15. PS, Defensio Projektarbeit 21.01.2019 - 04.02.2019, 1200 Anmeldung zur Gesamtprüfung 11.02.2019 - 15.02.2019 1. Prüfungswoche Tabelle 1: Terminübersicht - Modul Statistische Datenanalyse
Statistische Datenanalyse WS 2018/19 4 2 Wichtige Hinweise • eCampus: Im elektronischen Campussystem OLAT werden Materialien wie die Vorlesungs- und Proseminarfolien, Datensätze, Selbsttests oder ak- tuelle Informationen zum Modul bereitgestellt. Im Lauf des Semesters ver- senden wir hier auch Mitteilungen. Um sicherzustellen, dass Sie über alle Mitteilungen informiert sind, abonnieren Sie diese bitte gleich zu Beginn des Semesters. • Fragen zum Modul: Für administrative und inhaltliche Fragen zum Mo- dul und für Fragen zur Projektarbeit sind im OLAT (VO Statistische Da- tenanlyse) drei Diskussionsforen eingerichtet. Im Forum Administrative Fragen können alle Fragen gestellt werden, die sich auf die Organisation der Vorlesung, der Proseminare und der Prüfungen beziehen. Im Forum Inhaltliche Fragen können alle Fragen zu Aufgaben aus den Selbsttests, PS-Aufgaben und sonstigen inhaltlichen Unklarheiten gepostet werden. Im Forum Projektarbeit können alle Fragen gestellt werden, die sich auf die Projektarbeit beziehen. Versehen Sie bitte Ihre Frage mit einem möglichst aussagekräftigen Betreff. Stellen Sie innerhalb eines Threads keine neuen Anfragen, sondern posten Sie jede Frage einzeln, damit die Suche innerhalb eines Forums erleichtert wird. Es ist sehr erwünscht, dass sich StudienkollegInnen an der Beantwortung und Diskussion von Fragen in den Foren beteiligen. • Mathematische Vorkenntnisse: Das Modul Statistische Datenanalyse setzt die Kenntnisse aus dem Modul Mathematik voraus. Insbesondere gehen wir davon aus, dass die Studierenden mit den Grundlagen der Mengenlehre sowie der Differential- und Integralrechnung vertraut sind. • Vorkenntnisse in Wahrscheinlichkeitsrechnung: Die Wahrscheinlich- keitsrechnung aus dem Modul Mathematik ist eine wesentliche Grundlage für das Modul Statistische Datenanalyse. Wir empfehlen daher, zu Beginn des Semesters den entsprechenden Selbsttest zur Wahrscheinlichkeitsrech- nung zu nutzen, um das Verständnis für die darauf aufbauenden Kapitel sicherzustellen. • Arbeitsaufwand: Das Modul ist so gestaltet, dass Studierende rund 188 Stunden (25 Stunden pro Credit Point) für das Modul aufwenden müssen. Neben den 3 Anwesenheitsstunden pro Woche (insgesamt ca 40 Stunden
Statistische Datenanalyse WS 2018/19 5 pro Semester) gehen wir von rund 7 Stunden Vor- bzw. Nacharbeitung pro Woche aus (ca 100 Stunden pro Semester). Damit bleiben noch rund 50 Stunden im Semester für Prüfungsvorbereitungen. • E-mail Nachrichten: Während des Semesters werden Informationen auch per E-mail an die Studierenden versendet. Bitte überprüfen Sie Ihren Uni- Mailaccount daher regelmäßig. • Anregungen zur Vorlesung, zu den Proseminaren, zum Skript und zur Organisation des Moduls nehmen wir gerne entgegen. Diese Anregungen können über das administrative Forum eingebracht, per Email an die Mo- dulverantwortlichen gesendet oder gerne auch persönlich besprochen wer- den. 3 Selbsttests Zur Vertiefung der Modulinhalte stehen im OLAT ab Semesterbeginn Selbsttests mit Übungsaufgaben zur Verfügung. Diese Übungsaufgaben orientieren sich an den Fragestellungen der PS-Klausuren und der Gesamtprüfung. Die Selbsttests sind ausschließlich zu Trainingszwecken gedacht, werden daher nicht benotet und können beliebig oft wiederholt werden. Einige Hinweise zur Bearbeitung der Selbsttests: • Bearbeiten von Aufgaben: Jede einzelne Aufgabe des Tests kann belie- big oft eingegeben/gespeichert werden. Das System zeigt sofort an, ob die Lösung richtig ist. Ist die Lösung richtig, erhöht sich die Anzahl der Punkte um 1. • Kommazahlen: Kommazahlen werden in der amerikanischen Schreibweise angegeben, d.h. es wird ein Punkt ( .“) anstelle eines Kommas ( ,“) als ” ” Dezimaltrennzeichen verwendet. • Runden von Ergebnissen: Das Endergebnis bei Rechenbeispielen wird (sofern nicht explizit in der Aufgabenstellung anders angegeben) immer auf zwei Nachkommastellen gerundet abgefragt. Zwischenergebnisse sollen nicht gerundet werden. Zeichen/Symbole für die Einheit des Ergebnisses (z.B. %, GE, EUR, ...) dürfen nicht eingegeben werden. • Test beenden: Die Beendigung des Tests entspricht der endgültigen Ab- gabe der eingetragenen Lösungen. Nach Abschluss des Tests werden die abgegebenen und richtigen Antworten zusammen mit den erreichten Punk- ten angezeigt. Als Testergebnis wird immer Nicht bestanden“ angezeigt, ” was aber keinerlei Bedeutung hat.
Statistische Datenanalyse WS 2018/19 6 4 Prüfungsmodalitäten 4.1 Proseminar Eine Abmeldung vom Proseminar ohne Angabe von Gründen ist nur bis spätestens 09.10.2018, 1800 Uhr möglich. Eine unentschuldigte Abwesenheit in der ersten Einheit des Proseminares führt zu einer Abmeldung vom gesamten Modul durch die LV-LeiterInnen. Im Proseminar besteht Anwesenheitspflicht. In den Proseminaren sind zwei Klausuren, ein Onlinetest und eine Projektar- beit zu schreiben. Die Klausurtermine und den Termin für den Onlinetest finden Sie in Tabelle 1. Die Klausuren finden in den Computerräumen des Campus Tech- nik (Architektur-Gebäude, UG) in der Technikerstraße statt. Sollte die Teilnahme an einer Klausur krankheitsbedingt nicht möglich sein, ist ein ärztliches Attest beizubringen. Der Stoff der Proseminar-Klausuren und jener des Onlinetests werden in den Proseminaren bekanntgegeben. Jede Klausur dauert 90 Minuten. Die Klausuren werden am Computer geschrie- ben. Als Unterstützung wird eine R-Befehlsliste zur Verfügung gestellt.Weitere Hilfsmittel sind nicht erlaubt. Für die erste Klausur werden maximal 40 Punkte vergeben, für die zweite Klausur maximal 100 Punkte. Im Onlinetest können maximal 20 Punkte erreicht werden. Die Projektarbeit wird mit maximal 40 Punkten bewertet. Das Proseminar ist positiv absolviert, wenn aus der ersten Klausur, der zweiten Klausur, dem Onlinetest und der Projektarbeit mindestens 100 Punkte erreicht wer- den. Neben den Punkten aus den beiden Klausuren, dem Onlinetest und der Pro- jektarbeit können zusätzlich Punkte im Umfang von maximal 20 Punkten durch Ausfüllen eines Fragebogens und durch Mitarbeit erworben werden: • Fragebogen: Zu Beginn des Semesters kann im OLAT ein Fragebogen ausgefüllt werden. Aus den Angaben der Studierenden entsteht ein anony- misierter Datensatz, der ausschließlich in der Vorlesung und in den Prose- minaren zur Demonstration statistischer Analysen verwendet wird. Für das vollständige Ausfüllen des Fragebogens werden 5 Zusatzpunkte vergeben. • Mitarbeit: Durch aktive Mitarbeit im Proseminar können bis zu 15 Zu- satzpunkte erworben werden.
Statistische Datenanalyse WS 2018/19 7 Die PS-Note wird nach folgendem Schlüssel ermittelt: ≥ 175 Punkte: Sehr gut 150 Punkte ≤ X < 175 Punkte: Gut 125 Punkte ≤ X < 150 Punkte: Befriedigend 100 Punkte ≤ X < 125 Punkte: Genügend X < 100 Punkte: Nicht genügend 4.2 Gesamtprüfung Die Gesamtprüfung ist eine 90-minütige Prüfung mit Single-Choice-Fragen im Stil der Selbsttests. Die Gesamtprüfung findet in der Olympiaworld statt. Der Termin wird vom Prüfungsreferat festgelegt. Neben dem Vorlesungsstoff sind auch die in den Prose- minaren behandelten Themen und Aufgaben prüfungsrelevant. Voraussetzung für die Anmeldung zur Gesamtprüfung ist das positive Absolvieren des Proseminars. Für jede richtig beantwortete Frage werden 2 Punkte vergeben. Für jede falsch beantwortete Frage werden 0.5 Punkte abgezogen. Eine nicht beantwortete Frage wird mit 0 Punkten gewertet. Kommazahlen sind in der Lösung in der amerikanischen Schreibweise anzugeben, d.h. ein Punkt ( .“) anstelle eines Kommas ( ,“) als Dezimaltrennzeichen. ” ” Folgende Hilfsmittel können bei der Gesamtprüfung verwendet werden: • Ein Taschenrechner aus der Liste der erlaubten Taschenrechnern (siehe Do- kument erlaubte Hilfsmittel). • Die Formelsammlung, die bei der Prüfung gemeinsam mit den Angabe- blättern ausgeteilt wird. Diese Formelsammlung entspricht jener, die während des Semesters im OLAT zur Verfügung gestellt wird. • Die Wahrscheinlichkeitstabellen, die mit der Angabe ausgeteilt werden. Die Gesamtprüfungsnote wird nach folgendem Schlüssel ermittel: ≥ 87.5%: Sehr gut 75% ≤ X < 87.5%: Gut 62.5% ≤ X < 75%: Befriedigend 50% ≤ X < 62.5%: Genügend X < 50%: Nicht genügend
Statistische Datenanalyse WS 2018/19 8 Die Modulnote ergibt sich nach der Formel 0.6 · PS-Note + 0.4 · Klausurnote, wobei anschließend kaufmännisch gerundet wird. Es müssen zu einer positiven Note jedoch beide Teilleistungen positiv sein. 5 Zusätzliche Übungsaufgaben Dieser Abschnitt enthält Hinweise auf zusätzliche Übungsaufgaben. Arbeits- buch bezieht sich auf Fahrmeir et al.: Arbeitsbuch Statistik (siehe Literaturver- zeichnis). Beschreibung von Verteilungen Ablauf statistischer Analysen, Merkmalstypen, Arithmetisches Mittel und Streu- ung, Häufigkeitsverteilung und Histogramme, Quantile und Boxplot, Beschrei- bung diskreter Verteilungen. • Arbeitsbuch: 2.1-2.5, 2.7, 2.9-2.11 Wahrscheinlichkeit I Wahrscheinlichkeiten und einfache Rechenregeln, Urnenmodelle • Arbeitsbuch: 4.1, 4.3-4.4 Wahrscheinlichkeit II Bedingte Wahrscheinlichkeiten, Satz von der totalen Wahrscheinlichkeit und Satz von Bayes. • Arbeitsbuch: 4.7-4.12 Diskrete Zufallsvariablen Definition, Verteilung, Erwartungswert und Varianz, spezielle Verteilungen • Arbeitsbuch: 5.1, 5.2 a)-b), 5.3-5.9, 5.12, 5.14-5.21, 5.25
Statistische Datenanalyse WS 2018/19 9 Stetige Zufallsvariablen Definition, Verteilung, Erwartungswert und Varianz, spezielle Verteilungen • Arbeitsbuch: 6.1-6.7, 6.15-6.18, 6.19 a) und b) Grundlagen der induktiven Statistik Grundlagen der statistischen Inferenz, Gütemaße, ML-Schätzer, Intervallschätzung und Grundlagen des Testens • Arbeitsbuch: 9.1-9.8, 9.9, 9.12 Konfidenzintervalle und Hypothesentests Gaußtest, t-Test, approximativer Binomialtest • Arbeitsbuch: 9.14, 10.1-10.9, 11.1 a), b) und d), 11.2 a) und b), 11.4 Zusammenhangsanalyse • Arbeitsbuch: 3.6, 3.7 Regression • Arbeitsbuch: 12.2-12.9, 12.11-12.13 6 Literatur • Skript (im OLAT zur Verfügung gestellt) • Vorlesungs- und Proseminarfolien (im OLAT zur Verfügung gestellt) • Caputo, Fahrmeir, Künstler, Lang, Pigeot und Tutz: Arbeitsbuch Statistik, Springer, 5. Auflage 2008. • Fahrmeir, Künstler, Pigeot, Tutz: Statistik. Der Weg zur Datenanalyse, Springer, 7. Auflage 2010. Weitere empfohlene Lehrbücher:
Statistische Datenanalyse WS 2018/19 10 • Lind, Marchal, Wathen: Statistical Techniques in Business & Economics, McGraw-Hill, diverse Auflagen (aktuell: 16. Auflage 2014) • Schira: Statistische Methoden der VWL und BWL, Pearson Studium, 4 Auf- lage 2014 • Agresti, Franklin: Statistics: The Art and Science of Learning From Data, Prentice Hall 2006 • Sydsæter: Mathematik für Wirtschaftswissenschaftler, Pearson Studium, 3. Auflage 2013) Literatur zu vorausgesetzten mathematischen Grundlagen: • Adams, G. et al.: Mathematik zum Studieneinstieg. Springer Verlag, 6. Auf- lage 2013. • Cramer, E. und Neslehova, J.: Vorkurs Mathematik. Springer Verlag, 5. Auflage 2013. Populärwissenschaftliche Literatur Es handelt sich um Literaturempfehlungen für Interessierte. Sämtliche Bücher sind für ein breites Publikum ohne Vorkentnisse in Wahrscheinlichkeitsrechnung oder Statistik geschrieben. Hauptsächlich geht es um spannende Probleme aus dem Bereich Wahrscheinlichkeitsrechnung, um eine kritische Betrachtung der mo- mentanen Forschungslandschaft und/oder leicht verständliche Darstellungen der Statistik. • Beck-Bornholdt und Dubben: Der Hund, der Eier legt. Erkennen von Fehl- information durch Querdenken, Rowohlt 2001 • Bewersdorf: Glück, Logik und Bluff. Mathematik im Spiel - Methoden, Er- gebnisse und Grenzen, Vieweg 2007 • Gigerenzer: Das Einmaleins der Skepsis. Über den richtigen Umgang mit Zahlen und Risiken, Berliner Taschenbuch Verlag 2004 • Heuer, A. Der perfekte Tipp: Statistik des Fus̈sballspiels, 2012 • Holland, B.K.: What are the chances?. Johns Hopkins University Press. • Randow: Das Ziegenproblem. Denken in Wahrscheinlichkeiten, Rowohlt Ta- schenbuch 2004 • Krämer: Denkste! Trugschlüsse aus der Welt der Zahlen und des Zufalls, Piper 1998 • Krämer: So lügt man mit Statistik, Piper 2000
Statistische Datenanalyse WS 2018/19 11 • Krämer: Statistik verstehen. Eine Gebrauchsanweisung, Piper 2001 • Mukherjee S. Der König aller Krankheiten: Krebs - eine Biografie, DuMont Buchverlag, 4. Auflage 2012. • Olofsson, P. Probabilities. The Little Numbers That Rule our Lives. Wiley. • Senn: Dicing with Death. Chance, Risk and Health, Cambridge University Press 2003 • Spiegel Titel 20/2013 Leben nach Zahlen. • Singh, S. Geheime Botschaften. Die Kunst der Verschlüsselung von der Antike bis in die Zeiten des Internet, Deutscher Taschenbuch Verlag, 2001. • Singh, S. Fermats letzter Satz, Deutscher Taschenbuch Verlag, 2000. • Tolan, M. Manchmal gewinnt der Bessere: Die Physik des Fußballspiels, Piper Verlag, 4. Auflage 2011. • Wesson, J. Fußball - Wissenschaft mit Kick: Von der Physik fliegender Bälle und der Statistik des Spielausgangs, Spektrum Akademischer Verlag, 2010.
Sie können auch lesen