Statistische Datenanalyse

Die Seite wird erstellt Angelika Köster
 
WEITER LESEN
Statistische Datenanalyse WS 2018/19                                       1

         Statistische Datenanalyse
Die Mitwirkenden im Modul Statistische Datenanalyse heißen alle Studierenden
herzlich willkommen. Die Lehrveranstaltungen des Moduls werden dieses Seme-
ster von den beiden Modulverantwortlichen Janette Walde und Gabriele Steckel-
Berger gemeinsam mit einem Team weiterer LehrveranstaltungsleiterInnen ange-
boten.

Die VO-Leiterin
   • Janette Walde

Die PS-LeiterInnen
   • Daniel Gstrein
   • Lisa Schlosser
   • Gabriele Steckel-Berger

Die StudienassistentInnen
   • Tobias Eppacher
   • Nina Prantl
   • Moritz Schasching
Statistische Datenanalyse WS 2018/19                                          2

1     Inhalt des Moduls
Der Inhalt des Moduls Statistische Datenanalyse umfasst die Deskriptive Stati-
                                                             ”
stik“, die Wahrscheinlichkeitsrechnung“, eine Einführung in die Induktive Sta-
           ”                                                    ”
tistik“ sowie in die Regressionsanalyse“. Die Themenbereiche sind im Folgenden
                    ”
aufgelistet:

    • Einführung in die Software R
    • Deskriptive Statistik
    • Vertiefung der Wahrscheinlichkeitsrechnung
    • Spezielle Verteilungen von Zufallsvariablen (Normalverteilung, Binomial-
      verteilung, . . .)
    • Mehrdimensionale Zufallsvariablen
    • Induktive Statistik (Ein- und Zwei-Stichproben-t-Tests, approximativer Bi-
      nomialtest, ANOVA, robuste Verfahren, Chi-Quadrat Test)
    • Regressionsanalyse

In allen Lehrveranstaltungen des Moduls wird die Software R verwendet.
Statistische Datenanalyse WS 2018/19                                         3

 Datum                                                   Veranstaltung
 Montag, 01.10.2018, 800 - 1000                          1. VO
 Montag, 01.10.2018, 900                                 Ende 1. Vergaberunde
 Dienstag, 02.10.2018                                    1. PS
 Freitag, 05.10.2018, 1300                               Ende 2. Vergaberunde
 Montag, 08.10.2018, 800 - 1000                          2. VO
 Dienstag, 09.10.2018                                    2. PS
 bis Dienstag, 09.10.2018, 1200                          Antrag auf Restplatz
 Freitag, 12.10.2018, 2000                               Deadline Fragebogenbeantwortung
 Montag, 15.10.2018, 800 - 1000                          3. VO
 Dienstag, 16.10.2018                                    3. PS
 Montag, 22.10.2018, 800 - 1000                          4. VO
 Dienstag, 23.10.2018                                    4. PS
 Montag, 29.10.2018, 800 - 1000                          5. VO
 Dienstag, 30.10.2018                                    5. PS
 Montag, 05.11.2018, 800 - 1000                          6. VO
 Dienstag, 06.11.2018                                    6. PS
 Montag, 12.11.2018, 800 - 1000                          7. VO
 Dienstag, 13.11.2018                                    7. PS
 Freitag, 16.11.2018, 800 - 1200                         1. PS Klausur, Campus Technik
 Montag, 19.11.2018, 800 - 1000                          8. VO
 Dienstag, 20.11.2018                                    8. PS
 Montag, 26.11.2018, 800 - 1000                          9. VO
 Dienstag, 27.11.2018                                    9. PS
 Montag, 03.12.2018, 800 - 1000                          10. VO
 Dienstag, 04.12.2018                                    10. PS
 Montag, 10.12.2018, 800 - 1000                          11. VO
 Dienstag, 11.12.2018                                    11. PS
 Mittwoch, 12.12.2018, 800 - Freitag, 14.12.2018, 2000   Onlinetest
 Montag, 07.01.2019, 800 - 1000                          12. VO
 Dienstag, 08.01.2019                                    12. PS
 Montag, 14.01.2019, 800 - 1000                          13. VO
 Dienstag, 15.01.2019                                    13. PS
 Freitag, 18.01.2019                                     Onlineabgabe Projektarbeit
 Montag, 21.01.2019, 800 - 1000                          14. VO
 Dienstag, 22.01.2019                                    14. PS
 Freitag, 25.01.2019, 800 - 1200                         2. PS Klausur, Campus Technik
 Montag, 28.01.2019, 800 - 1000                          15. VO
 Dienstag, 29.01.2019                                    15. PS, Defensio Projektarbeit
 21.01.2019 - 04.02.2019, 1200                           Anmeldung zur Gesamtprüfung
 11.02.2019 - 15.02.2019                                 1. Prüfungswoche

         Tabelle 1: Terminübersicht - Modul Statistische Datenanalyse
Statistische Datenanalyse WS 2018/19                                             4

2     Wichtige Hinweise
    • eCampus: Im elektronischen Campussystem OLAT werden Materialien
      wie die Vorlesungs- und Proseminarfolien, Datensätze, Selbsttests oder ak-
      tuelle Informationen zum Modul bereitgestellt. Im Lauf des Semesters ver-
      senden wir hier auch Mitteilungen. Um sicherzustellen, dass Sie über alle
      Mitteilungen informiert sind, abonnieren Sie diese bitte gleich zu Beginn
      des Semesters.
    • Fragen zum Modul: Für administrative und inhaltliche Fragen zum Mo-
      dul und für Fragen zur Projektarbeit sind im OLAT (VO Statistische Da-
      tenanlyse) drei Diskussionsforen eingerichtet.
      Im Forum Administrative Fragen können alle Fragen gestellt werden, die
      sich auf die Organisation der Vorlesung, der Proseminare und der Prüfungen
      beziehen.
      Im Forum Inhaltliche Fragen können alle Fragen zu Aufgaben aus den
      Selbsttests, PS-Aufgaben und sonstigen inhaltlichen Unklarheiten gepostet
      werden.
      Im Forum Projektarbeit können alle Fragen gestellt werden, die sich auf
      die Projektarbeit beziehen.
      Versehen Sie bitte Ihre Frage mit einem möglichst aussagekräftigen Betreff.
      Stellen Sie innerhalb eines Threads keine neuen Anfragen, sondern posten
      Sie jede Frage einzeln, damit die Suche innerhalb eines Forums erleichtert
      wird.
      Es ist sehr erwünscht, dass sich StudienkollegInnen an der Beantwortung
      und Diskussion von Fragen in den Foren beteiligen.
    • Mathematische Vorkenntnisse: Das Modul Statistische Datenanalyse setzt
      die Kenntnisse aus dem Modul Mathematik voraus. Insbesondere gehen wir
      davon aus, dass die Studierenden mit den Grundlagen der Mengenlehre
      sowie der Differential- und Integralrechnung vertraut sind.
    • Vorkenntnisse in Wahrscheinlichkeitsrechnung: Die Wahrscheinlich-
      keitsrechnung aus dem Modul Mathematik ist eine wesentliche Grundlage
      für das Modul Statistische Datenanalyse. Wir empfehlen daher, zu Beginn
      des Semesters den entsprechenden Selbsttest zur Wahrscheinlichkeitsrech-
      nung zu nutzen, um das Verständnis für die darauf aufbauenden Kapitel
      sicherzustellen.
    • Arbeitsaufwand: Das Modul ist so gestaltet, dass Studierende rund 188
      Stunden (25 Stunden pro Credit Point) für das Modul aufwenden müssen.
      Neben den 3 Anwesenheitsstunden pro Woche (insgesamt ca 40 Stunden
Statistische Datenanalyse WS 2018/19                                                5

      pro Semester) gehen wir von rund 7 Stunden Vor- bzw. Nacharbeitung pro
      Woche aus (ca 100 Stunden pro Semester). Damit bleiben noch rund 50
      Stunden im Semester für Prüfungsvorbereitungen.
    • E-mail Nachrichten: Während des Semesters werden Informationen auch
      per E-mail an die Studierenden versendet. Bitte überprüfen Sie Ihren Uni-
      Mailaccount daher regelmäßig.
    • Anregungen zur Vorlesung, zu den Proseminaren, zum Skript und zur
      Organisation des Moduls nehmen wir gerne entgegen. Diese Anregungen
      können über das administrative Forum eingebracht, per Email an die Mo-
      dulverantwortlichen gesendet oder gerne auch persönlich besprochen wer-
      den.

3     Selbsttests
Zur Vertiefung der Modulinhalte stehen im OLAT ab Semesterbeginn Selbsttests
mit Übungsaufgaben zur Verfügung. Diese Übungsaufgaben orientieren sich an
den Fragestellungen der PS-Klausuren und der Gesamtprüfung. Die Selbsttests
sind ausschließlich zu Trainingszwecken gedacht, werden daher nicht benotet und
können beliebig oft wiederholt werden.
Einige Hinweise zur Bearbeitung der Selbsttests:
    • Bearbeiten von Aufgaben: Jede einzelne Aufgabe des Tests kann belie-
      big oft eingegeben/gespeichert werden. Das System zeigt sofort an, ob die
      Lösung richtig ist. Ist die Lösung richtig, erhöht sich die Anzahl der Punkte
      um 1.
    • Kommazahlen: Kommazahlen werden in der amerikanischen Schreibweise
      angegeben, d.h. es wird ein Punkt ( .“) anstelle eines Kommas ( ,“) als
                                         ”                           ”
      Dezimaltrennzeichen verwendet.
    • Runden von Ergebnissen: Das Endergebnis bei Rechenbeispielen wird
      (sofern nicht explizit in der Aufgabenstellung anders angegeben) immer
      auf zwei Nachkommastellen gerundet abgefragt. Zwischenergebnisse sollen
      nicht gerundet werden. Zeichen/Symbole für die Einheit des Ergebnisses
      (z.B. %, GE, EUR, ...) dürfen nicht eingegeben werden.
    • Test beenden: Die Beendigung des Tests entspricht der endgültigen Ab-
      gabe der eingetragenen Lösungen. Nach Abschluss des Tests werden die
      abgegebenen und richtigen Antworten zusammen mit den erreichten Punk-
      ten angezeigt. Als Testergebnis wird immer Nicht bestanden“ angezeigt,
                                                ”
      was aber keinerlei Bedeutung hat.
Statistische Datenanalyse WS 2018/19                                            6

4     Prüfungsmodalitäten

4.1    Proseminar

Eine Abmeldung vom Proseminar ohne Angabe von Gründen ist nur bis
spätestens 09.10.2018, 1800 Uhr möglich.
Eine unentschuldigte Abwesenheit in der ersten Einheit des Proseminares führt
zu einer Abmeldung vom gesamten Modul durch die LV-LeiterInnen.
Im Proseminar besteht Anwesenheitspflicht.
In den Proseminaren sind zwei Klausuren, ein Onlinetest und eine Projektar-
beit zu schreiben. Die Klausurtermine und den Termin für den Onlinetest finden
Sie in Tabelle 1. Die Klausuren finden in den Computerräumen des Campus Tech-
nik (Architektur-Gebäude, UG) in der Technikerstraße statt. Sollte die Teilnahme
an einer Klausur krankheitsbedingt nicht möglich sein, ist ein ärztliches Attest
beizubringen.
Der Stoff der Proseminar-Klausuren und jener des Onlinetests werden in den
Proseminaren bekanntgegeben.
Jede Klausur dauert 90 Minuten. Die Klausuren werden am Computer geschrie-
ben. Als Unterstützung wird eine R-Befehlsliste zur Verfügung gestellt.Weitere
Hilfsmittel sind nicht erlaubt.
Für die erste Klausur werden maximal 40 Punkte vergeben, für die zweite Klausur
maximal 100 Punkte. Im Onlinetest können maximal 20 Punkte erreicht werden.
Die Projektarbeit wird mit maximal 40 Punkten bewertet. Das Proseminar ist
positiv absolviert, wenn aus der ersten Klausur, der zweiten Klausur, dem
Onlinetest und der Projektarbeit mindestens 100 Punkte erreicht wer-
den.
Neben den Punkten aus den beiden Klausuren, dem Onlinetest und der Pro-
jektarbeit können zusätzlich Punkte im Umfang von maximal 20 Punkten durch
Ausfüllen eines Fragebogens und durch Mitarbeit erworben werden:
    • Fragebogen: Zu Beginn des Semesters kann im OLAT ein Fragebogen
      ausgefüllt werden. Aus den Angaben der Studierenden entsteht ein anony-
      misierter Datensatz, der ausschließlich in der Vorlesung und in den Prose-
      minaren zur Demonstration statistischer Analysen verwendet wird. Für das
      vollständige Ausfüllen des Fragebogens werden 5 Zusatzpunkte vergeben.
    • Mitarbeit: Durch aktive Mitarbeit im Proseminar können bis zu 15 Zu-
      satzpunkte erworben werden.
Statistische Datenanalyse WS 2018/19                                            7

Die PS-Note wird nach folgendem Schlüssel ermittelt:
≥ 175 Punkte: Sehr gut
150 Punkte ≤ X < 175 Punkte: Gut
125 Punkte ≤ X < 150 Punkte: Befriedigend
100 Punkte ≤ X < 125 Punkte: Genügend
X < 100 Punkte: Nicht genügend

4.2    Gesamtprüfung

Die Gesamtprüfung ist eine 90-minütige Prüfung mit Single-Choice-Fragen im
Stil der Selbsttests.
Die Gesamtprüfung findet in der Olympiaworld statt. Der Termin wird vom
Prüfungsreferat festgelegt. Neben dem Vorlesungsstoff sind auch die in den Prose-
minaren behandelten Themen und Aufgaben prüfungsrelevant. Voraussetzung für
die Anmeldung zur Gesamtprüfung ist das positive Absolvieren des Proseminars.
Für jede richtig beantwortete Frage werden 2 Punkte vergeben. Für jede falsch
beantwortete Frage werden 0.5 Punkte abgezogen. Eine nicht beantwortete Frage
wird mit 0 Punkten gewertet.
Kommazahlen sind in der Lösung in der amerikanischen Schreibweise anzugeben,
d.h. ein Punkt ( .“) anstelle eines Kommas ( ,“) als Dezimaltrennzeichen.
                ”                           ”
Folgende Hilfsmittel können bei der Gesamtprüfung verwendet werden:
   • Ein Taschenrechner aus der Liste der erlaubten Taschenrechnern (siehe Do-
     kument erlaubte Hilfsmittel).
   • Die Formelsammlung, die bei der Prüfung gemeinsam mit den Angabe-
     blättern ausgeteilt wird. Diese Formelsammlung entspricht jener, die während
     des Semesters im OLAT zur Verfügung gestellt wird.
   • Die Wahrscheinlichkeitstabellen, die mit der Angabe ausgeteilt werden.
Die Gesamtprüfungsnote wird nach folgendem Schlüssel ermittel:
≥ 87.5%: Sehr gut
75% ≤ X < 87.5%: Gut
62.5% ≤ X < 75%: Befriedigend
50% ≤ X < 62.5%: Genügend
X < 50%: Nicht genügend
Statistische Datenanalyse WS 2018/19                                           8

Die Modulnote ergibt sich nach der Formel 0.6 · PS-Note + 0.4 · Klausurnote,
wobei anschließend kaufmännisch gerundet wird. Es müssen zu einer positiven
Note jedoch beide Teilleistungen positiv sein.

5     Zusätzliche Übungsaufgaben
Dieser Abschnitt enthält Hinweise auf zusätzliche Übungsaufgaben. Arbeits-
buch bezieht sich auf Fahrmeir et al.: Arbeitsbuch Statistik (siehe Literaturver-
zeichnis).

Beschreibung von Verteilungen

Ablauf statistischer Analysen, Merkmalstypen, Arithmetisches Mittel und Streu-
ung, Häufigkeitsverteilung und Histogramme, Quantile und Boxplot, Beschrei-
bung diskreter Verteilungen.
    • Arbeitsbuch: 2.1-2.5, 2.7, 2.9-2.11

Wahrscheinlichkeit I

Wahrscheinlichkeiten und einfache Rechenregeln, Urnenmodelle
    • Arbeitsbuch: 4.1, 4.3-4.4

Wahrscheinlichkeit II

Bedingte Wahrscheinlichkeiten, Satz von der totalen Wahrscheinlichkeit und Satz
von Bayes.
    • Arbeitsbuch: 4.7-4.12

Diskrete Zufallsvariablen

Definition, Verteilung, Erwartungswert und Varianz, spezielle Verteilungen
    • Arbeitsbuch: 5.1, 5.2 a)-b), 5.3-5.9, 5.12, 5.14-5.21, 5.25
Statistische Datenanalyse WS 2018/19                                            9

Stetige Zufallsvariablen

Definition, Verteilung, Erwartungswert und Varianz, spezielle Verteilungen
    • Arbeitsbuch: 6.1-6.7, 6.15-6.18, 6.19 a) und b)

Grundlagen der induktiven Statistik

Grundlagen der statistischen Inferenz, Gütemaße, ML-Schätzer, Intervallschätzung
und Grundlagen des Testens
    • Arbeitsbuch: 9.1-9.8, 9.9, 9.12

Konfidenzintervalle und Hypothesentests

Gaußtest, t-Test, approximativer Binomialtest
    • Arbeitsbuch: 9.14, 10.1-10.9, 11.1 a), b) und d), 11.2 a) und b), 11.4

Zusammenhangsanalyse

    • Arbeitsbuch: 3.6, 3.7

Regression

    • Arbeitsbuch: 12.2-12.9, 12.11-12.13

6     Literatur
    • Skript (im OLAT zur Verfügung gestellt)
    • Vorlesungs- und Proseminarfolien (im OLAT zur Verfügung gestellt)
    • Caputo, Fahrmeir, Künstler, Lang, Pigeot und Tutz: Arbeitsbuch Statistik,
      Springer, 5. Auflage 2008.
    • Fahrmeir, Künstler, Pigeot, Tutz: Statistik. Der Weg zur Datenanalyse,
      Springer, 7. Auflage 2010.
Weitere empfohlene Lehrbücher:
Statistische Datenanalyse WS 2018/19                                         10

   • Lind, Marchal, Wathen: Statistical Techniques in Business & Economics,
     McGraw-Hill, diverse Auflagen (aktuell: 16. Auflage 2014)
   • Schira: Statistische Methoden der VWL und BWL, Pearson Studium, 4 Auf-
     lage 2014
   • Agresti, Franklin: Statistics: The Art and Science of Learning From Data,
     Prentice Hall 2006
   • Sydsæter: Mathematik für Wirtschaftswissenschaftler, Pearson Studium, 3.
     Auflage 2013)
Literatur zu vorausgesetzten mathematischen Grundlagen:
   • Adams, G. et al.: Mathematik zum Studieneinstieg. Springer Verlag, 6. Auf-
     lage 2013.
   • Cramer, E. und Neslehova, J.: Vorkurs Mathematik. Springer Verlag, 5.
     Auflage 2013.

Populärwissenschaftliche Literatur

Es handelt sich um Literaturempfehlungen für Interessierte. Sämtliche Bücher
sind für ein breites Publikum ohne Vorkentnisse in Wahrscheinlichkeitsrechnung
oder Statistik geschrieben. Hauptsächlich geht es um spannende Probleme aus
dem Bereich Wahrscheinlichkeitsrechnung, um eine kritische Betrachtung der mo-
mentanen Forschungslandschaft und/oder leicht verständliche Darstellungen der
Statistik.
   • Beck-Bornholdt und Dubben: Der Hund, der Eier legt. Erkennen von Fehl-
     information durch Querdenken, Rowohlt 2001
   • Bewersdorf: Glück, Logik und Bluff. Mathematik im Spiel - Methoden, Er-
     gebnisse und Grenzen, Vieweg 2007
   • Gigerenzer: Das Einmaleins der Skepsis. Über den richtigen Umgang mit
     Zahlen und Risiken, Berliner Taschenbuch Verlag 2004
   • Heuer, A. Der perfekte Tipp: Statistik des Fus̈sballspiels, 2012
   • Holland, B.K.: What are the chances?. Johns Hopkins University Press.
   • Randow: Das Ziegenproblem. Denken in Wahrscheinlichkeiten, Rowohlt Ta-
     schenbuch 2004
   • Krämer: Denkste! Trugschlüsse aus der Welt der Zahlen und des Zufalls,
     Piper 1998
   • Krämer: So lügt man mit Statistik, Piper 2000
Statistische Datenanalyse WS 2018/19                                          11

   • Krämer: Statistik verstehen. Eine Gebrauchsanweisung, Piper 2001
   • Mukherjee S. Der König aller Krankheiten: Krebs - eine Biografie, DuMont
     Buchverlag, 4. Auflage 2012.
   • Olofsson, P. Probabilities. The Little Numbers That Rule our Lives. Wiley.
   • Senn: Dicing with Death. Chance, Risk and Health, Cambridge University
     Press 2003
   • Spiegel Titel 20/2013 Leben nach Zahlen.
   • Singh, S. Geheime Botschaften. Die Kunst der Verschlüsselung von der
     Antike bis in die Zeiten des Internet, Deutscher Taschenbuch Verlag, 2001.
   • Singh, S. Fermats letzter Satz, Deutscher Taschenbuch Verlag, 2000.
   • Tolan, M. Manchmal gewinnt der Bessere: Die Physik des Fußballspiels,
     Piper Verlag, 4. Auflage 2011.
   • Wesson, J. Fußball - Wissenschaft mit Kick: Von der Physik fliegender Bälle
     und der Statistik des Spielausgangs, Spektrum Akademischer Verlag, 2010.
Sie können auch lesen