Statistik Vorlesung - Uni Graz

Die Seite wird erstellt Valentin Singer
 
WEITER LESEN
Statistik Vorlesung
                                     11. Mai 2021
                              Dauer der Prüfung: 90 Minuten

 ZUNAME:
 VORNAME:                                               MATR.NR.:

ERLAUBT: Skriptum des Instituts, nicht-graphikfähiger Taschenrechner
VERBOTEN: alle sonstigen Unterlagen, graphikfähiger Taschenrechner, Handys
Bei den Single-Choice-Fragen bringt eine richtige Antwort 2 Punkte und eine falsche 1 Punkt Abzug.
Es gibt keine negative Punktemitnahme in ein anderes Beispiel.

                            Aufgabe   max. Punkte    erreichte Punkte
                               1           12
                               2           10
                               3           20
                               4           20
                               5           30
                               6            8
                            Summe          100
                             Note
1. (12 Punkte)
    a) Für alle kardinalen Daten gilt: Das erste Quartil ist dreimal so klein wie das dritte Quartil.
                             Richtig                       Falsch

    b) Der korrigierte Kontingenzkoeffzient zwischen den Merkmalen Wolkengattung“ und Wind-
                                                                    ”                   ”
       geschwindigkeit“ betrage 0,85. Es besteht somit ein starker positiver Zusammenhang zwi-
       schen diesen beiden Merkmalen.
                            Richtig                     Falsch

    c) Bei einer diskreten Zufallsvariablen X gilt stets: P (−2 < X ≤ 10) = F (10) − F (−2)
                             Richtig                       Falsch

    d) Sei f (x) die Dichtefunktion einer beliebigen Zufallsgröße, dann muss immer gelten: f (x) ≤
       1 für alle x des Definitionsbereichs.
                              Richtig                      Falsch

    e) Eine Vervierfachung der Stichprobengröße führt zur Halbierung der Breite des Konfidenz-
       intervalls für den Anteilswert einer Alternative.
                             Richtig                      Falsch

    f) Wenn die überwiegende Mehrheit der Residuen unterhalb der x-Achse liegen, kann der
       Achsenabschnitt der geschätzten Geraden zu niedrig geschätzt worden sein. ri = Yi − Ŷi
                           Richtig                     Falsch
2. (10 Punkte) Die folgenden vier Graphiken zeigen Funktionen F (x), die von einem Merkmal X
   abhängen.
                           Graphik A                        Graphik B

                          Graphik C                          Graphik D

    a) Graphik A zeigt die Verteilungsfunktion einer stetigen Zufallsvariablen.
                           Richtig                      Falsch

    b) Die Dichte, die zur Funktion F (x) in Graphik B gehört, hat Sprungstellen für die Werte
       0, 3, 7, 13 und 15 des Merkmals X.
                            Richtig                    Falsch

    c) Graphik C zeigt eine symmetrische Verteilung.
                           Richtig                      Falsch

    d) Die Funktion F (x) in Graphik C ist deshalb eine Verteilungsfunktion, weil die Werte auf
       der x-Achse zwischen 0 und 1 liegen.
                           Richtig                     Falsch

    e) Die Wahrscheinlichkeit, einen Wert höher als 4 zu erhalten, beträgt für das Merkmal in
       Graphik D etwa 5 %.
                          Richtig                       Falsch
3. Die folgende Tabelle zeigt Verspätungen im Bahnreiseverkehr:

                            Verspätung (in Minuten)   Anzahl der Züge
                            [0; 30[                         360
                            [30; 60[                        240
                            [60; 120[                       300
                            [120; 220]                      100
                                                           1.000

    a) (10 Punkte) Stellen Sie die Häufigkeitsverteilung der Verspätungen durch ein Histogramm
       grafisch dar!
    b) (6 Punkte) Berechnen Sie näherungsweise das arithmetische Mittel sowie die Standardab-
       weichung für die Dauer der Verspätung!
    c) (4 Punkte) Bestimmen Sie näherungsweise mit Hilfe Ihrer Zeichnung den Anteil der Züge,
       deren Verspätung mehr als 3 Stunden betrug!

  Ausführung Beispiel 3:
Ausführung Beispiel 3:
4.   a) (10 Punkte) Ein Student nimmt völlig unvorbereitet an einer Single-Choice-Computer-
        Prüfung teil. Die Prüfung besteht aus 6 Fragen mit je 4 Antwortmöglichkeiten. Genau
        eine dieser Antwortmöglichkeiten ist korrekt.

         1. Wie hoch ist die Wahrscheinlichkeit, dass er durch zufälliges Ankreuzen eine postive
            Note (> 50 % der Fragen korrekt beantwortet) erzielt? Runden Sie auf 3 Nachkom-
            mastellen!
         2. Bestimmen Sie den Erwartungswert für die Anzahl der korrekt beantworteten Fragen!
         3. Bestimmen Sie den Erwartungswert für die Anzahl der korrekt beantworteten Fragen,
            wenn Sie wissen, dass der Student eine positive Note hat!
        Ausführung Beispiel 4a:
Ausführung Beispiel 4a:
b) (10   Punkte) Eine Zufallsgröße X ist N (30; 5)-verteilt.
    1.   Wie hoch ist der Erwartungswert? Bestimmen Sie die Wahrscheinlichkeit für diesen!
    2.   Mit welcher Wahrscheinlichkeit nimmt X Werte größer als 32 an?
    3.   Bestimmen Sie den Wert c, für den gilt: P (X ≥ c) = 0,25!
   Ausführung Beispiel 4b:
Ausführung Beispiel 4b:
5.   a) (10 Punkte) Ein Unternehmen bietet für die Mitarbeiter an drei Tagen Corona-Tests an.
        Um die Auslastung der betrieblichen Teststraße zu überprüfen, wurden folgende Daten
        erhoben:
                             Wochentag           Montag    Mittwoch    Freitag
                             Anzahl Testungen     45          39         63
        Der Arbeitsmediziner ist aufgrund der vorliegenden Daten der Überzeugung, dass die Mit-
        arbeiter überwiegend freitags die Teststraße nützten, um für private Vergnügen getestet
        zu sein. Offensichtlich seien nicht alle Wochentage für die Testungen gleich beliebt. Hat
        der Arbeitsmediziner mit einer Sicherheit von mindestens 95 % recht, dass die Auslastung
        nicht gleichmäßig ist?
         1. Welcher Test ist anzuwenden?
         2. Formulieren Sie die Hypothesen dieses Tests!
         3. Berechnen Sie den Testwert.
         4. Wie lautet der Kritische Bereich?
         5. Wie ist zu entscheiden?
         6. Interpretieren Sie das Ergebnis verbal.
        Ausführung Beispiel 5a:
b) (6 Punkte) In diesem Unternehmen wurden 500 Mitarbeiter über die Bereitschaft, sich
   testen zu lassen, befragt. Demzufolge lassen sich 55 % der Befragten wöchentlich testen,
   das einseitige Konfidenzintervall lautet: [0; 0,59].
   Welche Treffsicherheit hat dieses einseitige Konfidenzintervall?
   Ausführung Beispiel 5b:
c) (14 Punkte) Der Arbeitsmediziner hat in einer Fachzeitschrift darüber gelesen, dass die
   Testangebote vor allem von Frauen angenommen werden. Kann auch er dem zustimmen?
   Da er über keine Statistik-Kenntnisse verfügt, möchte er Ihnen diese Aufgabe übertragen.
   Daten hätte er für einen korrekten Test in den letzten 8 Wochen genug gesammelt, aber
   damit dieses Beispiel nicht zu umfangreich wird, stellt er folgenden Datensatz über die An-
   zahl der Testungen von je 5 zufällig ausgewählten Mitarbeiterinnen (X) und Mitarbeitern
   (Y ) zu Verfügung:
                                    Anzahl der Testungen
                              Frauen (X) 22 19 24 14             23
                              Männer (Y ) 7 19 21 16            13
   Werden die Testangebote mehr von Frauen wahrgenommen als von Männern?
    1. Welcher Test ist ohne Annahme von Normalverteilungen anzuwenden? Begründen Sie
       Ihre Entscheidung!
    2. Formulieren Sie die Hypothesen dieses Tests!
    3. Berechnen Sie den Testwert!
    4. Bestimmen Sie den p-value!
    5. Der Arbeitsmediziner gibt sich mit einem Testniveau von 5 % zufrieden. Was antworten
       Sie dem Arbeitsmediziner?
   Ausführung Beispiel 5c:
Ausführung Beispiel 5c:
6. (8 Punkte) Ein Unternehmen möchte den Barwert des Deckungsbeitrags für Investitionsvor-
   haben schätzen und führt mit Hilfe von Daten vergangener Investitionsprojekte eine Regres-
   sionsanalyse durch. Als erklärende Merkmale werden herangezogen: natürlicher Logarithmus
   der Investitionskosten (log ANLAGEN) für Anlagen wie Maschinen und Gebäude, natürlicher
   Logarithmus des Barwerts der Kosten für Mitarbeiter (log MITARBEITER), Produktgruppe
   (PRODUKT) mit den Ausprägungen A, B und C, sowie dem Standort der Investition (STAND-
   ORT) mit den Ausprägungen EU und Nicht EU. Die abhängige Variable ist der natürliche
   Logarithmus des Barwerts des Deckungsbeitrags vergangener Investitionsvorhaben.
                            Koeffizient   Standardfehler   t-Statistik   P-Wert
    Achsenabschnitt           -3,16            0,17          -18,98        0
    log ANLAGEN                0,7             0,01           79,2         0
    PRODUKT B                 1,14             0,15            7,49        0
    PRODUKT C                 -1,77            0,22           -8,19        0
    STANDORT Nicht EU          4,83            0,18           27,34        0
    log MITARBEITER            0,45            0,04           12,49        0
    a) Wie hoch ist der erwartete Barwert des Deckungsbeitrags, wenn die Firma 50 Millionen
       EUR in Anlagen außerhalb der EU investieren möchte, um Produkt B mit 3000 Mitarbei-
       tern zu produzieren?
    b) Was bedeutet der Koeffizient von log MITARBEITER für den Barwert des Deckungsbei-
       trags?

  Ausführung Beispiel 6:
Ausführung Beispiel 6:
Sie können auch lesen