Statistik Vorlesung - Uni Graz
←
→
Transkription von Seiteninhalten
Wenn Ihr Browser die Seite nicht korrekt rendert, bitte, lesen Sie den Inhalt der Seite unten
Statistik Vorlesung 11. Mai 2021 Dauer der Prüfung: 90 Minuten ZUNAME: VORNAME: MATR.NR.: ERLAUBT: Skriptum des Instituts, nicht-graphikfähiger Taschenrechner VERBOTEN: alle sonstigen Unterlagen, graphikfähiger Taschenrechner, Handys Bei den Single-Choice-Fragen bringt eine richtige Antwort 2 Punkte und eine falsche 1 Punkt Abzug. Es gibt keine negative Punktemitnahme in ein anderes Beispiel. Aufgabe max. Punkte erreichte Punkte 1 12 2 10 3 20 4 20 5 30 6 8 Summe 100 Note
1. (12 Punkte) a) Für alle kardinalen Daten gilt: Das erste Quartil ist dreimal so klein wie das dritte Quartil. Richtig Falsch b) Der korrigierte Kontingenzkoeffzient zwischen den Merkmalen Wolkengattung“ und Wind- ” ” geschwindigkeit“ betrage 0,85. Es besteht somit ein starker positiver Zusammenhang zwi- schen diesen beiden Merkmalen. Richtig Falsch c) Bei einer diskreten Zufallsvariablen X gilt stets: P (−2 < X ≤ 10) = F (10) − F (−2) Richtig Falsch d) Sei f (x) die Dichtefunktion einer beliebigen Zufallsgröße, dann muss immer gelten: f (x) ≤ 1 für alle x des Definitionsbereichs. Richtig Falsch e) Eine Vervierfachung der Stichprobengröße führt zur Halbierung der Breite des Konfidenz- intervalls für den Anteilswert einer Alternative. Richtig Falsch f) Wenn die überwiegende Mehrheit der Residuen unterhalb der x-Achse liegen, kann der Achsenabschnitt der geschätzten Geraden zu niedrig geschätzt worden sein. ri = Yi − Ŷi Richtig Falsch
2. (10 Punkte) Die folgenden vier Graphiken zeigen Funktionen F (x), die von einem Merkmal X abhängen. Graphik A Graphik B Graphik C Graphik D a) Graphik A zeigt die Verteilungsfunktion einer stetigen Zufallsvariablen. Richtig Falsch b) Die Dichte, die zur Funktion F (x) in Graphik B gehört, hat Sprungstellen für die Werte 0, 3, 7, 13 und 15 des Merkmals X. Richtig Falsch c) Graphik C zeigt eine symmetrische Verteilung. Richtig Falsch d) Die Funktion F (x) in Graphik C ist deshalb eine Verteilungsfunktion, weil die Werte auf der x-Achse zwischen 0 und 1 liegen. Richtig Falsch e) Die Wahrscheinlichkeit, einen Wert höher als 4 zu erhalten, beträgt für das Merkmal in Graphik D etwa 5 %. Richtig Falsch
3. Die folgende Tabelle zeigt Verspätungen im Bahnreiseverkehr: Verspätung (in Minuten) Anzahl der Züge [0; 30[ 360 [30; 60[ 240 [60; 120[ 300 [120; 220] 100 1.000 a) (10 Punkte) Stellen Sie die Häufigkeitsverteilung der Verspätungen durch ein Histogramm grafisch dar! b) (6 Punkte) Berechnen Sie näherungsweise das arithmetische Mittel sowie die Standardab- weichung für die Dauer der Verspätung! c) (4 Punkte) Bestimmen Sie näherungsweise mit Hilfe Ihrer Zeichnung den Anteil der Züge, deren Verspätung mehr als 3 Stunden betrug! Ausführung Beispiel 3:
Ausführung Beispiel 3:
4. a) (10 Punkte) Ein Student nimmt völlig unvorbereitet an einer Single-Choice-Computer- Prüfung teil. Die Prüfung besteht aus 6 Fragen mit je 4 Antwortmöglichkeiten. Genau eine dieser Antwortmöglichkeiten ist korrekt. 1. Wie hoch ist die Wahrscheinlichkeit, dass er durch zufälliges Ankreuzen eine postive Note (> 50 % der Fragen korrekt beantwortet) erzielt? Runden Sie auf 3 Nachkom- mastellen! 2. Bestimmen Sie den Erwartungswert für die Anzahl der korrekt beantworteten Fragen! 3. Bestimmen Sie den Erwartungswert für die Anzahl der korrekt beantworteten Fragen, wenn Sie wissen, dass der Student eine positive Note hat! Ausführung Beispiel 4a:
Ausführung Beispiel 4a:
b) (10 Punkte) Eine Zufallsgröße X ist N (30; 5)-verteilt. 1. Wie hoch ist der Erwartungswert? Bestimmen Sie die Wahrscheinlichkeit für diesen! 2. Mit welcher Wahrscheinlichkeit nimmt X Werte größer als 32 an? 3. Bestimmen Sie den Wert c, für den gilt: P (X ≥ c) = 0,25! Ausführung Beispiel 4b:
Ausführung Beispiel 4b:
5. a) (10 Punkte) Ein Unternehmen bietet für die Mitarbeiter an drei Tagen Corona-Tests an. Um die Auslastung der betrieblichen Teststraße zu überprüfen, wurden folgende Daten erhoben: Wochentag Montag Mittwoch Freitag Anzahl Testungen 45 39 63 Der Arbeitsmediziner ist aufgrund der vorliegenden Daten der Überzeugung, dass die Mit- arbeiter überwiegend freitags die Teststraße nützten, um für private Vergnügen getestet zu sein. Offensichtlich seien nicht alle Wochentage für die Testungen gleich beliebt. Hat der Arbeitsmediziner mit einer Sicherheit von mindestens 95 % recht, dass die Auslastung nicht gleichmäßig ist? 1. Welcher Test ist anzuwenden? 2. Formulieren Sie die Hypothesen dieses Tests! 3. Berechnen Sie den Testwert. 4. Wie lautet der Kritische Bereich? 5. Wie ist zu entscheiden? 6. Interpretieren Sie das Ergebnis verbal. Ausführung Beispiel 5a:
b) (6 Punkte) In diesem Unternehmen wurden 500 Mitarbeiter über die Bereitschaft, sich testen zu lassen, befragt. Demzufolge lassen sich 55 % der Befragten wöchentlich testen, das einseitige Konfidenzintervall lautet: [0; 0,59]. Welche Treffsicherheit hat dieses einseitige Konfidenzintervall? Ausführung Beispiel 5b:
c) (14 Punkte) Der Arbeitsmediziner hat in einer Fachzeitschrift darüber gelesen, dass die Testangebote vor allem von Frauen angenommen werden. Kann auch er dem zustimmen? Da er über keine Statistik-Kenntnisse verfügt, möchte er Ihnen diese Aufgabe übertragen. Daten hätte er für einen korrekten Test in den letzten 8 Wochen genug gesammelt, aber damit dieses Beispiel nicht zu umfangreich wird, stellt er folgenden Datensatz über die An- zahl der Testungen von je 5 zufällig ausgewählten Mitarbeiterinnen (X) und Mitarbeitern (Y ) zu Verfügung: Anzahl der Testungen Frauen (X) 22 19 24 14 23 Männer (Y ) 7 19 21 16 13 Werden die Testangebote mehr von Frauen wahrgenommen als von Männern? 1. Welcher Test ist ohne Annahme von Normalverteilungen anzuwenden? Begründen Sie Ihre Entscheidung! 2. Formulieren Sie die Hypothesen dieses Tests! 3. Berechnen Sie den Testwert! 4. Bestimmen Sie den p-value! 5. Der Arbeitsmediziner gibt sich mit einem Testniveau von 5 % zufrieden. Was antworten Sie dem Arbeitsmediziner? Ausführung Beispiel 5c:
Ausführung Beispiel 5c:
6. (8 Punkte) Ein Unternehmen möchte den Barwert des Deckungsbeitrags für Investitionsvor- haben schätzen und führt mit Hilfe von Daten vergangener Investitionsprojekte eine Regres- sionsanalyse durch. Als erklärende Merkmale werden herangezogen: natürlicher Logarithmus der Investitionskosten (log ANLAGEN) für Anlagen wie Maschinen und Gebäude, natürlicher Logarithmus des Barwerts der Kosten für Mitarbeiter (log MITARBEITER), Produktgruppe (PRODUKT) mit den Ausprägungen A, B und C, sowie dem Standort der Investition (STAND- ORT) mit den Ausprägungen EU und Nicht EU. Die abhängige Variable ist der natürliche Logarithmus des Barwerts des Deckungsbeitrags vergangener Investitionsvorhaben. Koeffizient Standardfehler t-Statistik P-Wert Achsenabschnitt -3,16 0,17 -18,98 0 log ANLAGEN 0,7 0,01 79,2 0 PRODUKT B 1,14 0,15 7,49 0 PRODUKT C -1,77 0,22 -8,19 0 STANDORT Nicht EU 4,83 0,18 27,34 0 log MITARBEITER 0,45 0,04 12,49 0 a) Wie hoch ist der erwartete Barwert des Deckungsbeitrags, wenn die Firma 50 Millionen EUR in Anlagen außerhalb der EU investieren möchte, um Produkt B mit 3000 Mitarbei- tern zu produzieren? b) Was bedeutet der Koeffizient von log MITARBEITER für den Barwert des Deckungsbei- trags? Ausführung Beispiel 6:
Ausführung Beispiel 6:
Sie können auch lesen