ANGEWANDTE STATISTIK UND QUANTITATIVE METHODEN BLOCKSEMINARE IM SOSE 2017 - WIWI
←
→
Transkription von Seiteninhalten
Wenn Ihr Browser die Seite nicht korrekt rendert, bitte, lesen Sie den Inhalt der Seite unten
Was Wann Wo Zwei Blockseminare im Mai 2017 Alternativ in Augsburg oder in Teisendorf Vorträge im Zweierteam Möglichkeit 1: 24.05.-28.05.2017 Ederhof im oberbayerischen Teisendorf Unterbringung in Ferienwohnungen auf dem Ederhof Kosten für Unterbringung mit Frühstück: 110 Euro pro Person Möglichkeit 2 (In Augsburg, voraussichtlich in der Woche vom 15.05-19.05, an 2 Tagen) Ganztags
Impressionen aus Teisendorf
Wer kann sich bewerben? Themen sowohl für Bachelor- als auch für Masterstudierende Einbringbarkeit (bitte kontaktieren Sie bei Fragen zur Einbringbarkeit im Zweifel Ihren Modulbetreuer!) Bachelor iBWL und GBM (PO 2008): Cluster F&I, L&I, S&I, Sonstige Leistung oder Hausarbeit/Seminararbeit BWL und VWL (PO 2015): Major/Minor F&I, Major/Minor O&Im GBM (PO 2013, PO 2015): Global Business and Economics WIN (PO 2008): Modul DWI Finance & IM und DWI Operations & IM WIN (PO 2015): Ergänzende Kompetenzen ReWi (PO 2008): Betriebswirtschaftslehre & Methoden, PO 2015: Allgemeiner Bereich Master iBWL und EPP: Major/Minor F&I, Major/Minor O&IM DFM und Master Wirtschaftsmathematik: Cluster F&I, Cluster O&IM ReWi: SP: Bank & Kapitalmarkt Informatik & Informationswirtschaft: Cluster F&I und O&IM GBM: Methoden Bewerbung ausschließlich als Zweierteam: Hierbei sind als Team nur Gruppenzusammensetzungen Bachelor+Bachelor bzw. Master+ Master aus Prüfungsordnungen mit gleicher Credit-Anzahl (5LP / 6 LP) möglich. Der Lehrstuhl vermittelt keine Seminarpartner: Wer einen Seminarpartner sucht: Hierzu steht im Studentenforum der Bereich „Angewandte Statistik und quantitative Methoden“ bereit: http://studentenforum.uni-augsburg.de/viewforum.php?f=2270
Bewerbungsverfahren Bewerbung ab 14.01.2017 bis einschließlich 14.02.2017 Die Bewerbung funktioniert nicht nach dem Prinzip „First come, first serve“: Die Auswahl und Themenvergabe erfolgt nach Leistungskriterien: Jede Bewerberin/Jeder Bewerber muss daher neben seiner Online-Bewerbung während der Bewerbungsfrist einen aktuellen, vollständigen Studis-Auszug per Mail an karin.wuensch@wiwi.uni-augsburg.de schicken. Unvollständige Bewerbungen (z.B. ohne Studis-Auszug) werden nicht berücksichtigt Anmeldetool auf der Website des Lehrstuhl Okhrin (dieses wird ab 14.01.2017 verfügbar sein) Hierbei muss jedes Team eine Präferenzordnung von bis zu 5 Themen angeben Somit werden wir versuchen, den Nutzen zu maximieren: Teams, welche ausgewählt wurden und nicht ihre Erstpräferenz bekommen, werden möglichst ihre nächste Präferenz angeboten bekommen Bewerbung ausschließlich als Zweierteam: Hierbei sind als Team nur Gruppenzusammensetzungen Bachelor+Bachelor bzw. Master + Master aus Prüfungsordnungen mit gleicher Credit-Anzahl für das Seminar (5LP / 6 LP) möglich Jedes Thema wird pro Ort (Teisendorf/Augsburg) höchstens einmal vergeben Thema 3 wird nur für Teisendorf vergeben (siehe entsprechende Folie) Themen- und Ortzusage gegen Ende Februar/Anfang März 2017
Hinweise zu den Vorträgen: „Spielregeln“ Vorträge im Zweierteam, möglichst frei gehalten Zieldauer 60 Minuten (gleichmäßig auf beide Seminaristen aufgeteilt), anschließend 15 Minuten Diskussion Beamer und 2 Notebooks vorhanden: eigene Notebooks mitbringen ist nicht notwendig. Kein Overheadprojektor, Flipchart o. Ä. Für das gesamte Publikum, nicht nur die Dozenten Handouts nicht erforderlich Die Präsentation ist als wissenschaftliche Leistung in Präsentationsform zu betrachten! Teilnahme an der Diskussion; Mitarbeit geht in die Bewertung ein Abgabe der Präsentation ausschließlich in digitaler Form bis (inklusive) 12.05.2017, 12:00 Uhr Gehalten werden die Vorträge mit den am 12.05.2017 abgegebenen Präsentationen.
Themenübersicht 1. Modellierung von Wartezeiten 2. Sind Zeitkonsistenz und Risikoaversion miteinander vereinbar? 3. Schätzung des Endvermögens bei Buy-and-Hold-Strategien: Erwartungswert, Median oder Modalwert ? 4. Das loglineare Modell 5. Statistische Verfahren zur Identifikation von E-Mail-Spam 6. Die Prognose von Währungsrenditen mit Stimmungsindikatoren 7. Der Gibbs Sampler 8. In-Sample (IS) vs. Out-of-Sample (OS): weisen IS gefittete Modelle OS-Prognosekraft auf?
1. Modellierung von Wartezeiten (Duration models; Failure time models) Es ist in der Praxis häufig von Interesse, die Wartezeit bis zu einem bestimmten Ereignis zu modellieren oder auch vorherzusagen; z.B. Ausfallzeiten der Produktion wegen technischer Störungen, die Wartezeit beim Anruf in einem Call Center, oder z.B. Reparaturzeiten und auch Reaktionszeiten des Notdienstes, Dauer der Funktionsfähigkeit eines technischen Teils, Verspätungszeiten bei Fluglinien, Dauer der Arbeitslosigkeit von Arbeitssuchenden usw. Ein geeignetes statistisches Modell soll es ermöglichen, Aussagen über die erwartete Wartezeit, die Variabilität der Wartezeit sowie die Merkmale, welche die Wartezeit beeinflussen, zu treffen. Dies soll es ermöglichen, die durch das Modell beschriebenen Prozesse zu optimieren, und auch die Wartezeiten zu minimieren und somit auch die unerwünschten Folgen (zu) langer Wartezeiten zu begrenzen. Aufgabenstellung • Erklären Sie anhand eines Beispiels die Problematik der Modellierung von Wartezeiten. • Stellen Sie die wichtigsten Begriffe der Wartezeitmodellierung vor und erklären Sie diese in Ihrer eigenen Darstellung mit Hilfe eines selbst gewählten Datensatzes • Stellen Sie das Hazard-Modell sowie deren Varianten vor, z.B. das proportionale Hazard-Modell, usw. • Passen Sie das Modell an die Daten an und führen Sie eine ökonomische und statistische Auswertung des Modells durch. Literatur • Kiefer, N., 1988, Economic Duration Data and Hazard Functions. Journal of Economic Literature 26, p. 646- 679 • Cameron, A.C. und P. K. Trivedi, 2007, Microeconometrics, Cambridge University Press (Kapitel 17) • Eigene Recherche Betreuer: Yarema Okhrin / Sebastian Heiden
2. Sind Zeitkonsistenz und Risikoaversion miteinander vereinbar? Zur Lösung dynamischer Entscheidungsmodelle sind vollständige Verhaltenspläne zu ermitteln, die für jeden Entscheidungsknoten die dann zu treffende (Stufen-)Entscheidung vorschreiben. Solche Pläne heißen zeitkonsistent, falls kein Anreiz besteht, zu einem späteren Zeitpunkt davon abzuweichen. Ist der Entscheidungsträger risikoneutral und seine Zielfunktion additiv, so lassen sich zeitkonsistente Pläne mithilfe dynamischer Optimierung bestimmen. Allerdings stellt sich die Frage, ob bzw. inwiefern dies auch bei Risikoaversion zutrifft. Aufgabenstellung Erläuterung des Begriffs „Zeitkonsistenz“ und seiner Varianten. Diskussion der Zeit(in)konsistenz optimaler Politiken unter Risikoneutralität sowie unter Risikoaversion anhand selbst erstellter Beispiele. Klärung der Fragen, ob bzw. unter welchen Voraussetzungen optimale Politiken unter Risikoaversion zeitkonsistent sind bzw. sein können. Ausgangsliteratur Bamberg/Krapp (2016): Is time consistency compatible with risk aversion? Review of Managerial Science 10, 195–211 Bamberg/Spremann (1981): Implications of constant risk aversion, Z Oper Res 25:295–224 Eigene Recherche Betreuer: Michael Krapp
3. Schätzung des Endvermögens bei Buy-and- Hold-Strategien: Erwartungswert, Median oder Modalwert? Aufgabenstellung • Darstellung und Diskussion der Problemstellung anhand der Literatur (mit und ohne Verteilungsannahmen) • Darstellung des Problems durch selbst gewählte Zahlenbeispiele und ggf. durch Simulationen in der Statistiksprache R oder Excel Ausgangsliteratur Hughson, E. Stutzer, M., Yung, C. (2006): The Misuse of Expected Returns, in: Financial Analysts Journal 62, 88-96. Eigene Recherche Betreuer: Günter Bamberg Hinweis: Dieses Thema wird nur für den Vortragsort Teisendorf angeboten
4. Das loglineare Modell Die klassische lineare Regressionsanalyse findet Anwendung, wenn die Zielvariable stetig ist und approximativ durch eine Normalverteilung beschrieben werden kann. Falls die Zielvariable diese Annahmen nicht erfüllt, gibt es eine Reihe alternativer Regressionsmodelle. Darunter findet sich das loglineare Modell, welches zur Modellierung von Zähldaten eingesetzt wird. Zähldaten liegen vor allem vor, wenn die Anzahl von Ereignissen, innerhalb eines festgelegten Zeitraums von Interesse ist. Beispiele sind die Anzahl der Übernahmeangebote an eine Firma oder die Anzahl der Schadensfälle einer Versicherung. Handelt es sich, wie in den Beispielen, um seltene Ereignisse wird häufig die Poissonverteilung zugrunde gelegt. In diesem Fall spricht man vom loglinearen Poisson-Modell. Außerdem treten Zähldaten bei der Untersuchung von Häufigkeitstabellen zur Analyse von Abhängigkeitsstrukturen zwischen nominalen Variablen auf. Im Rahmen der Arbeit sollen die loglinearen Modelle vorgestellt werden. Die Theorie soll mithilfe einer Analyse in R veranschaulicht werden. Aufgabenstellung Erläutern Sie den Begriff der Zähldaten und deren klassischen Verteilungsannahmen. Stellen Sie das loglineare Modell, unter der präzisen Spezifikation der Modellannahmen, vor. Erklären Sie den Einsatz der loglinearen Regression zur Modellierung seltener Ereignisse, sowie zur Analyse von Abhängigkeitsstrukturen. Gehen Sie auf das Problem der Dispersion ein und stellen Sie eine Möglichkeit vor diesem zu begegnen. Veranschaulichen Sie den Einsatz der loglinearen Regression anhand einer Datenanalyse in R. Literatur Tutz, G. (2000): „Die Analyse kategorialer Daten: anwendungsorientierte Einführung in Logit-Modellierung und kategoriale Regression“, Oldenbourg. Fahrmeir, L.; Kneib, T. & Lang, S. (2009): „Regression“, Springer. Greene, W. (2003): „Econometric analysis“, Pearson Education India. Crawley, M: „The R Book“, John Wiley & Sons. Betreuerin: Ellena Nachbar
5. Statistische Verfahren zur Identifikation von E- Mail-Spam Durch den Versand von E-Mail-Spam entsteht jährlich ein weltweiter Schaden in zweistelliger Milliardenhöhe. Aus Unternehmenssicht muss für die Identifikation und die Löschung der Spam-Mails eine beachtliche Arbeitszeit aufgewendet werden. Das Ziel von sogenannten „Spam-Filtern“ ist es, die Identifikation zu automatisieren. Die Filter bedienen sich dazu Verfahren aus der Statistik. Zu einer der populärsten Verfahrensgruppen zählen sogenannte „Bayes-Filter“, welche von diversen E-Mail- Programmen verwendet werden. Aufgabenstellung Motivation des Bayes-Theorems. Vorstellung und Erläuterung des Bayes-Filters nach Graham P (2002). Vorstellung und Erläuterung alternativer bayesscher Verfahren zur Filterung von Spam. Vergleich der vorgestellten Verfahren anhand geeigneter Gütemaße. Ausblick auf weitere statistische Verfahren zur Bekämpfung von Spam. Ausgangsliteratur Graham P (2002): A Plan for Spam: http://www.paulgraham.com/spam.html Metsis V, Androutsopoulos I, Paliouras G (2006): Spam Filtering with Naive Bayes – Which Naive Bayes?, Third Conference on Email and Anti-Spam (CEAS). Schutt R, O'Neil C (2013): Doing data science: Straight talk from the frontline, O'Reilly Media. Eigene Recherche. Betreuer: Deniz Preil
6. Die Prognose von Währungsrenditen mit Stimmungsindikatoren Die Prognose von Währungsrenditen wird in der Finance in einer Vielzahl von empirischen Papers untersucht. Währungskurse werden hierbei sowohl durch die Entscheidung von Zentralbanken als auch durch die Erwartungen bezüglich zukünftiger ökonomischer Entwicklungen getrieben. Menkhoff und Rebitzky (2008) und Heiden et. al. (2013) entdecken, dass die in Umfragen abgegebenen Erwartungen von Anlegern bezüglich der zukünftigen Entwicklung von Währungen Prognosekraft für Währungsrenditen des Währungspaares Euro/US- Dollar besitzen und diese Prognosekraft auch ökonomisch nutzbar ist. Aufgabenstellung Die Untersuchung von Heiden et. al (2013) soll in Teilbereichen eigenständig empirisch nachvollzogen werden. Die Entwicklung und die Stabilität der Ergebnisse von Heiden et. al (2013) sollen auf einem bis heute ausgedehnten Datensatz betrachtet werden. Besonderes Augenmerk soll dabei auf eine mögliche Veränderung der Ergebnisse seit Ende des Datensatzes (Juli 2010) gelegt werden Die Veränderung der Regressionsparameter und Signifikanzen über die Zeit soll mittels Rolling- und Expanding- Window-Methodiken untersucht werden Die empirische Untersuchung muss dabei in der Statistiksprache R durchgeführt werden. Ausgangsliteratur Menkhoff, L. and Rebitzky, R. R., ‘Investor sentiment in the US-dollar: longer-term, non-linear orientation on PPP’, Journal of Empirical Finance, Vol. 15, 2008, pp. 455–67. Beyond Fundamentals: Investor Sentiment and Exchange Rate Forecasting, 2013, European Financial Management, Vol. 19, Issue 3, S. 558-579 (mit C. Klein und B. Zwergel). Sentiment-Daten von www.sentix.de werden vom Betreuer gestellt. Betreuer: Sebastian Heiden
7. Der Gibbs Sampler Sehr oft in der Praxis ist eine Wahrscheinlichkeitsverteilung analytisch unzugänglich. Um solche Verteilungen zu analysieren, werden Markov Chain Monte Carlo (MCMC) Verfahren eingesetzt. Diese Methoden dienen der Erzeugung eines Samples, aber im Gegensatz zu gewöhnlichen Zufallszahlengeneratoren werden abhängige Realisierungen mit Hilfe einer Markov-Kette erzeugt. Die Grenzverteilung der Markovkette entspricht der Zielverteilung. Der Gibbs Sampler ist eiesn der ersten und effektivsten MCMC-Verfahren. Aufgabenstellung Die für das Thema relevanten Aspekte von Simulation und Theorie der Markov-Ketten sollen anschaulich präsentiert werden. Der Gibbs Sampler ist detailliert zu erläutern. Praktische Umsetzung in R. Literatur Hastings, W. K. (1970): Monte Carlo Sampling Methods Using Markov Chains and Their Applications, Biometrika 57, S. 97—109. Robert, C. P./Casella, G. (2010): Introducing Monte Carlo Methods with R, Springer, New York et al., insbesondere Kapitel 6 und 7. Eigene Recherche. Betreuer: Eugen Ivanov
8. In-Sample (IS) vs. Out-of-Sample (OS): weisen IS gefittete Modelle OS-Prognosekraft auf? Für den In-Sample-Fit, also die Auswahl der Regressoren eines Regressionsmodells können verschiedene Kriterien – wie das Bestimmtheitsmaß R2 oder Informationskriterien (AIC, BIC) – zu Grunde gelegt werden. Die Verwendung dieser Kriterien führt aber oftmals zu Modellen, die eine recht große Anzahl an Regressoren aufweisen. Modelle mit einer Vielzahl an Regressoren werden aus verschiedenen Gründen für die Prognose von zukünftigen Werten oftmals sehr kritisch gesehen. Aufgabenstellung Es ist empirisch zu untersuchen, ob die IS gefitteten Modelle auch eine größere OS-Prognosekraft besitzen. Dazu sollen zunächst anhand der beschriebenen Kriterien die „besten“ Modelle ausgewählt werden. Zum OS-Vergleich der Prognosekraft sollen geeignete Tests verwendet werden. Die Thematik soll anhand eines oder mehrerer geeigneter, selbst erstellter empirischer Beispiele dargestellt werden. Die nötigen Berechnungen und Tests müssen mittels der freien Statistik-Software „R“ durchgeführt werden. Ausgangsliteratur Inoue, A. & Kilian, L., 2005. In-Sample or Out-of-Sample Tests of Predictability: Which One Should We Use? Econometric Reviews, 23(4), S.371–402. Weitere selbst recherchierte Literatur Betreuer: Dominik Schneller
Adresse Ederhof Familie Engelbert Wankner Öd 1 83317 Teisendorf Telefon 08666 71 41 Telefax 08666 92 87 06 http://www.bauernhofurlaub-ederhof.de Anreise per Bahn, Auto (ca. 2 ½ Stunden von Augsburg)
Nicht vergessen… Badezeug Wanderschuhe Fahrrad (Mountainbike sinnvoll)
Sie können auch lesen