ANGEWANDTE STATISTIK UND QUANTITATIVE METHODEN BLOCKSEMINARE IM SOSE 2017 - WIWI

Die Seite wird erstellt Ben Prinz
 
WEITER LESEN
ANGEWANDTE STATISTIK UND QUANTITATIVE METHODEN BLOCKSEMINARE IM SOSE 2017 - WIWI
Angewandte Statistik und
   Quantitative Methoden
Blockseminare im SoSe 2017
Was Wann Wo

 Zwei Blockseminare im Mai 2017
 Alternativ in Augsburg oder in Teisendorf
 Vorträge im Zweierteam

 Möglichkeit 1: 24.05.-28.05.2017
    Ederhof im oberbayerischen Teisendorf
    Unterbringung in Ferienwohnungen auf dem Ederhof
    Kosten für Unterbringung mit Frühstück: 110 Euro pro Person

 Möglichkeit 2 (In Augsburg, voraussichtlich in der Woche vom
  15.05-19.05, an 2 Tagen)
    Ganztags
Impressionen aus Teisendorf
Wer kann sich bewerben?

   Themen sowohl für Bachelor- als auch für Masterstudierende
   Einbringbarkeit (bitte kontaktieren Sie bei Fragen zur Einbringbarkeit im Zweifel Ihren
    Modulbetreuer!)
      Bachelor
             iBWL und GBM (PO 2008): Cluster F&I, L&I, S&I, Sonstige Leistung oder
                Hausarbeit/Seminararbeit
             BWL und VWL (PO 2015): Major/Minor F&I, Major/Minor O&Im
             GBM (PO 2013, PO 2015): Global Business and Economics
             WIN (PO 2008): Modul DWI Finance & IM und DWI Operations & IM
             WIN (PO 2015): Ergänzende Kompetenzen
             ReWi (PO 2008): Betriebswirtschaftslehre & Methoden, PO 2015: Allgemeiner
                Bereich
      Master
             iBWL und EPP: Major/Minor F&I, Major/Minor O&IM
             DFM und Master Wirtschaftsmathematik: Cluster F&I, Cluster O&IM
             ReWi: SP: Bank & Kapitalmarkt
             Informatik & Informationswirtschaft: Cluster F&I und O&IM
             GBM: Methoden
   Bewerbung ausschließlich als Zweierteam: Hierbei sind als Team nur
    Gruppenzusammensetzungen Bachelor+Bachelor bzw. Master+ Master aus
    Prüfungsordnungen mit gleicher Credit-Anzahl (5LP / 6 LP) möglich.
   Der Lehrstuhl vermittelt keine Seminarpartner: Wer einen Seminarpartner sucht: Hierzu
    steht im Studentenforum der Bereich „Angewandte Statistik und quantitative Methoden“
    bereit: http://studentenforum.uni-augsburg.de/viewforum.php?f=2270
Bewerbungsverfahren

   Bewerbung ab 14.01.2017 bis einschließlich 14.02.2017
   Die Bewerbung funktioniert nicht nach dem Prinzip „First come, first serve“: Die
    Auswahl und Themenvergabe erfolgt nach Leistungskriterien: Jede Bewerberin/Jeder
    Bewerber muss daher neben seiner Online-Bewerbung während der
    Bewerbungsfrist einen aktuellen, vollständigen Studis-Auszug per Mail an
    karin.wuensch@wiwi.uni-augsburg.de schicken.
   Unvollständige Bewerbungen (z.B. ohne Studis-Auszug) werden nicht berücksichtigt
   Anmeldetool auf der Website des Lehrstuhl Okhrin
    (dieses wird ab 14.01.2017 verfügbar sein)
      Hierbei muss jedes Team eine Präferenzordnung von bis zu 5 Themen angeben
      Somit werden wir versuchen, den Nutzen zu maximieren: Teams, welche
         ausgewählt wurden und nicht ihre Erstpräferenz bekommen, werden möglichst
         ihre nächste Präferenz angeboten bekommen
   Bewerbung ausschließlich als Zweierteam: Hierbei sind als Team nur
    Gruppenzusammensetzungen Bachelor+Bachelor bzw. Master + Master aus
    Prüfungsordnungen mit gleicher Credit-Anzahl für das Seminar (5LP / 6 LP)
    möglich
   Jedes Thema wird pro Ort (Teisendorf/Augsburg) höchstens einmal vergeben
   Thema 3 wird nur für Teisendorf vergeben (siehe entsprechende Folie)
   Themen- und Ortzusage gegen Ende Februar/Anfang März 2017
Hinweise zu den Vorträgen: „Spielregeln“

   Vorträge im Zweierteam, möglichst frei gehalten
   Zieldauer 60 Minuten (gleichmäßig auf beide Seminaristen aufgeteilt), anschließend
    15 Minuten Diskussion
   Beamer und 2 Notebooks vorhanden: eigene Notebooks mitbringen ist nicht
    notwendig.
   Kein Overheadprojektor, Flipchart o. Ä.
   Für das gesamte Publikum, nicht nur die Dozenten
   Handouts nicht erforderlich
   Die Präsentation ist als wissenschaftliche Leistung in Präsentationsform zu
    betrachten!
   Teilnahme an der Diskussion; Mitarbeit geht in die Bewertung ein
   Abgabe der Präsentation ausschließlich in digitaler Form bis (inklusive) 12.05.2017,
    12:00 Uhr
   Gehalten werden die Vorträge mit den am 12.05.2017 abgegebenen Präsentationen.
Themenübersicht

1.   Modellierung von Wartezeiten
2.   Sind Zeitkonsistenz und Risikoaversion miteinander vereinbar?
3.   Schätzung des Endvermögens bei Buy-and-Hold-Strategien: Erwartungswert, Median oder
     Modalwert ?
4.   Das loglineare Modell
5.   Statistische Verfahren zur Identifikation von E-Mail-Spam
6.   Die Prognose von Währungsrenditen mit Stimmungsindikatoren
7.   Der Gibbs Sampler
8.   In-Sample (IS) vs. Out-of-Sample (OS): weisen IS gefittete Modelle OS-Prognosekraft
     auf?
1. Modellierung von Wartezeiten
            (Duration models; Failure time models)

Es ist in der Praxis häufig von Interesse, die Wartezeit bis zu einem bestimmten Ereignis zu modellieren oder
auch vorherzusagen; z.B. Ausfallzeiten der Produktion wegen technischer Störungen, die Wartezeit beim Anruf
in einem Call Center, oder z.B. Reparaturzeiten und auch Reaktionszeiten des Notdienstes, Dauer der
Funktionsfähigkeit eines technischen Teils, Verspätungszeiten bei Fluglinien, Dauer der Arbeitslosigkeit von
Arbeitssuchenden usw.
Ein geeignetes statistisches Modell soll es ermöglichen, Aussagen über die erwartete Wartezeit, die Variabilität
der Wartezeit sowie die Merkmale, welche die Wartezeit beeinflussen, zu treffen. Dies soll es ermöglichen, die
durch das Modell beschriebenen Prozesse zu optimieren, und auch die Wartezeiten zu minimieren und somit
auch die unerwünschten Folgen (zu) langer Wartezeiten zu begrenzen.

Aufgabenstellung
• Erklären Sie anhand eines Beispiels die Problematik der Modellierung von Wartezeiten.
• Stellen Sie die wichtigsten Begriffe der Wartezeitmodellierung vor und erklären Sie diese in Ihrer eigenen
    Darstellung mit Hilfe eines selbst gewählten Datensatzes
• Stellen Sie das Hazard-Modell sowie deren Varianten vor, z.B. das proportionale Hazard-Modell, usw.
• Passen Sie das Modell an die Daten an und führen Sie eine ökonomische und statistische Auswertung des
    Modells durch.
Literatur
• Kiefer, N., 1988, Economic Duration Data and Hazard Functions. Journal of Economic Literature 26, p. 646-
    679
• Cameron, A.C. und P. K. Trivedi, 2007, Microeconometrics, Cambridge University Press (Kapitel 17)
• Eigene Recherche

Betreuer: Yarema Okhrin / Sebastian Heiden
2. Sind Zeitkonsistenz und Risikoaversion
          miteinander vereinbar?

Zur Lösung dynamischer Entscheidungsmodelle sind vollständige Verhaltenspläne zu ermitteln,
die für jeden Entscheidungsknoten die dann zu treffende (Stufen-)Entscheidung vorschreiben.
Solche Pläne heißen zeitkonsistent, falls kein Anreiz besteht, zu einem späteren Zeitpunkt davon
abzuweichen. Ist der Entscheidungsträger risikoneutral und seine Zielfunktion additiv, so lassen
sich zeitkonsistente Pläne mithilfe dynamischer Optimierung bestimmen. Allerdings stellt sich die
Frage, ob bzw. inwiefern dies auch bei Risikoaversion zutrifft.

Aufgabenstellung
   Erläuterung des Begriffs „Zeitkonsistenz“ und seiner Varianten.
   Diskussion der Zeit(in)konsistenz optimaler Politiken unter Risikoneutralität sowie unter Risikoaversion
    anhand selbst erstellter Beispiele.
   Klärung der Fragen, ob bzw. unter welchen Voraussetzungen optimale Politiken unter Risikoaversion
    zeitkonsistent sind bzw. sein können.

Ausgangsliteratur
  Bamberg/Krapp (2016): Is time consistency compatible with risk aversion? Review of Managerial Science
   10, 195–211
  Bamberg/Spremann (1981): Implications of constant risk aversion, Z Oper Res 25:295–224
  Eigene Recherche

Betreuer: Michael Krapp
3. Schätzung des Endvermögens bei Buy-and-
           Hold-Strategien: Erwartungswert, Median oder
           Modalwert?

Aufgabenstellung

•   Darstellung und Diskussion der Problemstellung anhand der Literatur (mit und ohne
    Verteilungsannahmen)
•   Darstellung des Problems durch selbst gewählte Zahlenbeispiele und ggf. durch Simulationen in der
    Statistiksprache R oder Excel

Ausgangsliteratur
  Hughson, E. Stutzer, M., Yung, C. (2006): The Misuse of Expected Returns, in: Financial Analysts Journal
   62, 88-96.
  Eigene Recherche

Betreuer: Günter Bamberg
Hinweis: Dieses Thema wird nur für den Vortragsort Teisendorf angeboten
4. Das loglineare Modell

Die klassische lineare Regressionsanalyse findet Anwendung, wenn die Zielvariable stetig ist und approximativ durch eine
Normalverteilung beschrieben werden kann. Falls die Zielvariable diese Annahmen nicht erfüllt, gibt es eine Reihe
alternativer Regressionsmodelle. Darunter findet sich das loglineare Modell, welches zur Modellierung von Zähldaten
eingesetzt wird. Zähldaten liegen vor allem vor, wenn die Anzahl von Ereignissen, innerhalb eines festgelegten Zeitraums
von Interesse ist. Beispiele sind die Anzahl der Übernahmeangebote an eine Firma oder die Anzahl der Schadensfälle einer
Versicherung. Handelt es sich, wie in den Beispielen, um seltene Ereignisse wird häufig die Poissonverteilung zugrunde
gelegt. In diesem Fall spricht man vom loglinearen Poisson-Modell. Außerdem treten Zähldaten bei der Untersuchung von
Häufigkeitstabellen zur Analyse von Abhängigkeitsstrukturen zwischen nominalen Variablen auf. Im Rahmen der Arbeit
sollen die loglinearen Modelle vorgestellt werden. Die Theorie soll mithilfe einer Analyse in R veranschaulicht werden.

   Aufgabenstellung
      Erläutern Sie den Begriff der Zähldaten und deren klassischen Verteilungsannahmen.
      Stellen Sie das loglineare Modell, unter der präzisen Spezifikation der Modellannahmen, vor.
      Erklären Sie den Einsatz der loglinearen Regression zur Modellierung seltener Ereignisse, sowie zur Analyse
         von Abhängigkeitsstrukturen.
      Gehen Sie auf das Problem der Dispersion ein und stellen Sie eine Möglichkeit vor diesem zu begegnen.
      Veranschaulichen Sie den Einsatz der loglinearen Regression anhand einer Datenanalyse in R.

   Literatur
       Tutz, G. (2000): „Die Analyse kategorialer Daten: anwendungsorientierte Einführung in Logit-Modellierung
          und kategoriale Regression“, Oldenbourg.
       Fahrmeir, L.; Kneib, T. & Lang, S. (2009): „Regression“, Springer.
       Greene, W. (2003): „Econometric analysis“, Pearson Education India.
       Crawley, M: „The R Book“, John Wiley & Sons.

Betreuerin: Ellena Nachbar
5. Statistische Verfahren zur Identifikation von E-
         Mail-Spam

Durch den Versand von E-Mail-Spam entsteht jährlich ein weltweiter Schaden in zweistelliger
Milliardenhöhe. Aus Unternehmenssicht muss für die Identifikation und die Löschung der Spam-Mails
eine beachtliche Arbeitszeit aufgewendet werden. Das Ziel von sogenannten „Spam-Filtern“ ist es, die
Identifikation zu automatisieren. Die Filter bedienen sich dazu Verfahren aus der Statistik. Zu einer der
populärsten Verfahrensgruppen zählen sogenannte „Bayes-Filter“, welche von diversen E-Mail-
Programmen verwendet werden.

Aufgabenstellung
   Motivation des Bayes-Theorems.
   Vorstellung und Erläuterung des Bayes-Filters nach Graham P (2002).
   Vorstellung und Erläuterung alternativer bayesscher Verfahren zur Filterung von Spam.
   Vergleich der vorgestellten Verfahren anhand geeigneter Gütemaße.
   Ausblick auf weitere statistische Verfahren zur Bekämpfung von Spam.

Ausgangsliteratur
  Graham P (2002): A Plan for Spam: http://www.paulgraham.com/spam.html
  Metsis V, Androutsopoulos I, Paliouras G (2006): Spam Filtering with Naive Bayes – Which Naive
   Bayes?, Third Conference on Email and Anti-Spam (CEAS).
  Schutt R, O'Neil C (2013): Doing data science: Straight talk from the frontline, O'Reilly Media.
   Eigene Recherche.

Betreuer: Deniz Preil
6. Die Prognose von Währungsrenditen mit
              Stimmungsindikatoren

Die Prognose von Währungsrenditen wird in der Finance in einer Vielzahl von empirischen Papers untersucht.
Währungskurse werden hierbei sowohl durch die Entscheidung von Zentralbanken als auch durch die
Erwartungen bezüglich zukünftiger ökonomischer Entwicklungen getrieben. Menkhoff und Rebitzky (2008) und
Heiden et. al. (2013) entdecken, dass die in Umfragen abgegebenen Erwartungen von Anlegern bezüglich der
zukünftigen Entwicklung von Währungen Prognosekraft für Währungsrenditen des Währungspaares Euro/US-
Dollar besitzen und diese Prognosekraft auch ökonomisch nutzbar ist.

Aufgabenstellung
   Die Untersuchung von Heiden et. al (2013) soll in Teilbereichen eigenständig empirisch nachvollzogen werden.
   Die Entwicklung und die Stabilität der Ergebnisse von Heiden et. al (2013) sollen auf einem bis heute
    ausgedehnten Datensatz betrachtet werden.
   Besonderes Augenmerk soll dabei auf eine mögliche Veränderung der Ergebnisse seit Ende des Datensatzes (Juli
    2010) gelegt werden
   Die Veränderung der Regressionsparameter und Signifikanzen über die Zeit soll mittels Rolling- und Expanding-
    Window-Methodiken untersucht werden
   Die empirische Untersuchung muss dabei in der Statistiksprache R durchgeführt werden.

Ausgangsliteratur
   Menkhoff, L. and Rebitzky, R. R., ‘Investor sentiment in the US-dollar: longer-term, non-linear orientation on PPP’,
    Journal of Empirical Finance, Vol. 15, 2008, pp. 455–67.
   Beyond Fundamentals: Investor Sentiment and Exchange Rate Forecasting, 2013, European Financial
    Management, Vol. 19, Issue 3, S. 558-579 (mit C. Klein und B. Zwergel).
   Sentiment-Daten von www.sentix.de werden vom Betreuer gestellt.

Betreuer: Sebastian Heiden
7. Der Gibbs Sampler

Sehr oft in der Praxis ist eine Wahrscheinlichkeitsverteilung analytisch unzugänglich. Um solche Verteilungen
zu analysieren, werden Markov Chain Monte Carlo (MCMC) Verfahren eingesetzt. Diese Methoden dienen der
Erzeugung eines Samples, aber im Gegensatz zu gewöhnlichen Zufallszahlengeneratoren werden abhängige
Realisierungen mit Hilfe einer Markov-Kette erzeugt. Die Grenzverteilung der Markovkette entspricht der
Zielverteilung. Der Gibbs Sampler ist eiesn der ersten und effektivsten MCMC-Verfahren.

    Aufgabenstellung
        Die für das Thema relevanten Aspekte von Simulation und Theorie der Markov-Ketten sollen
           anschaulich präsentiert werden.
        Der Gibbs Sampler ist detailliert zu erläutern.
        Praktische Umsetzung in R.
    Literatur
        Hastings, W. K. (1970): Monte Carlo Sampling Methods Using Markov Chains and Their
           Applications, Biometrika 57, S. 97—109.
        Robert, C. P./Casella, G. (2010): Introducing Monte Carlo Methods with R, Springer, New York et
           al., insbesondere Kapitel 6 und 7.
        Eigene Recherche.

Betreuer: Eugen Ivanov
8. In-Sample (IS) vs. Out-of-Sample (OS):
           weisen IS gefittete Modelle OS-Prognosekraft
           auf?
Für den In-Sample-Fit, also die Auswahl der Regressoren eines Regressionsmodells können
verschiedene Kriterien – wie das Bestimmtheitsmaß R2 oder Informationskriterien (AIC, BIC) – zu
Grunde gelegt werden. Die Verwendung dieser Kriterien führt aber oftmals zu Modellen, die eine
recht große Anzahl an Regressoren aufweisen. Modelle mit einer Vielzahl an Regressoren
werden aus verschiedenen Gründen für die Prognose von zukünftigen Werten oftmals sehr
kritisch gesehen.

Aufgabenstellung
   Es ist empirisch zu untersuchen, ob die IS gefitteten Modelle auch eine größere OS-Prognosekraft
    besitzen. Dazu sollen zunächst anhand der beschriebenen Kriterien die „besten“ Modelle
    ausgewählt werden.
   Zum OS-Vergleich der Prognosekraft sollen geeignete Tests verwendet werden. Die Thematik soll
    anhand eines oder mehrerer geeigneter, selbst erstellter empirischer Beispiele dargestellt werden.
   Die nötigen Berechnungen und Tests müssen mittels der freien Statistik-Software „R“ durchgeführt
    werden.

Ausgangsliteratur
   Inoue, A. & Kilian, L., 2005. In-Sample or Out-of-Sample Tests of Predictability: Which One Should
    We Use? Econometric Reviews, 23(4), S.371–402.
   Weitere selbst recherchierte Literatur

Betreuer: Dominik Schneller
Adresse Ederhof

Familie Engelbert Wankner
Öd 1
83317 Teisendorf
Telefon 08666 71 41
Telefax 08666 92 87 06
http://www.bauernhofurlaub-ederhof.de

Anreise per Bahn, Auto (ca. 2 ½ Stunden von Augsburg)
Nicht vergessen…

 Badezeug
 Wanderschuhe
 Fahrrad (Mountainbike sinnvoll)
Sie können auch lesen