Model Output Statistics - Vortrag im Rahmen des Seminars Medienmeteorologie Von Werner Schneider

Die Seite wird erstellt Julia Kuhn
 
WEITER LESEN
Model Output Statistics

 Vortrag im Rahmen des Seminars
       Medienmeteorologie

     Von Werner Schneider
Gliederung

1)   Behandlung von Modelldaten
2)   Funktionsweise von Model Output Statistics (MOS)
3)   Screening Regression
4)   Kreuzvalidation
5)   Auswahl von Prädiktoren
6)   Anwendung von MOS
7)   Zusammenfassung
8)   Literatur
1) Behandlung von Modelldaten

Notwendigkeit der Anpassung von Modelldaten an
reale Beobachtungsdaten

• Keine exakte Beschreibung des Atmosphärischen Systems
  durch Modelle möglich
  Î Zu große Datensätze
  Î Zu geringe Rechenleistung
• Modelldaten nur an wenigen Gitterpunkten
• Teilweise keine direkte Vorhersage der zu bestimmenden
  Größe
1) Behandlung von Modelldaten

Die Methoden : Perfect Prog

                                      • Annahme: Perfektes Modell
                                      • Analysedaten beschreiben
                                        reale Situation nur auf
                                        falschen Skalen

 Î Statistischer Zusammenhang zwischen Stationsbeobachtungen und
 Analysedaten
 Î Angewendet auf Vorhersagedaten
 Î Vorteil: Großes Datenvolumen
1) Behandlung von Modelldaten

Die Methoden : MOS

                                     • Annahme: Fehlerhaftes
                                       Modell
                                     • Modelldaten beschreiben
                                       andere Situation als
                                       Analysedaten

 Î Statistischer Zusammenhang zwischen Vorhersagedaten und
 Stationsbeobachtungen
 Î Angewendet auf Vorhersagedaten
 Î Vorteil: Keine beschränkenden Annahmen
2) Funktionsweise von MOS

Lineare Regressionsgleichung

Def.: Prädiktand > Vorherzusagende (abhängige) Variable Y
      Prädiktoren > Unabhängige Variablen Xi

¾ Linearer Ansatz:
                       Ŷ = a0X0 + a1X1 + . . . + akXk
                     mit X0 = 1 Konstante
                         Ŷ Schätzer für Y
                          ai Regressionskoeffizienten
2) Funktionsweise von MOS

Probleme

• Wie lassen sich nichtlineare Abhängigkeiten des
  Prädiktanden von Prädiktoren beschreiben ?
• Sind die Prädiktoren unabhängig voneinander ?
  ÎBildung von Funktionen eines oder mehrerer
  Prädiktoren
• Objektives Verfahren zur Bestimmung der
  optimalen Prädiktoren
3) Screening regression

Ansatz
¾ Stichprobe vom Umfang n
Minimum der mittleren quadratischen Fehler (MSE) der Stichprobe
    => Optimaler Schätzer âi
                                  1       n
                             MSE = ∑ ( yi − yˆ i ) 2
                                  n i =1
Güte der Anpassung der Regressionsgleichung gegeben durch
    Reduktion der Varianz (RV)
                   1 n                    1 n
                     ∑
                   n i =1
                          ( yi − y )² − ∑ ( yi − yˆ i )²
                                          n i =1
              RV =
                               1 n
                                 ∑
                               n i =1
                                      ( yi − y )²
3) Screening regression

Schrittweise Vorgehen
 0. Auswahl von möglichen Prädiktoren
 1. Wähle X1 mit höchster Korrelation zum Prädiktanden
       Î höchste Reduktion der Varianz RV
 2. Bestimme optimales â1
       Î Ŷ1 = â0X0 + â1X1
 3. Wähle Xk mit höchster Korrelation zu
          ( Y - Ŷk-1 )
 ...
           => Optimale Anzahl der Terme ?
4) Kreuzvalidation

Overfitting
Unendlich viele Prädiktoren
  Î Bei Anwendung auf abhängigen Datensatz
  verschwindet die Varianz

Anwendung auf unabhängigen Datensatz
 Î Nicht physikalische Zusammenhänge
 erhöhen die Varianz

Lösung: > Untergrenze für Signifikanz
        > Feste Anzahl von Prädiktoren aus Erfahrung
        > Kreuzvalidation
4) Kreuzvalidation

Vorgehensweise
• Zerlegung des
  Datensatzes
• Entwicklung der
  Regressionsgleichung aus
  abhängigem Teil
• Überprüfung am             Mit Kontrollsatz
  unabhängigen Teil                       Ohne Kontrollsatz
Î Häufig Minimum der
  Varianz bei optimaler
  Anzahl von Prädiktoren
5) Auswahl von Prädiktoren

Ein Zitat:

„ The better the preparation of the predictors
  and predictants, the better are the results „
                               (Knüpffer 1996)
5) Auswahl von Prädiktoren

Unterschiedliche Prädiktanden

• Temperaturen Î Zeitabhängige Prädiktanden
   => Gleichungen für jede Jahreszeit
• Wind Î Vektoren als Prädiktanden
   => Gleichungen für Komponenten
• Niederschlag Î Binäre Prädiktanden
   => Wahrscheinlichkeitsangaben beschränkt auf Intervall [0,1]
• Bedeckungsgrad Î Kategorisierte Prädiktanden
   => Mehrfach binäre Aufteilung
• Arbeitsplätze am Bau
   => Nur indirekte Abhängigkeit von meteorologischen Größen
5) Auswahl von Prädiktoren

Eine beliebige Wahl ?

Bestimmung der Maximaltemperatur in Bonn

• Schlüsselbegriff „kalt“          • Vorhersage
  im 100 jährigem                    Maximaltemperatur für
  Kalender                           Essen und Trier
• Beobachtung auf der
                            oder   • Beobachtung
                                     Maximaltemperatur
  Zugspitze
                                   • Vorhersage
• Vorhersage Pollenflug              Bedeckungsgrad in
  in Bonn                            Bonn

            => Subjektive Vorauswahl
5) Auswahl von Prädiktoren

Typen von Prädiktoren

• Direkter Modelloutput
• Beobachtungsgrößen Î Stationsmeldungen
• Funktionen von Ort und Zeit
  Î sin (Jahrestag/365)
  Î astronomisch: Winkel der Sonne über der Erdoberfläche
• Funktionen von Prädiktoren
• Schaltervariablen

     => Welche Prädiktoren sind sinnvoll ?
5) Auswahl von Prädiktoren

Direkter Modelloutput
•   Diskret für einzelne Gitterpunkte
¾   Lineare Interpolation von mindestens 4 Gitterpunkten
¾   Space smoothing zur Unterdrückung von Lärm
¾   Korrekturen für Höhe und Geländeform

Beobachtungsgrößen
• Fehlerkorrekturen für Ausreißer
5) Auswahl von Prädiktoren

Funktionen von Prädiktoren
Beispiel : Industrieschnee in Brühl
   X1 Binär: Fließt Öl aus Rotterdam
   X2 Funktion: Produkt aus Stärke der Inversion und Windrichtung
   normiert auf SO
   X3 Funktion: Vorhergesagte Maximaltemperatur mit maximaler
   Gewichtung bei –3°C

• Kombination von abhängigen Prädiktoren
  liefert unabhängigen Prädiktor
• Aufnahme von nichtlinearen Zusammenhängen
6) Anwendung von MOS

SAPEMOS
• Entwickelt Ende der 60er Jahre auf Grundlage des
  Subsynoptic Advection Model und Primitive Equation Model
• Vorhersage von Niederschlagswahrscheinlichkeit, Wind,
  Bedeckungsgrad, Maximaltemperatur und
  Schneewahrscheinlichkeit
• Gleichungen teilweise entwickelt für einzelne Stationen
  (10 –20), aber auch für ganzen Osten der USA
• Teilweise Unterteilung in Jahreszeiten
6) Anwendung von MOS

SAPEMOS Beispiel Maximaltemperatur
MOS- Gleichung für Washigton D. C. (Winter)

Ergebnisse: > Absoluter Fehler durchschnittlich 3-4°F
           > MOS um 0-0,5°F geringeren absoluten Fehler (AE) als PP
           > Subjektive Vorhersage um 0,5-1,0°F geringeren AE als MOS
           > Verbesserung durch Sinus des Jahrestages
6) Anwendung von MOS

SAPEMOS Beispiel Niederschlagswahrscheinlichkeit
Fehler und Brier Scores:

Ergebnis: > Niederschlagswahrscheinlichkeit im Intervall 2 -100%
          > Teilweise zu geringe Wahrscheinlichkeiten
          > Brier Scores teilweise besser als lokale Vorhersage
6) Anwendung von MOS

AVN- MOS

• Entwickelt ab 2000 in Zusammenarbeit mit WetterOnline
  auf Grundlage des Aviation- Modells
• Vorhersage von Minimal- und Maximaltemperaturen
  sowie Bedeckungsgrad (relative Sonnenscheindauer),
  Niederschlag und Wind
• Datengrundlage aus Stationsbeobachtungen (27) und
  archivierten Modellläufen
• Annahme von konstanten Modellfehlern nach 24 Stunden
• Separate Gleichungen für 4 Jahreszeiten
• Prädiktorenzahl über Kreuzvalidation (maximal 7)
6) Anwendung von MOS

AVN- MOS

Ergebnisse Maximaltemperatur:
¾ MOS Gleichung für Düsseldorf (Frühling)
    Y = 1,28°C + 0,89 Maximaltemperatur Modellausgang
                + 2,56 Optimierte Feuchtefunktion 600m -3000m
                + 0.0085 Latenter Wärmefluss am Boden
                - 0,18 Vorhersagefehler des Vortages
¾ Fehler 1- 1,5°C abhängig von Stationshöhe
¾ Optimale Prädiktorenzahl stark unterschiedlich
¾ Reduktion der Varianz bis über 0,9
6) Anwendung von MOS

AVN- MOS
Ergebnisse Relative Sonnenscheidauer
¾ Häufigste Prädiktoren:
  > Relative Feuchte
  >Windrichtung
  > Temperaturgradienten
  > Optimierte Feuchtefunktion
  >...
  > Modellbedeckungsgrad (12. Position )
¾ Fehler: 15% bis 20%
¾ Reduktion der Varianz zwischen 0,4 und 0,7
   Î Optimale Prädiktorenzahl zu groß
7) Zusammenfassung

• Statistische Methoden notwendig zur Anpassung
  von Modelldaten an Beobachtungsdaten
• MOS Ansatz liefert größtenteils bessere
  Ergebnisse als PP
• Entscheidend ist Auswahl der richtigen
  Prädiktoren mit der richtigen Technik

=> MOS Vorhersagen sind heute bei nahezu allen
  Anbietern von Wettervorhersagen in Gebrauch
7) Literatur

•   H. R. Glahn und D. A. Lowry: „ The use of Model Output Statistics
    (MOS) in Objective Weather Forecasting“ in Journal of Applied
    Meteorology,11 Seite 1203-1211
•   W. H. Klein und H. R. Glahn: „Forecasting local weather by means of
    Model Output Statistics“ in Bulletin of the American Meteorologicaol
    Society, 55 Seite 1217-1227
•   C. Schölzel: „Ein AVN/MOS- System für Europa“ Diplomarbeit in
    Meteorologie
•   S. Weber: „Erweiterung eines AVN/MOS- Systems“ Diplomarbeit in
    Meteorologie
•   Craig, Goldstein, Rougier und Seheult: „Bayesian Forecasting for
    Complex Systems Using Computer Simulators“ in Journal of the
    American Statistical Association,96 Seite 717
Vielen Dank für die
 Aufmerksamkeit
Sie können auch lesen