Model Output Statistics - Vortrag im Rahmen des Seminars Medienmeteorologie Von Werner Schneider
←
→
Transkription von Seiteninhalten
Wenn Ihr Browser die Seite nicht korrekt rendert, bitte, lesen Sie den Inhalt der Seite unten
Model Output Statistics Vortrag im Rahmen des Seminars Medienmeteorologie Von Werner Schneider
Gliederung 1) Behandlung von Modelldaten 2) Funktionsweise von Model Output Statistics (MOS) 3) Screening Regression 4) Kreuzvalidation 5) Auswahl von Prädiktoren 6) Anwendung von MOS 7) Zusammenfassung 8) Literatur
1) Behandlung von Modelldaten Notwendigkeit der Anpassung von Modelldaten an reale Beobachtungsdaten • Keine exakte Beschreibung des Atmosphärischen Systems durch Modelle möglich Î Zu große Datensätze Î Zu geringe Rechenleistung • Modelldaten nur an wenigen Gitterpunkten • Teilweise keine direkte Vorhersage der zu bestimmenden Größe
1) Behandlung von Modelldaten Die Methoden : Perfect Prog • Annahme: Perfektes Modell • Analysedaten beschreiben reale Situation nur auf falschen Skalen Î Statistischer Zusammenhang zwischen Stationsbeobachtungen und Analysedaten Î Angewendet auf Vorhersagedaten Î Vorteil: Großes Datenvolumen
1) Behandlung von Modelldaten Die Methoden : MOS • Annahme: Fehlerhaftes Modell • Modelldaten beschreiben andere Situation als Analysedaten Î Statistischer Zusammenhang zwischen Vorhersagedaten und Stationsbeobachtungen Î Angewendet auf Vorhersagedaten Î Vorteil: Keine beschränkenden Annahmen
2) Funktionsweise von MOS Lineare Regressionsgleichung Def.: Prädiktand > Vorherzusagende (abhängige) Variable Y Prädiktoren > Unabhängige Variablen Xi ¾ Linearer Ansatz: Ŷ = a0X0 + a1X1 + . . . + akXk mit X0 = 1 Konstante Ŷ Schätzer für Y ai Regressionskoeffizienten
2) Funktionsweise von MOS Probleme • Wie lassen sich nichtlineare Abhängigkeiten des Prädiktanden von Prädiktoren beschreiben ? • Sind die Prädiktoren unabhängig voneinander ? ÎBildung von Funktionen eines oder mehrerer Prädiktoren • Objektives Verfahren zur Bestimmung der optimalen Prädiktoren
3) Screening regression Ansatz ¾ Stichprobe vom Umfang n Minimum der mittleren quadratischen Fehler (MSE) der Stichprobe => Optimaler Schätzer âi 1 n MSE = ∑ ( yi − yˆ i ) 2 n i =1 Güte der Anpassung der Regressionsgleichung gegeben durch Reduktion der Varianz (RV) 1 n 1 n ∑ n i =1 ( yi − y )² − ∑ ( yi − yˆ i )² n i =1 RV = 1 n ∑ n i =1 ( yi − y )²
3) Screening regression Schrittweise Vorgehen 0. Auswahl von möglichen Prädiktoren 1. Wähle X1 mit höchster Korrelation zum Prädiktanden Î höchste Reduktion der Varianz RV 2. Bestimme optimales â1 Î Ŷ1 = â0X0 + â1X1 3. Wähle Xk mit höchster Korrelation zu ( Y - Ŷk-1 ) ... => Optimale Anzahl der Terme ?
4) Kreuzvalidation Overfitting Unendlich viele Prädiktoren Î Bei Anwendung auf abhängigen Datensatz verschwindet die Varianz Anwendung auf unabhängigen Datensatz Î Nicht physikalische Zusammenhänge erhöhen die Varianz Lösung: > Untergrenze für Signifikanz > Feste Anzahl von Prädiktoren aus Erfahrung > Kreuzvalidation
4) Kreuzvalidation Vorgehensweise • Zerlegung des Datensatzes • Entwicklung der Regressionsgleichung aus abhängigem Teil • Überprüfung am Mit Kontrollsatz unabhängigen Teil Ohne Kontrollsatz Î Häufig Minimum der Varianz bei optimaler Anzahl von Prädiktoren
5) Auswahl von Prädiktoren Ein Zitat: „ The better the preparation of the predictors and predictants, the better are the results „ (Knüpffer 1996)
5) Auswahl von Prädiktoren Unterschiedliche Prädiktanden • Temperaturen Î Zeitabhängige Prädiktanden => Gleichungen für jede Jahreszeit • Wind Î Vektoren als Prädiktanden => Gleichungen für Komponenten • Niederschlag Î Binäre Prädiktanden => Wahrscheinlichkeitsangaben beschränkt auf Intervall [0,1] • Bedeckungsgrad Î Kategorisierte Prädiktanden => Mehrfach binäre Aufteilung • Arbeitsplätze am Bau => Nur indirekte Abhängigkeit von meteorologischen Größen
5) Auswahl von Prädiktoren Eine beliebige Wahl ? Bestimmung der Maximaltemperatur in Bonn • Schlüsselbegriff „kalt“ • Vorhersage im 100 jährigem Maximaltemperatur für Kalender Essen und Trier • Beobachtung auf der oder • Beobachtung Maximaltemperatur Zugspitze • Vorhersage • Vorhersage Pollenflug Bedeckungsgrad in in Bonn Bonn => Subjektive Vorauswahl
5) Auswahl von Prädiktoren Typen von Prädiktoren • Direkter Modelloutput • Beobachtungsgrößen Î Stationsmeldungen • Funktionen von Ort und Zeit Î sin (Jahrestag/365) Î astronomisch: Winkel der Sonne über der Erdoberfläche • Funktionen von Prädiktoren • Schaltervariablen => Welche Prädiktoren sind sinnvoll ?
5) Auswahl von Prädiktoren Direkter Modelloutput • Diskret für einzelne Gitterpunkte ¾ Lineare Interpolation von mindestens 4 Gitterpunkten ¾ Space smoothing zur Unterdrückung von Lärm ¾ Korrekturen für Höhe und Geländeform Beobachtungsgrößen • Fehlerkorrekturen für Ausreißer
5) Auswahl von Prädiktoren Funktionen von Prädiktoren Beispiel : Industrieschnee in Brühl X1 Binär: Fließt Öl aus Rotterdam X2 Funktion: Produkt aus Stärke der Inversion und Windrichtung normiert auf SO X3 Funktion: Vorhergesagte Maximaltemperatur mit maximaler Gewichtung bei –3°C • Kombination von abhängigen Prädiktoren liefert unabhängigen Prädiktor • Aufnahme von nichtlinearen Zusammenhängen
6) Anwendung von MOS SAPEMOS • Entwickelt Ende der 60er Jahre auf Grundlage des Subsynoptic Advection Model und Primitive Equation Model • Vorhersage von Niederschlagswahrscheinlichkeit, Wind, Bedeckungsgrad, Maximaltemperatur und Schneewahrscheinlichkeit • Gleichungen teilweise entwickelt für einzelne Stationen (10 –20), aber auch für ganzen Osten der USA • Teilweise Unterteilung in Jahreszeiten
6) Anwendung von MOS SAPEMOS Beispiel Maximaltemperatur MOS- Gleichung für Washigton D. C. (Winter) Ergebnisse: > Absoluter Fehler durchschnittlich 3-4°F > MOS um 0-0,5°F geringeren absoluten Fehler (AE) als PP > Subjektive Vorhersage um 0,5-1,0°F geringeren AE als MOS > Verbesserung durch Sinus des Jahrestages
6) Anwendung von MOS SAPEMOS Beispiel Niederschlagswahrscheinlichkeit Fehler und Brier Scores: Ergebnis: > Niederschlagswahrscheinlichkeit im Intervall 2 -100% > Teilweise zu geringe Wahrscheinlichkeiten > Brier Scores teilweise besser als lokale Vorhersage
6) Anwendung von MOS AVN- MOS • Entwickelt ab 2000 in Zusammenarbeit mit WetterOnline auf Grundlage des Aviation- Modells • Vorhersage von Minimal- und Maximaltemperaturen sowie Bedeckungsgrad (relative Sonnenscheindauer), Niederschlag und Wind • Datengrundlage aus Stationsbeobachtungen (27) und archivierten Modellläufen • Annahme von konstanten Modellfehlern nach 24 Stunden • Separate Gleichungen für 4 Jahreszeiten • Prädiktorenzahl über Kreuzvalidation (maximal 7)
6) Anwendung von MOS AVN- MOS Ergebnisse Maximaltemperatur: ¾ MOS Gleichung für Düsseldorf (Frühling) Y = 1,28°C + 0,89 Maximaltemperatur Modellausgang + 2,56 Optimierte Feuchtefunktion 600m -3000m + 0.0085 Latenter Wärmefluss am Boden - 0,18 Vorhersagefehler des Vortages ¾ Fehler 1- 1,5°C abhängig von Stationshöhe ¾ Optimale Prädiktorenzahl stark unterschiedlich ¾ Reduktion der Varianz bis über 0,9
6) Anwendung von MOS AVN- MOS Ergebnisse Relative Sonnenscheidauer ¾ Häufigste Prädiktoren: > Relative Feuchte >Windrichtung > Temperaturgradienten > Optimierte Feuchtefunktion >... > Modellbedeckungsgrad (12. Position ) ¾ Fehler: 15% bis 20% ¾ Reduktion der Varianz zwischen 0,4 und 0,7 Î Optimale Prädiktorenzahl zu groß
7) Zusammenfassung • Statistische Methoden notwendig zur Anpassung von Modelldaten an Beobachtungsdaten • MOS Ansatz liefert größtenteils bessere Ergebnisse als PP • Entscheidend ist Auswahl der richtigen Prädiktoren mit der richtigen Technik => MOS Vorhersagen sind heute bei nahezu allen Anbietern von Wettervorhersagen in Gebrauch
7) Literatur • H. R. Glahn und D. A. Lowry: „ The use of Model Output Statistics (MOS) in Objective Weather Forecasting“ in Journal of Applied Meteorology,11 Seite 1203-1211 • W. H. Klein und H. R. Glahn: „Forecasting local weather by means of Model Output Statistics“ in Bulletin of the American Meteorologicaol Society, 55 Seite 1217-1227 • C. Schölzel: „Ein AVN/MOS- System für Europa“ Diplomarbeit in Meteorologie • S. Weber: „Erweiterung eines AVN/MOS- Systems“ Diplomarbeit in Meteorologie • Craig, Goldstein, Rougier und Seheult: „Bayesian Forecasting for Complex Systems Using Computer Simulators“ in Journal of the American Statistical Association,96 Seite 717
Vielen Dank für die Aufmerksamkeit
Sie können auch lesen