Niederschlags-Abfluss-Modellierung mit Long Short-Term Memory (LSTM) - ResearchGate

Die Seite wird erstellt Vera Haas

Gebäude

Deutsch

Like
Teilen
Einbetten
Vollbild
Folien
HTML Herunterladen
PDF Herunterladen
Missbrauch

←

WEITER LESEN

→

Transkription von Seiteninhalten

Wenn Ihr Browser die Seite nicht korrekt rendert, bitte, lesen Sie den Inhalt der Seite unten

Niederschlags-Abfluss-Modellierung mit Long Short-Term Memory (LSTM) - ResearchGate

Originalarbeit

Österr Wasser- und Abfallw
https://doi.org/10.1007/s00506-021-00767-z

Niederschlags-Abfluss-Modellierung mit Long Short-Term
Memory (LSTM)
Frederik Kratzert · Martin Gauch · Grey Nearing · Sepp Hochreiter · Daniel Klotz

Angenommen: 13. April 2021
© Der/die Autor(en) 2021

Zusammenfassung Methoden der Schlüsselwörter Deep Learning · men mittels vielschichtiger künstlicher
künstlichen Intelligenz haben sich in Niederschlags-Abfluss-Modellierung · neuronaler Netze ermöglicht. Dieser
den letzten Jahren zu essenziellen LSTM Beitrag veranschaulicht das Potenzial
Bestandteilen fast aller Bereiche von von DL für die wasserwirtschaftliche
Wissenschaft und Technik entwickelt. Rainfall-Runoff modeling with Anwendung. Der Fokus liegt dabei auf
Dies gilt auch für die Hydrologie: Viel- Long Short-Term Memory konkreten Problemstellungen aus der
schichtige neuronale Netzwerke – auch Networks (LSTM)—an overview Niederschlags-Abfluss-Modellierung,
bekannt als Modelle des Deep Learn- aus drei Themengebieten: 1. Regio-
ing – ermöglichen hier Vorhersagen von Abstract In recent years, methods of ar- nale Modellierung, 2. Vorhersage in
Niederschlagsabflussmengen in zuvor tificial intelligence have become essen- unbeobachteten Einzugsgebieten und
unerreichter Präzision. tial components of almost all branches 3. Modelleigenschaften.
Dieser Beitrag beleuchtet das Poten- of science and technology. This also
zial von Deep Learning für wasserwirt- holds for the area of hydrology: multi- 1.1 Regionale Modellierung
schaftliche Anwendungen. Der erste layered neural networks—also known
Teil des Artikels zeigt, wie sogenannte as Deep Learning models—allow for Die regionale Skala ist typisch für die
Long Short-Term Memory-Netzwerke rainfall-runoff predictions at unprece- hydrologische Modellbildung. Sie ist
– eine spezifisch für Zeitreihen entwi- dented accuracy. größer als ein einzelner Hang oder
ckelte Methode des Deep Learnings – This contribution highlights the Flussabschnitt, jedoch kleiner als ein
für die Niederschlags-Abfluss-Model- potenzial of Deep Learning for ap- Kontinent (e.g. Blöschl und Sivapa-
lierung verwendet werden, und wie plications of water management. The lan 1995). Die Herausforderung für
diese für eine Reihe hydrologischer first part of this article shows how so- Modellierer besteht darin, aus dem
Probleme bessere Ergebnisse als jedes called Long Short-Term Memory net- vorhandenen Prozessverständnis und
andere bekannte hydrologische Modell works—a Deep Learning architecture den verfügbaren Daten (etwa Pegel-,
erzielen. Der zweite Teil demonstriert explicitly designed for time series pre- Grundwasser- und/oder Schneehöhen-
wesentliche Eigenschaften der Long diction—can be used for rainfall-runoff Messungen) ein Modell zu erarbeiten.
Short-Term Memory-Netzwerke. Zum modeling, and how this approach yields Dabei kommt es zu einem Kompromiss
einen zeigen wir, dass diese Netzwerke better results than any known hydro- zwischen hydrologisch konsistenten
beliebige Daten verarbeiten können. logic model on a number of hydrologic Parametern und Performance (Klotz
Dies erlaubt es, mögliche synergetische problems. The second part of this ar- et al. 2017; Feigl et al. 2020; Mizuka-
Effekte aus unterschiedlichen meteoro- ticle outlines important properties of mi et al. 2017). Den Schwerpunkt auf
logischen Datensätzen zu extrahieren Long Short-Term Memory networks. nur eines der beiden Kriterien zu le-
und damit die Modellgüte zu verbes- We show that these models can process gen, ist kaum machbar. Obwohl die
sern. Zum anderen stellen wir dar, wie any available data. This allows them to Parameter hydrologischer Modelle oft
relevante hydrologische Prozesse (wie draw synergetic information from mul- eine physikalische Bedeutung haben
z. B. das Akkumulieren und Schmel- tiple meteorological datasets, which im- (z. B. Infiltrationskoeffizient), ist es in
zen von Schnee) innerhalb der Modelle proves predictions. Further, we demon- der Praxis nicht möglich, die Modell-
abgebildet werden, ohne dass diese strate how these models learn relevant parameter aus der Theorie abzuleiten.
spezifisch darauf trainiert wurden. hydrologic processes (e.g., accumu- Ein wesentlicher Grund dafür ist, dass
lation and melting of snow) without unsere Prozessbeschreibung auf einer
specifically being trained to do so. anderen Skala konzeptualisiert wurde
(z. B. im Labor), als sie für die hydrolo-
Keywords Deep Learning · Rainfall- gische Modellierung benötigt wird. Die
F. Kratzert () · M. Gauch ·
Runoff modeling · LSTM Ansätze lassen sich nicht ohne weite-
S. Hochreiter · D. Klotz
res auf Einzugsgebiets-Skala übertragen
Institute for Machine Learning,
1 Einleitung (Klemeš 1983). Das rein empirische Be-
Johannes Kepler Universität Linz,
Altenberger Straße 69, 4040 Linz,
stimmen der Parameter gestaltet sich
Österreich Deep Learning (DL) ist das Herzstück ähnlich problematisch. Konventionel-
kratzert@ml.jku.at der modernen Künstlichen Intelligenz le Modelle (etwa physikalisch basierte
(e.g. Hinton et al. 2012; Sutskever et al. oder konzeptionelle Ansätze) wurden
G. Nearing 2014; Krizhevsky et al. 2017). Bei DL entwickelt, um hydrologische Prozesse
Google Research, Mountain View, CA, handelt es sich um eine Reihe von abzubilden und sind nicht unbedingt
USA Methoden, die das Lösen von Proble- dafür vorgesehen, eine möglichst ein-

Niederschlags-Abfluss-Modellierung mit Long Short-Term Memory (LSTM)

Originalarbeit

met, trotzdem gilt sie bis heute als
weitgehend ungelöst (Hrachowitz et al.
2013).
DL-Modelle sind auch hier sinnvoll
nutzbar, da sie kein explizites Wissen
über die räumlichen Zusammenhän-
ge voraussetzen. Stattdessen werden
räumlich übertragbare Repräsentatio-
nen gelernt. Kap. 3 demonstriert die-
se Vorteile. Unter anderem zeigt sich,
dass DL-Ansätze bessere Modellgüte
in „unbeobachteten“ Einzugsgebieten
aufweisen als einzugsgebietsspezifisch
kalibrierte, klassische Niederschlags-
Abfluss-Modelle.

1.3 Modelleigenschaften

Die von uns vorgestellten DL-Ansätze
besitzen zusätzlich inhärente Eigen-
Abb. 1 Beispiel für die Verschlechterung der Modellgüte durch regionales Modellie- schaften, welche für die hydrologische
ren. Zu sehen sind die empirischen kumulativen Verteilungsfunktionen der Nash-Sut- Modellierung von Interesse sind. Wir
cliffe Effizienz (NSE) von zwei hydrologischen Modellen. VIC (Liang et al. 1994) in Blau demonstrieren zwei Formen dieser Mo-
und mHM (Samaniego et al. 2010; Mizukami et al. 2017) in Rot. Die unterbrochenen Li- delleigenschaften: Die erste Eigenschaft
nien zeigen die Performance einzugsgebietsspezifisch kalibrierter Modelle, die durch- bezieht sich auf das Einbeziehen von
gehenden Linien jene regional kalibrierter Modelle. Je weiter rechts die Dichtekurve, unterschiedlichen Eingabedaten. Wir
desto besser zeigen, wie DL-Modelle Eingabedaten
verschiedener meteorologischer Pro-
fache Parametrisierung zu ermöglichen zert et al. 2019c; Gauch et al. 2021; siehe dukte (DayMet, Maurer und NLDAS)
(Klemeš 1997; Kirchner 2006). Für die auch Halevy et al. 2009). verwenden und von den daraus resul-
regionale Modellierung ist es außerdem tierenden Synergieeffekten profitieren
schwierig, eine allgemeingültige Abbil- 1.2 Vorhersage in unbeobachteten können (siehe z. B. Kratzert et al. 2020).
dung von Einzugsgebietseigenschaften Einzugsgebieten Als zweite Eigenschaft diskutieren wir
zu Modellparametern zu finden, die die Speicher der vorgestellten Modell-
zu ähnlich guten Vorhersagen führt Zum Modellieren eines Einzugsgebiets klasse. Konkret demonstrieren wir, wie
wie einzugsgebietsspezifisch kalibrierte werden in der Regel meteorologische Informationen aus den „black box“-
Modelle (Hrachowitz et al., 2013; Mizu- Inputs (etwa Niederschlag und Tem- Modellen gewonnen werden können,
kami et al. 2017; Blöschl et al., 2019). peratur) und Daten bezüglich der vor- indem deren interne Repräsentationen
DL ermöglicht einen fundamental handenen Einzugsgebietseigenschaften bezüglich Prozesseigenschaften analy-
anderen Ansatz der Modellbildung, der und Abflussmengen benötigt. Vor allem siert werden (Kratzert et al., 2019a).
nicht auf vordefinierten Regeln basiert, Abflussmessungen sind jedoch nicht Im Folgenden geben wir zunächst
sondern das gesamte Prozessverständ- für alle Einzugsgebiete vorhanden. einen Überblick über das von uns ver-
nis aus den verfügbaren Daten lernen Die Vorhersage in unbeobachteten wendete DL-Modell sowie von uns ge-
muss. Der von uns entwickelte An- Einzugsgebieten gilt als allgemein sehr nutzte Datensätze (Kap. 2). Anschlie-
satz führt zu Modellen, deren Qualität schwierig (Sivapalan 2003; Parajka et al. ßend gehen wir im Detail auf die drei
tendenziell mit der Zahl der abgedeck- 2013). Hydrologische Prozesse sind so- Kernthemen dieser Publikation ein:
ten Einzugsgebiete steigt (siehe Krat- wohl räumlich als auch zeitlich hetero- Regionale Modellierung (Abschn. 3.1),
zert et al. 2018b, 2019c; Gauch et al. gen und auf verschiedenen relevanten Vorhersage in unbeobachteten Einzugs-
2021). Konventionelle hydrologische Skalen nicht vollständig verstanden. gebieten (Abschn. 3.2) sowie Modellei-
Modellansätze erreichen deutlich bes- Im Allgemeinen fehlen hoch aufgelöste genschaften (Abschn. 3.3). Dem folgt
sere Modellgüte, wenn sie für jedes Ein- Informationen über den Aufbau des eine Übersicht an Erweiterungen von
zugsgebiet spezifisch kalibriert werden Untergrunds, welche eine genaue phy- DL-basierten Niederschlags-Abfluss-
statt für viele (diverse) Einzugsgebiete sikalische Modellierung ermöglichen Modellen (Kap. 4.). Abschließend fas-
auf einmal (siehe Abb. 1). Der Nutzen würden. In der Tat gestaltet sich das sen wir die Ergebnisse noch einmal zu-
von strukturell explizit dargestellten Sy- Problem derart kompliziert, dass es oft sammen und geben einen Ausblick auf
stemprozessen ist hier limitierend. DL- als eines der zentralen Probleme der hy- zukünftige Forschungsthemen (Kap. 5)
Modelle haben den Vorteil, dass sie alle drologischen Modellierung angesehen die auch im Rahmen hydrologischer
Prozesse modellieren können, die aus wird (Blöschl et al., 2013; Blöschl et al. und wasserwirtschaftlicher Fragestel-
den verfügbaren Daten ableitbar sind: 2019). Die International Association of lungen sinnvolle Unterstützung bieten
Je größer und diverser die verfügbare Hydrological Sciences (IAHS) hat der werden.
Datenmenge ist, desto allgemeiner ist Lösung dieser Fragestellung (Vorhersa-
das gelernte Prozessverständnis (Krat- ge in unbeobachteten Einzugsgebieten)
eine ganze Dekade (2003–2012) gewid-

Niederschlags-Abfluss-Modellierung mit Long Short-Term Memory (LSTM)

Originalarbeit

gebieten aus den USA. Die Einzugs-
gebiete sind quer über die USA verteilt
und decken ein breites Spektrum an un-
terschiedlichen hydrologischen Eigen-
schaften ab (Abb. 3). Neben ca. 35 Jah-
ren Abflussdaten in täglicher Auflösung
beinhaltet CAMELS meteorologische
Daten von drei verschiedenen meteoro-
logischen Produkten sowie eine Reihe
statischer Kenngrößen. Die drei Pro-
dukte beinhalten jeweils Niederschlag,
tägliche Höchst- und Niedertempera-
Abb. 2 Setup-Schema für die Verwendung des LSTM. Dem LSTM (blau) wird an jedem
tur, Sonneneinstrahlung und Wasser-
ZeitschritteinEingabevektor (lila)bereitgestellt. EsbesitztinterneSpeicher, dievonZeit-
dampfdruck. Die statischen Kenngrö-
schritt zu Zeitschritt aktualisiert werden können. Aus der LSTM-Ausgabe des letzten
ßen lassen sich grob in die Bereiche
Zeitschritts (gelb) wird die Vorhersage ermittelt
Boden, Vegetation, Hydrologie, Klima
und Topologie gliedern (eine Übersicht
2 Methoden die Modelle an individuelle Einzugs- ist in Newman et al. 2015 und Addor
gebiete anpassen lassen. Wie eingangs et al. 2017 zu finden).
2.1 Long Short-Term Memory-Netzwerk beschrieben, besitzen auch LSTMs in-
terne Speicher und auch hier wird die 3 Experimente und Ergebnisse
Die Grundlage unserer DL-Modelle Vorhersage aus den Speichern erzeugt.
bildet das Long Short-Term Memo- Der wesentliche Unterschied ist jedoch, 3.1 Regionale Modellierung
ry-Netzwerk (LSTM; Hochreiter 1991; dass beim LSTM nicht von vornherein
Hochreiter und Schmidhuber 1997; definiert ist, wie die Eingabedaten mit 3.1.1 Vergleich des
Gers, Schmidhuber & Cummins 2000). der Zielvariable zusammenhängen und einzugsgebietsspezifischen und
Das LSTM gehört zur Familie der re- welche Informationen dafür über die regionalen LSTM
kurrenten neuronalen Netze. Dies sind Zeit gespeichert oder akkumuliert wer-
neuronale Netze, die Eingabedaten in den müssen. Diese Zusammenhänge In diesem Experiment vergleichen wir
sequenzieller Reihenfolge verarbeiten werden während der sogenannten Trai- einzugsgebietsspezifische LSTMs mit
(siehe Abb. 2). Eine spezielle Eigen- ningsphase vom LSTM gelernt. Das einem regionalen LSTM. Ersteres be-
schaft von LSTMs ist, dass sie dedi- LSTM muss also nicht passende Pa- deutet, dass für jedes Einzugsgebiet
zierte interne Speicher besitzen, um rameterschätzungen einer gegebenen ein separates LSTM trainiert und ver-
Informationen für lange Zeit speichern Modellstruktur finden, sondern ein ge- wendet wird. Letzteres bedeutet, dass
zu können. Zusätzlich verfügen LSTMs samtes Modell. Dies ist eine Stärke: ein einziges Modell so aufgesetzt wird,
über eine Reihe von sogenannten Gates. Klassische hydrologische Modelle kön- dass es für alle Einzugsgebiete ver-
Diese kontrollieren in jedem Zeitschritt nen nur jene Systemprozesse berück- wendbar ist (siehe Diskussion über
(a) welche Informationen aus dem Spei- sichtigen, welche explizit in das Modell regionale Modellbildung in der Einlei-
cher gelöscht werden, (b) was für neue eingebaut wurden – LSTMs hingegen tung). Die einzugsgebietsspezifischen
Informationen aus den Eingabedaten können alle Prozesse modellieren, die LSTMs erhalten ausschließlich meteo-
in den internen Speicher hinzugefügt aus den verfügbaren Daten ableitbar rologische Eingabedaten, wohingegen
werden, und (c) aus welchen Informa- sind. das regionale LSTM zusätzlich statische
tionen des aktuellen Speichers die Vor- In unseren Experimenten verwen- Kenngrößen der Einzugsgebiete als In-
hersage gewonnen werden kann. Au- den wir das LSTM in folgender Kon- puts bekommt (siehe Abschn. 2.2). Dies
ßerdem, und dies macht LSTMs speziell figuration: Wir übergeben dem LSTM ermöglicht es dem regionalen LSTM,
interessant für den wasserwirtschaftli- eine Sequenz von ca. einem Jahr an die meteorologischen Inputs je nach
chen Einsatz, besitzen sie Parallelen zu meteorologischen Eingabedaten, um Einzugsgebiet unterschiedlich zu verar-
klassischen hydrologischen Modellen. eine Abflussvorhersage am letzten Zeit- beiten (siehe Kratzert et al. 2019c).
Wir skizzieren diese im Folgenden. Für schritt zu erzeugen. Zusätzlich zu den Abb. 4 zeigt die empirischen kumu-
eine detaillierte, technische Beschrei- meteorologischen Daten werden in den lativen Verteilungsfunktionen der NSE-
bung verweisen wir auf Kratzert et al. meisten Experimenten auch statische Werte aus den CAMELS-Einzugsgebie-
(2018b). Kenngrößen des Einzugsgebietes (wie ten. Der regionale Ansatz (Median NSE
Die meisten in der Hydrologie ver- etwa Ton- oder Sandgehalt des Bodens) 0,76) ist deutlich besser als die einzugs-
wendeten Modelle bestehen aus einer als zusätzliche Inputs an jedem Zeit- gebietsspezifischen LSTMs (Median
Abfolge von Speichern (z. B. für Schnee schritt übergeben (siehe Abschn. 2.2). NSE 0,67). Das Verhalten der LSTMs ist
oder Bodenfeuchte) und fest eingebau- also genau gegensätzlich zu klassischen
ten Regeln. Diese Regeln definieren, 2.2 Daten hydrologischen Modellen, bei denen
wie Eingabedaten die Speicher verän- einzugsgebietsspezifische Ansätze in
dern und wie aus den Speichern die In allen Experimenten verwenden wir der Regel deutlich besser sind (sie-
Abflussvorhersage gewonnen werden Daten aus dem CAMELS-Datensatz he auch Abb. 1). Bei der Verwendung
kann (e.g. Liang et al. 1994; Seibert (Newman et al. 2015; Addor et al. 2017), von LSTMs als hydrologische Model-
und Vis 2012). Es bleibt eine Reihe einem offenen hydrologischen Daten- le ist es immer sinnvoll, verschiedene
an Modellparametern, mit denen sich satz mit 671 unbeeinflussten Einzugs- Einzugsgebiete in die Modellbildung

Niederschlags-Abfluss-Modellierung mit Long Short-Term Memory (LSTM)

Originalarbeit

Abb. 3 Übersichtskarte der CAMELS-Einzugsgebiete, farblich kodiert nach Trockenheit (definiert als das Verhältnis der mittleren
jährlichen potenziellen Verdunstung zu mittleren jährlichen Niederschlagsmenge, siehe Addor et al. (2017))

                                                                                                Resümee: Das LSTM ist in der Lage,
                                                                                             gelerntes Prozessverständnis zwischen
                                                                                             den Einzugsgebieten zu transferieren.
                                                                                             Es lernt etwas aus den Daten eines
                                                                                             gegebenen Einzugsgebiets, dass es in
                                                                                             positiver Hinsicht in einem anderen
                                                                                             Einzugsgebiet anwenden kann. Für ei-
                                                                                             ne ausführliche Diskussion verweisen
                                                                                             wir auf Nearing et al. (2020).

                                                                                             3.1.2 Vergleich des regionalen LSTM
                                                                                                   mit hydrologischen Modellen

                                                                                             Vergleichen wir nun das regionale
                                                                                             LSTM mit zwei unterschiedlichen, re-
                                                                                             gional kalibrierten (mittels MPR; Sa-
                                                                                             maniego et al. 2010) hydrologischen
                                                                                             Modellen, ergibt sich folgendes Bild
                                                                                             (Abb. 5): Das regionale LSTM (Median
Abb. 4 Vergleich der empirischen kumulativen Verteilungen der Nash-Sutcliffe-Effizi-         NSE 0,76) ist beiden hydrologischen
enz (NSE)-Werte zweier LSTMs über die verschiedenen Einzugsgebiete. Die bestmög-             Modellen (Median NSE VIC: 0,31, Me-
liche Verteilung entspricht einer vertikalen Linie bei NSE 1,0. In Analogie zu Abb. 1 sind   dian NSE mHM: 0,53) sehr deutlich
die einzugsgebietsspezifischen LSTMs mittels einer unterbrochenen Linie und das re-          überlegen.
gionale LSTM mittels einer durchgängigen Linie dargestellt. In Gegensatz zu Abb. 1 ist          Aber nicht nur im Vergleich zu regio-
das regionale LSTM besser als die einzugsgebietsspezifisch angepassten LSTMs                 nal kalibrierten hydrologischen Model-
                                                                                             len schneidet das LSTM gut ab. Beim
                                                                                             Vergleich des regionalen LSTM mit
einfließen zu lassen. Dies gilt selbst        (diverse) Einzugsgebiete für das Trai-         einzugsgebietsspezifischen hydrologi-
dann, wenn das eigentliche Ziel der           ning verwendet werden, desto mehr              schen Modellen ergibt sich ein ähn-
Modellierung sich auf einen spezifi-          Prozessverständnis kann vom LSTM               liches Bild (siehe Abb. 6): auch hier
schen Flussabschnitt beschränkt. Eine         aus den Daten gelernt werden. Mehr             ist das LSTM deutlich besser. Dabei
Erklärung hierfür ist, dass die abfluss-      Einzugsgebiete führen daher tendenzi-          muss betont werden, dass alle hydro-
bildenden Prozesse überall prinzipiell        ell zu einer besser verallgemeinernden         logischen Modelle von anderen For-
dieselben sind – wenn auch lokal stark        Repräsentation der Niederschlags-Ab-           schergruppen mit Expertise in der An-
unterschiedlich ausgeprägt. Je mehr           fluss-Modellierung.                            wendung des entsprechenden Modells

                                                           Niederschlags-Abfluss-Modellierung mit Long Short-Term Memory (LSTM)

Originalarbeit

LSTM besser als die zum Vergleich ver-
wendeten klassischen Modelle.
In diesem Vergleich stellen wir die
Performance eines LSTM für unbeob-
achtete Einzugsgebiete (PUB; orange
mit Stern) der Performance von drei
anderen Modellen gegenüber: ein phy-
sikalisches Modell (US NWM, Cosgrove
und Klemmer (NOAA) 2019), ein ein-
zugsgebietsspezifisch kalibriertes kon-
zeptionelles Modell (SAC-SMA) und
das zuvor eingeführte regionale LSTM
(Abschn. 2.1). Wir haben die ersten bei-
den Modelle gewählt, da sie das alte
(SAC-SMA) sowie aktuell verwendete
US National Water Model und somit
wichtige Modelle sind, die weit verbrei-
tete Anwendung finden.
Resümee: Das LSTM liefert durch-
schnittlich bessere Simulationsergeb-
Abb. 5 Vergleich der empirischen kumulativen Verteilungen der Nash-Sutcliffe-Effizi- nisse für Einzugsgebiete, für die es nicht
enz (NSE)-Werte für das regionale VIC-Modell (dunkelblau), das regionale mHM-Modell trainiert wurde, als etablierte hydrolo-
(rot), und das regionale LSTM (orange). Je weiter rechts die Gesamtverteilung, desto gische Modelle, die für jedes Einzugs-
besser die Modellgüte. In diesem Vergleich ist das regionale LSTM der mit Abstand bes- gebiet separat kalibriert wurden. Das
te Ansatz LSTM lernt eine besser generalisieren-
de Repräsentation der abflussbildenden
kalibriert wurden, um jeglichen Bias aufgeteilt. Anschließend wurde jeweils Prozesse als die von einzugsgebietsspe-
bei der Kalibrierung zu vermeiden. Alle ein regionales LSTM anhand der Ein- zifisch kalibrierten Modellen erreichte.
Modelle wurden mit denselben meteo- zugsgebiete aus neun Gruppen trainiert Eine vertiefende Diskussion bezüglich
rologischen Daten auf den denselben und anhand der Einzugsgebiete in der der vorgestellten Experimente und Er-
Zeiträumen kalibriert und ausgewertet. verbleibenden zehnten Gruppe ausge- gebnisse kann in Kratzert et al. (2019b)
Für weitere Details zu den hydrologi- wertet. Dabei ist jedes Einzugsgebiet gefunden werden.
schen Modellen sowie für Vergleiche genau einmal in der Gruppe, die nicht
mit weiteren Metriken verweisen wir für das Modelltraining verwendet wird. 3.3 Modelleigenschaften
auf Kratzert et al. (2019c). Der Versuchsaufbau misst also, wie gut
Resümee: Bezogen auf die Modellgü- ein Modell in Einzugsgebieten ist, für 3.3.1 Synergieeffekte mehrerer
te (hier exemplarisch in Form des NSE- die keine Daten für die Kalibrierung meteorologischen Daten in einem
Kriteriums dargestellt) übertrifft das zur Verfügung stehen. Damit wird eine LSTM
regionale LSTM eine Reihe von klassi- Vorhersage in unbeobachteten Ein-
schen hydrologischen Modellen. Dies zugsgebieten (Prediction in Ungauged Ein weiterer Vorteil von DL-Modellen ist
gilt sowohl für Modelle, die regional Basins, PUB) simuliert, was als eine es, dass sie keine A-priori-Annahmen
kalibriert wurden, als auch für solche, der wichtigsten Problemstellungen in zu den Eingabedaten benötigen. Im Ge-
die einzugsgebietsspezifisch optimiert der Hydrologie gilt (siehe Einleitung). gensatz zu klassischen hydrologischen
wurden. Ein regionales LSTM ist also Eine quantitative Auswertung von de Modellen ist es also nicht notwendig,
ein einziges LSTM, das für Vorhersagen facto unbeobachteten Einzugsgebieten eine genaue mathematische Beziehung
an allen Pegeln in einer Region verwen- ist natürlich nicht möglich. Unser An- zwischen jeder Eingangsvariable und
det werden kann. Für weitere Details satz bietet jedoch eine naheliegende der Zielvariable (z. B. Abfluss) zu defi-
zu den hydrologischen Modellen so- Annäherung. nieren, sondern genau diese Beziehun-
wie Vergleiche mit weiteren Metriken Die Ergebnisse sind in Abb. 7 zu gen werden während der Trainingspha-
verweisen wir auf Kratzert et al. (2019c). sehen: Dort wird das PUB-Modell se vom Modell gelernt. Dies können
mit zwei hydrologischen Modellen so- wir uns auf mehrere Arten zunutze ma-
3.2 Generalisierung des LSTM für wie dem regionalen LSTM verglichen. chen, wobei eine spezielle Anwendung
unbeobachtete Einzugsgebiete Letzteres wurde wie in den vorheri- die meteorologischen Inputs betrifft.
gen Kapiteln mit allen Daten trainiert. Konzentrieren wir uns auf die wich-
Trotz dieser eindeutigen Ergebnisse Die hydrologischen Modelle sind das tigste Eingangsvariable, den Nieder-
stellt sich die Frage, wie gut das gelernte SAC-SMA-Modell (Burnash et al., 1973, schlag, so ist weithin bekannt, dass
„Wissen“ eines datenbasierten Modells 1995), separat kalibriert für jedes Ein- hierin eine der größten Quellen von
wirklich ist, oder ob das Modell nur gut zugsgebiet und das aktuelle US Natio- Unsicherheit steckt (Fekete et al. 2004;
ist im „Auswendiglernen“. In Kratzert nal Water Model (WRF-Hydro; Salas Beven 2019). Niederschlagsdaten gibt es
et al. (2019b) haben wir diese Annahme et al. 2018). Trotz Einbußen gegen- sowohl als Punktmessung (z. B. von Nie-
untersucht. Dafür wurden die Einzugs- über dem regionalen LSTM ist das in derschlagsmessstellen) als auch Raster-
gebiete mittels zufälliger Kreuzvalidie- diesem Experiment aufgesetzte PUB- daten (Maurer et al. 2002; Thornton
rung in 10 unterschiedliche Gruppen et al. 2012; Xia et al. 2012; Hersbach

Niederschlags-Abfluss-Modellierung mit Long Short-Term Memory (LSTM)

Originalarbeit

kombiniert, z. B. über das arithmeti-
sche Mittel (siehe SAC-SMA-Ensemble,
Abb. 9). Der Nachteil eines solchen
Ensembles ist, dass es – zusätzlich zu
den bereits genannten Annahmen zur
Modellstruktur – voraussetzt, dass die
Datenprodukte voneinander unabhän-
gig sind. Jedes Modell wird mit imper-
fekten Daten betrieben und potenzielle
synergetische Effekte, die aus der pro-
duktübergreifenden Verbindung zur
Verfügung stehender Informationen für
die Modellierung der hydrologischen
Prozesse gewonnen werden könnten,
werden nicht genutzt.
Resümee: Das LSTM hat die Fähig-
keit, diverse Inputs zu berücksichtigen
und etwaige Synergien in den Daten
(z. B. bei Verwendung unterschiedlicher
meteorologischer Datensätze in einem
Abb. 6 Modellgütevergleich zwischen verschiedenen einzugsgebietsspezifischen Modell) für eine verbesserte Modellie-
klassischen Niederschlags-Abfluss-Modellen und dem regionalen LSTM (orange). Dar- rung zu nutzen.
gestellt werden die empirischen kumulativen Verteilungsfunktionen der Nash-Sutcliffe-
Effizienz (NSE) über die verschiedenen Einzugsgebiete. Je weiter nach rechts verscho- 3.3.2 Analyse und Interpretation von
ben die Gesamtverteilung, desto besser ist das Model. In diesem Vergleich ist das regio- LSTM-Speichern
nale LSTM der beste Ansatz
Unter Hydrologen genießen neuronale
et al. 2020). Erstere sind, wie der Name sche Produkt separat kalibriert, weiters Netze nicht den besten Ruf. Einer der
impliziert, nur am Ort der Messstelle für jede Kombination aus zwei meteo- Hauptgründe dafür ist, dass Modelle
gültig, wohingegen letztere wiederum rologischen Produkten sowie ein regio- nicht nur Vorhersagen für den Abfluss
selbst das Produkt eines Modells sind, nales LSTM, das die meteorologischen liefern sollen, sondern auch ein hy-
das mit eigenen Annahmen und Feh- Variablen aus allen drei Datensätzen drologisches Prozessverständnis darü-
lern behaftet ist. Des Weiteren existiert auf einmal als Eingabedaten bekommt. ber hinaus ermöglichen sollen (Klemeš
eine Vielzahl unterschiedlicher meteo- Die Ergebnisse aus Kratzert et al. 1986). Sprich: Ein Modell soll nicht nur
rologischer Produkte – die teils mit (2020) zeigen, dass jede Kombination gute Simulationsergebnisse für den Ab-
unterschiedlichen Modellen erzeugt aus zwei meteorologischen Datenpro- fluss generieren, sondern es soll dies
wurden – in unterschiedlicher räum- dukten besser ist als das beste Mo- tun, weil es die entsprechenden Prozes-
licher und zeitlicher Auflösung (e.g. dell, das nur mit Daten aus einem me- se, die Niederschlag in Abfluss verwan-
verschieden generierte Ensemble-Vor- teorologischen Produkt gefüttert wird deln, (richtig) modelliert. Allerdings ist
hersagen). Dabei variieren vor allem (Abb. 8). Weiter ist das Modell, IN das bekannt, dass hydrologische Modelle
die Niederschlagsdaten für ein und alle drei meteorologischen Produkte auf zwar beispielsweise Bodenfeuchte oder
denselben Ort und Zeitpunkt teilweise einmal einfließen, besser als das bes- Schnee intern modellieren, diese Wer-
deutlich, und trotzdem gibt es zumeist te der Modelle, die eine Kombination te jedoch nur bedingt an die realen
kein universal „bestes“ Niederschlags- aus zwei meteorologischen Produkten Prozesse gekoppelt sind und zwischen
produkt (z. B. Behnke et al. 2016). DL erhalten. Kurz gesagt: je mehr (un- verschiedenen hydrologischen Model-
bietet die Möglichkeit, aus den unter- terschiedliche) meteorologische Daten len stark variieren können (Bouaziz
schiedlichen meteorologischen Daten- (insbesondere Niederschlag) das Mo- et al. 2020).
produkten möglicherweise vorhandene dell gleichzeitig erhält, desto besser. Bei neuronalen Netze ist zunächst
Synergien zu extrahieren. Ein einzelnes Vergleicht man das beste Modell nicht klar, was intern modelliert wird,
Modell kann sich diese Synergieeffek- (jenes, das alle drei meteorologischen um von den Eingabedaten auf die Ziel-
te zunutze machen und somit bessere Daten auf einmal bekommt) mit dem variable zu kommen. Das Forschungs-
Ergebnisse erzeugen. regionalen Modell aus den vorherigen feld der Explainable AI widmet sich
Wie im Abschn. 2.2 beschrieben, Kapiteln, so ergibt sich eine konstante diesem Thema und erforscht Metho-
stehen im CAMELS-Datensatz drei ver- Verbesserung der Modellgüte (Abb. 9). den, die das Modellverständnis verbes-
schiedene meteorologische Produkte Eines der gängigsten Verfahren, um sern sollen (Samek et al. 2019). Hinzu
zur Verfügung (DayMet, Maurer und Informationen aus unterschiedlichen kommt, dass das LSTM explizite Spei-
NLDAS). In Kratzert et al. (2020) ha- meteorologischen Datensätzen mit cherzellen besitzt (siehe Abschn. 2.1)
ben wir untersucht, wie sich die Ver- klassischen hydrologischen Modellen und es möglich ist zu analysieren, was
wendung mehrerer unterschiedlicher zu verwenden, ist das Bilden eines das LSTM über die Zeit in diesen Zellen
Niederschlagsdaten (neben anderen „Modell-Ensembles“. Hierbei werden modelliert.
meteorologischen Variablen) auf die für jeden meteorologischen Datensatz In Kratzert et al. (2018a, 2019a,
Modellgüte auswirken. Dazu haben wir Modelle separat kalibriert und die Vor- 2019c) haben wir untersucht, was das
regionale LSTM für jedes meteorologi- hersagen der einzelnen Modelle dann LSTM in seinen Speicherzellen model-

Niederschlags-Abfluss-Modellierung mit Long Short-Term Memory (LSTM)

Originalarbeit

dessen Anwendung in der Hydrologie
siehe Hoedt et al. (2021).

4.2 Berücksichtigung mehrerer
Zeitskalen

Für viele Anwendungen genügt es, Pro-
gnosen in täglicher Auflösung bereitzu-
stellen. Für bestimmte Aufgabenberei-
che, etwa die Flutvorhersage, ist diese
Auflösung jedoch nicht ausreichend.
Ein wichtiges Forschungsgebiet der
LSTM-basierten Modellierung ist da-
her die Vorhersage in hoher zeitlicher
Auflösung (etwa stündlich). Hierbei er-
geben sich sehr lange Zeitreihen der
Eingabedaten, was die Anwendung von
LSTMs in der Praxis erschwert. Weiter-
hin müsste man in diesem Ansatz je
ein unabhängiges LSTM für jede Zie-
Abb. 7 Vergleich der Modellgüte für die Vorhersage in unbeobachteten Einzugsgebie- lauflösung trainieren, wobei mit hoher
ten (PUB) Wahrscheinlichkeit die Vorhersagen der
einzelnen Modelle inkonsistent wür-
liert und konnten dabei nachweisen, 2. Das Prinzip des MTS-LSTM (Gauch den.
dass das LSTM wichtige hydrologische et al. 2020), mit dem es möglich ist, Multi-Timescale LSTMs (MTS-LSTM,
Prozesse wie Bodenfeuchte und Schnee aus einem LSTM-basierten Modell Gauch et al. 2020) bieten eine Lösung
intern modelliert, obwohl es nur trai- Abflussprognosen in unterschiedli- für diese Probleme: Es ermöglicht die
niert wurde, aus meteorologischen Da- chen zeitlichen Auflösungen zu ge- gemeinsame Vorhersage in verschie-
ten Abfluss vorherzusagen. Abb. 10 zeigt winnen. denen zeitlichen Auflösungen durch
beispielhaft den Vergleich von mo- 3. LSTM-basierte Modelle zur direk- ein einziges Modell. Zudem bietet es
delliertem Schnee-Wasser-Äquivalent ten Schätzung von Unsicherheiten die Möglichkeit, Eingabedaten mit un-
(SWE) eines etablierten Schneemodells in den Abflussprognosen (Klotz et al. terschiedlichen Vorhersagehorizonten
(Snow-17; REF) mit SWE, welches aus 2021). (lead times) für die verschiedenen Auf-
den Speicherzellen des LSTM abgelei- lösungen zu nutzen. Intuitiv basiert der
tet wurde. Dies ist ein Indikator dafür, 4.1 Massenerhaltung Ansatz darauf, dass der Wasserkreislauf
dass der datenbasierte Ansatz keine ein gedämpftes System ist: Für stünd-
Scheinkorrelationen abbildet, sondern Das Mass-Conserving LSTM (MC-LSTM; liche Vorhersagen sind hochaufgelöste
den unterliegenden Prozess intern wie- Hoedt et al. 2021) ist eine vor kurzem Daten der nahen Vergangenheit wich-
dergibt. Gepaart mit der exzellenten entwickelte Adaptierung des LSTM, das tig, während für weit zurückliegende
Modellgüte (siehe Abschnitt „Regionale durch seine Architektur die Erhaltung Ereignisse eine niedrigere Auflösung
Modellierung“) ist also davon auszu- von Massen-Inputs garantiert. Hier- genügt. Für eine detaillierte Beschrei-
gehen, dass LSTMs tatsächlich hydro- bei muss die Masse nicht zwangsläufig bung des Ansatzes verweisen wir auf
logisch relevante Prozesse lernen und Wasser sein, sondern kann auch jede Gauch et al. (2020).
intern modellieren, die es dem LSTM andere beliebige Größe repräsentie-
ermöglichen, einzugsgebietsübergrei- ren (z. B. Energie, Geld, Personen). Das 4.3 Schätzung von Unsicherheiten
fend gute Vorhersagen zu liefern. MC-LSTM besitzt nach wie vor explizite
Resümee: Es ist möglich, die Spei- Speicher, allerdings werden die Einga- Unsicherheiten sind eine intrinsische
cher von LSTMs mit hydrologischen bedaten in zwei Gruppen aufgeteilt: Komponente der hydrologischen Mo-
Prozessen in Verbindung zu setzen und Massen-Inputs und Nicht-Massen-In- dellierung. Jede Vorhersage, jede Mes-
so Einsichten über die interne Organi- puts. Letztere werden ausschließlich sung und jedes Modell ist mit Unsicher-
sation der ML-Modelle zu gewinnen. für die Steuerung innerhalb des Netz- heit behaftet. Die Schätzung von Unsi-
werkes verwendet (wie viel Masse fließt cherheiten ist eine zentrale Komponen-
4 Erweiterungen wohin, wie viel Masse verlässt an ei- te vieler modellgestützter Anwendun-
nem Zeitschritt das System etc.) und gen. Die Bereitstellung einer solchen
Abschließend wollen wir noch auf ei- die Massen-Inputs sind jene Werte, die Schätzung ist jedoch nicht trivial und
nige eine Reihe weiterer Forschungser- in ihrer Gesamtbilanz im System erhal- oft mit facettenreichen Problemstellun-
gebnisse eingehen, die auch im Kontext ten werden (z. B. Wasser in Form von gen assoziiert (Nearing und Gupta 2015;
der hydrologischen Modellierung von Niederschlag). In den Speichern des Beven 2016). Klassische Modelle benö-
Interesse sind: MC-LSTM wird ausschließlich Masse tigen in der Regel einen zusätzlichen
1. Das MC-LSTM (Hoedt et al. 2021), ei- gespeichert (also z. B. Wasser), was eine Mechanismus, um eine solche Schät-
ne neue Variante des LSTM mit Mas- Interpretation des Modells erleichtert. zung zu ermöglichen (z. B. pre-process-
senerhaltung. Für eine technische Beschreibung des ing, post-processing, Datenassimilati-
MC-LSTM sowie erste Ergebnisse zu on oder Monte-Carlo-Sampling). DL-

Niederschlags-Abfluss-Modellierung mit Long Short-Term Memory (LSTM)

Originalarbeit

Abb. 8 Verteilung der NSE-Werte für regionale LSTMs, die mit je einem meteorologischen Produkt (grün), mit je einer Kombination
aus zwei Produkten (blau) bzw. mit allen drei verfügbaren Produkten (rot) kalibriert wurden

                                                                                         basierte Modelle können die Unsicher-
                                                                                         heiten direkt aus dem Modell ableiten.
                                                                                         Grundsätzlich werden dabei entweder
                                                                                         modellintrinsische Eigenschaften ge-
                                                                                         nutzt oder Architekturen verwendet,
                                                                                         die direkte probabilistische Vorhersa-
                                                                                         gen ermöglichen. In Klotz et al. (2021)
                                                                                         vergleichen und testen wir eine Reihe
                                                                                         von Methoden zur Unsicherheitsschät-
                                                                                         zung mit DL-basierten Niederschlags-
                                                                                         Abfluss-Modellen. Im Test zeichnet sich
                                                                                         bereits ab, dass DL-basierte Verfahren
                                                                                         sehr gute Unsicherheitsschätzungen
                                                                                         ermöglichen.

                                                                                         5 Zusammenfassung, Diskussion
                                                                                           und Ausblick

                                                                                         Viele technologische Entwicklungen
                                                                                         der letzten Jahre sind auf Deep Learn-
Abb. 9 Modellgütevergleich für die Ansätze mit mehrerer meteorologischen Einga-          ing (DL) zurückzuführen. In diesem
ben. Die empirischen kumulativen Verteilungsfunktionen zeigen ein hydrologisches En-     Beitrag haben wir gezeigt, wie sich DL-
semble-Modell (SAC-SMA; blaue unterbrochene Linie) im Vergleich zu einem LSTM,           Modelle, im Speziellen das Long Short-
das mehrere meteorologische Datenprodukte als Eingaben verwendet (LSTM (multi            Term Memory Netzwerk (LSTM), für
forcing); orange Linie mit Punkten). Das normale LSTM, das bereits in den vorherigen     wasserwirtschaftliche Fragestellungen
Experimenten eingeführt wurde (LSTM (single forcing); orange Linie), dient hierbei als   nutzen lassen.
Orientierungspunkt, um die Güte einordnen zu können                                         Zuerst haben wir demonstriert, dass
                                                                                         LSTM-basierte hydrologische Modelle
                                                                                         stark davon profitieren, wenn sie für ei-
                                                                                         ne große Anzahl an (unterschiedlichen)
                                                                                         Einzugsgebieten gleichzeitig trainiert
                                                                                         werden und dass diese Vorgehensweise

                                                         Niederschlags-Abfluss-Modellierung mit Long Short-Term Memory (LSTM)

Originalarbeit

Abb. 10 Beispielhafter Vergleich von Schnee-Wasser-Äquivalent (mittlere Reihe), modelliert vom Schneemodell Snow-17 (blaue
Linien) sowie extrahiert aus LSTM-Speichern (orange unterbrochene Linie). Zusätzlich dargestellt sind Niederschlag (obere Reihe)
und Tageshöchst- sowie Tagestiefsttemperatur (untere Reihe). Beim Niederschlag sind Tage mit Temperaturen unter dem Gefrier-
punkt als schwarze Balken dargestellt

einzugsgebietsspezifischen Modellen schiedlichen meteorologischen Daten- Trotz der vielversprechenden Ergeb-
überlegen ist. sätzen zu extrahieren und für die Ver- nisse befinden wir uns noch in der
Der Vergleich dieser „regionalen“ besserung der Modellgüte zu Nutzen. Anfangsphase von DL-basierten An-
LSTMs mit klassischen hydrologischen Zuletzt haben wir gezeigt, dass sätzen. Die Möglichkeiten bzw. Limi-
Modellen liefert zwei wesentliche Er- LSTMs relevante hydrologische Pro- tierungen sind noch nicht genügend
gebnisse: Erstens, die regionalen LSTMs zesse (wie z. B. das Akkumulieren und erforscht. Wir erwarten daher, dass in
sind regional kalibrierten hydrologi- Schmelzen von Schnee) lernen, oh- den nächsten Jahren noch zahlreiche
schen Modellen deutlich überlegen. ne darauf trainiert worden zu sein. Erweiterungen konzipiert und Anwen-
Zweitens, das regionale LSTM ist auch Dies legt nahe, dass das LSTM keine dungen erschlossen werden.
besser als einzugsgebietsspezifische hy- Scheinkorrelationen lernt, sondern die Hierfür seien zwei Beispiele genannt:
drologische Modelle. tatsächlichen physikalischen Zusam- (a) Die Erstellung von räumlich verteil-
Des Weiteren haben wir gezeigt, dass menhänge zwischen meteorologischen ten DL-Modellen, welche die Fluss-
ein regionales LSTM ein sehr allgemei- Eingabedaten und Abfluss. struktur explizit mit einbeziehen. Es
nes hydrologisches Prozessverständnis Die künstliche Intelligenz bietet gro- existieren bereits erste Ansätze, die dies
lernt. Angewendet auf Einzugsgebiete, ße Chancen für die wasserwirtschaft- versuchen (z. B. Moshe et al. 2020), je-
die nicht für das Training des Modells liche Anwendung. In diesem Beitrag doch gibt noch keinen allgemeinen, gut
verwendet wurden (eine Annäherung haben wir das Potenzial anhand der skalierbaren Lösungsansatz. (b) Das
an die Vorhersage in unbeobachteten jüngsten Entwicklungen in der Nieder- Verwenden von DL-Modellen für hypo-
Einzugsgebieten), liefert das regionale schlags-Abfluss-Modellierung heraus- thetische Untersuchungen. Beispiels-
LSTM im Durchschnitt bessere Simu- gearbeitet. Diese Fortschritte demons- weise die Fragestellung: Wie würde sich
lationsergebnisse als speziell für die trieren, wie bereits jetzt leistungsfähige die Aufforstung in einem Teil des Ein-
Einzugsgebiete kalibrierte hydrologi- Werkzeuge aus dieser Technologie ge- zugsgebiets auf den Abfluss auswirken?
sche Modelle. wonnen werden können. Die jetzigen Beide Themengebiete sind Bestand-
Ein weiterer Vorteil von DL-Model- prototypischen Vorhersagemodelle er- teil unserer aktuellen Forschung.
len ist, dass sie beliebige Daten als Ein- zielen bereits bessere Ergebnisse als
gabedaten erlauben. LSTMs sind in der klassische Ansätze, die bereits über Jah- Funding Open access funding provided
Lage, synergetische Effekte aus unter- re verbessert wurden. by Johannes Kepler University Linz.

Niederschlags-Abfluss-Modellierung mit Long Short-Term Memory (LSTM)

Originalarbeit

Open Access Dieser Artikel wird unter                    angeben, ob Änderungen vorgenom-                         fende Handlung nicht nach gesetzlichen
der Creative Commons Namensnen-                          men wurden.                                              Vorschriften erlaubt ist, ist für die oben
nung 4.0 International Lizenz veröffent-                                                                          aufgeführten Weiterverwendungen des
licht, welche die Nutzung, Vervielfäl-                   Die in diesem Artikel enthaltenen Bil-                   Materials die Einwilligung des jeweili-
tigung, Bearbeitung, Verbreitung und                     der und sonstiges Drittmaterial unter-                   gen Rechteinhabers einzuholen.
Wiedergabe in jeglichem Medium und                       liegen ebenfalls der genannten Crea-
Format erlaubt, sofern Sie den/die ur-                   tive Commons Lizenz, sofern sich aus                     Weitere Details zur Lizenz entnehmen
sprünglichen Autor(en) und die Quelle                    der Abbildungslegende nichts anderes                     Sie bitte der Lizenzinformation auf
ordnungsgemäß nennen, einen Link zur                     ergibt. Sofern das betreffende Materi-                   http://creativecommons.org/licenses/
Creative Commons Lizenz beifügen und                     al nicht unter der genannten Creative                    by/4.0/deed.de.
                                                         Commons Lizenz steht und die betref-

  Literatur

  Addor, N., Newman, A. J., Mizukami, N. & Clark,          Renner, M., Reynolds, J. E., Ridolfi, E., Rigon,          Earth Syst. Sci., 25, 2045–2062, https://doi.org/
  M. P. (2017): The CAMELS data set: catchment             R., Riva, M., Robertson, D. E., Rosso, R., Roy, T.,       10.5194/hess-25-2045-2021.
  attributes and meteorology for large-sample              Sá, J. H. M., Salvadori, G., Sandells, M., Schae-         Gers, F. A., Schmidhuber, J., and Cummins, F.
  studies, Hydrology and Earth System Sciences             fli, B., Schumann, A., Scolobig, A., Seibert, J.,         (2000): Learning to Forget: Continual Prediction
  21(10), 5293–5313.                                       Servat, E., Shafiei, M., Sharma, A., Sidibe, M.,          with LSTM, Neural Comput., 12, 2451–2471
  Behnke, R., Vavrus, S., Allstadt, A., Albright, T.,      Sidle, R. C., Skaugen, T., Smith, H., Spiessl, S.         Halevy, A., Norvig, P. & Pereira, F. (2009): The
  Thogmartin, W. E. & Radeloff, V. C. (2016): Eva-         M., Stein, L., Steinsland, I., Strasser, U., Su, B.,      unreasonable effectiveness of data, IEEE Intelli-
  luation of downscaled, gridded climate data for          Szolgay, J., Tarboton, D., Tauro, F., Thirel, G.,         gent Systems 24(2), 8–12.
  the conterminous United States, Ecological ap-           Tian, F., Tong, R., Tussupova, K., Tyralis, H.,           Hersbach, H., Bell, B., Berrisford, P., Hiraha-
  plications 26(5), 1338–1351.                             Uijlenhoet, R., van Beek, R., van der Ent, R. J.,         ra, S., Horбnyi, A., Mucoz-Sabater, J., Nicolas,
  Beven, K. (2016): Facets of uncertainty: episte-         van der Ploeg, M., Loon, A. F. V., van Meerveld,          J., Peubey, C., Radu, R., Schepers, D. & others
  mic uncertainty, non-stationarity, likelihood, hy-       I., van Nooijen, R., van Oel, P. R., Vidal, J.-P.,        (2020): The ERA5 global reanalysis, Quarter-
  pothesis testing, and communication. Hydrolo-            von Freyberg, J., Vorogushyn, S., Wachniew, P.,           ly Journal of the Royal Meteorological Society
  gical Sciences Journal 61(9):1652–1665.                  Wade, A. J., Ward, P., Westerberg, I. K., White,          146(730), 1999–2049.
  Beven, K. (2019): Towards a methodology for              C., Wood, E. F., Woods, R., Xu, Z., Yilmaz, K.            Hinton, G., Deng, L., Yu, D., Dahl, G. E., Moha-
  testing models as hypotheses in the inexact              K. & Zhang, Y. (2019): Twenty-three unsolved              med, A.-R., Jaitly, N., Senior, A., Vanhoucke, V.,
  sciences, Proceedings of the Royal Society A             problems in hydrology (UPH)—a communi-                    Nguyen, P., Sainath, T. N. & others (2012): Deep
  475(2224), 20180862.                                     ty perspective, Hydrological Sciences Journal             neural networks for acoustic modeling in speech
  Blöschl, G. & Sivapalan, M. (1995): Scale issues         64(10), 1141–1158.                                        recognition: The shared views of four research
  in hydrological modelling: a review, Hydrological        Blöschl, G., Sivapalan, M., Savenije, H., Wage-           groups, IEEE Signal processing magazine 29(6),
  processes 9(3–4), 251–290.                               ner, T. & Viglione, A. (2013): Runoff prediction          82–97.
  Blöschl, G., Bierkens, M. F. P., Chambel, A., Cu-        in ungauged basins: synthesis across processes,           Hochreiter, S. (1991): Untersuchungen zu dyna-
  dennec, C., Destouni, G., Fiori, A., Kirchner, J.        places and scales, Cambridge University Press.            mischen neuronalen Netzen, Diploma, Techni-
  W., McDonnell, J. J., Savenije, H. H. G., Sivapa-        Bouaziz, L. J. E., Thirel, G., de Boer-Euser, T.,         sche Universität München 91(1).
  lan, M., Stumpp, C., Toth, E., Volpi, E., Carr, G.,      Melsen, L. A., Buitink, J., Brauer, C. C., De             Hochreiter, S. & Schmidhuber, J. (1997): Long
  Lupton, C., Salinas, J., Széles, B., Viglione, A.,       Niel, J., Moustakas, S., Willems, P., Grelier,            short-term memory, Neural computation 9(8),
  Aksoy, H., Allen, S. T., Amin, A., Andréassian, V.,      B., Drogue, G., Fenicia, F., Nossent, J., Perei-          1735–1780.
  Arheimer, B., Aryal, S. K., Baker, V., Bardsley, E.,     ra, F., Sprokkereef, E., Stam, J., Dewals, B. J.,         Hoedt, P.-J., Kratzert, F., Klotz, D., Halmich, C.,
  Barendrecht, M. H., Bartosova, A., Batelaan, O.,         Weerts, A. H., Savenije, H. H. G. & Hrachowitz,           Holzleitner, M., Nearing, G., Hochreiter, S., and
  Berghuijs, W. R., Beven, K., Blume, T., Bogaard,         M. (2020): Behind the scenes of streamflow mo-            Klambauer, G. (2021): MC-LSTM: Mass-Conser-
  T., de Amorim, P. B., Böttcher, M. E., Boulet, G.,       del performance, Hydrology and Earth System               ving LSTM, available at: https://arxiv.org/abs/
  Breinl, K., Brilly, M., Brocca, L., Buytaert, W.,        Sciences Discussions 2020, 1–38.                          2101.05186.
  Castellarin, A., Castelletti, A., Chen, X., Chen,        Burnash, R. J. C., Ferral, R. L., and McGuire,            Hrachowitz, M., Savenije, H. H. G., Blцschl,
  Y., Chen, Y., Chifflard, P., Claps, P., Clark, M.        R. A. (1973): A generalised streamflow simulati-          G., McDonnell, J. J., Sivapalan, M., Pomeroy, J.
  P., Collins, A. L., Croke, B., Dathe, A., David, P.      on system conceptual modelling for digital com-           W., Arheimer, B., Blume, T., Clark, M. P., Ehret,
  C., de Barros, F. P. J., de Rooij, G., Baldassarre,      puters., Tech. rep., US Department of Commerce            U. & others (2013): A decade of Predictions in
  G. D., Driscoll, J. M., Duethmann, D., Dwive-            National Weather Service and State of California          Ungauged Basins (PUB)—a review, Hydrological
  di, R., Eris, E., Farmer, W. H., Feiccabrino, J.,        Department of Water Resources, Sacramento,                sciences journal 58(6), 1198–1255.
  Ferguson, G., Ferrari, E., Ferraris, S., Fersch,         CA, USA.                                                  Kirchner, J. W. (2006): Getting the right answers
  B., Finger, D., Foglia, L., Fowler, K., Gartsman,        Burnash, R. J. C. (1995): The NWS river forecast          for the right reasons: Linking measurements,
  B., Gascoin, S., Gaume, E., Gelfan, A., Geris,           system-catchment modeling, Computer models                analyses, and models to advance the science of
  J., Gharari, S., Gleeson, T., Glendell, M., Be-          of watershed hydrology. 1995 pp.311–366 ref.12.           hydrology, Water Resour. Res., 42, 1–5.
  vacqua, A. G., González-Dugo, M. P., Grimaldi,           Cosgrove, B. & Klemmer, C. (2019): The Natio-             Klemes, V. (1983): Conceptualization and scale
  S., Gupta, A. B., Guse, B., Han, D., Hannah,             nal Water Model, US National Oceanic and At-              in hydrology, Journal of hydrology 65(1–3), 1–23.
  D., Harpold, A., Haun, S., Heal, K., Helfricht,          mospheric Administration, https://water.noaa.             Klemes, V. (1986): Dilettantism in hydrology:
  K., Herrnegger, M., Hipsey, M., Hlaváčiková,            gov/about/nwm, last access: 2021-01-25.                   Transition or destiny?, Water Resources Research
  H., Hohmann, C., Holko, L., Hopkinson, C.,               Feigl, M., Herrnegger, M., Klotz, D. & Schulz, K.         22(9S), 177S–188S.
  Hrachowitz, M., Illangasekare, T. H., Inam, A.,          (2020): Function Space Optimization: A symbo-             Klemes, V. (1997): Guest editorial: Of carts and
  Innocente, C., Istanbulluoglu, E., Jarihani, B.,         lic regression method for estimating parameter            horses in hydrologic modeling, Journal of Hydro-
  Kalantari, Z., Kalvans, A., Khanal, S., Khatami,         transfer functions for hydrological models, Wa-           logic Engineering 2(2), 43–49.
  S., Kiesel, J., Kirkby, M., Knoben, W., Kochanek,        ter resources research 56(10), e2020WR027385.             Klotz, D., Herrnegger, M. & Schulz, K. (2017):
  K., Kohnová, S., Kolechkina, A., Krause, S., Kre-        Fekete, B. M., Vörösmarty, C. J., Roads, J. O. &          Symbolic regression for the estimation of trans-
  amer, D., Kreibich, H., Kunstmann, H., Lange,            Willmott, C. J. (2004): Uncertainties in Precipi-         fer functions of hydrological models, Water
  H., Liberato, M. L. R., Lindquist, E., Link, T.,         tation and Their Impacts on Runoff Estimates,             Resources Research 53(11), 9402–9423.
  Liu, J., Loucks, D. P., Luce, C., Mahé, G., Maka-        Journal of Climate 17(2), 294–304.                        Klotz, D., Kratzert, F., Gauch, M., Keefe Samp-
  rieva, O., Malard, J., Mashtayeva, S., Maskey, S.,       Gauch, M., Mai, J. & Lin, J. (2021): The pro-             son, A., Brandstetter, J., Klambauer, G., Hoch-
  Mas-Pla, J., Mavrova-Guirguinova, M., Mazzo-             per care and feeding of CAMELS: How limited               reiter, S., and Nearing, G. (2021): Uncertain-
  leni, M., Mernild, S., Misstear, B. D., Montanari,       training data affects streamflow prediction, En-          ty Estimation with Deep Learning for Rain-
  A., Müller-Thomy, H., Nabizadeh, A., Nardi, F.,          vironmental Modelling & Software 135, 104926.             fall–Runoff Modelling, Hydrol. Earth Syst. Sci.
  Neale, C., Nesterova, N., Nurtaev, B., Odongo, V.        Gauch, M., Kratzert, F., Klotz, D., Nearing, G.,          Discuss. [preprint], https://doi.org/10.5194/
  O., Panda, S., Pande, S., Pang, Z., Papacharal-          Lin, J., & Hochreiter, S. (2021): Rainfall–runoff         hess-2021-154, in review.
  ampous, G., Perrin, C., Pfister, L., Pimentel, R.,       prediction at multiple timescales with a single           Kratzert, F., Herrnegger, M., Klotz, D., Hochrei-
  Polo, M. J., Post, D., Sierra, C. P., Ramos, M.-H.,      Long Short-Term Memory network, Hydrol.                   ter, S. & Klambauer, G. (2018a): Do internals of

                                                                       Niederschlags-Abfluss-Modellierung mit Long Short-Term Memory (LSTM)

Originalarbeit

  neural networks make sense in the context of          Mizukami, N., Clark, M. P., Newman, A. J.,                Samaniego, L., Kumar, R., and Attinger, S.
  hydrology?, in AGU Fall Meeting Abstracts, pp.        Wood, A. W., Gutmann, E. D., Nijssen, B., Ra-             (2010): Multiscale parameter regionalization
  H13B–06.                                              kovec, O. & Samaniego, L. (2017): Towards se-             of a grid-based hydrologic model at the mesos-
  Kratzert, F., Herrnegger, M., Klotz, D., Hochrei-     amless large-domain parameter estimation for              cale, Water Resour. Res., 46, W05523, https://doi.
  ter, S. & Klambauer, G. (2019a): NeuralHydro-         hydrologic models, Water Resources Research               org/10.1029/2008WR007327.
  logy—Interpreting LSTM in HydrologyExplaina-          53(9), 8020–8040.                                         Samek, W., Montavon, G., Vedaldi, A., Hansen,
  ble AI: Interpreting, Explaining and Visualizing      Moshe, Z., Metzger, A., Elidan, G., Kratzert, F.,         L. K. & Müller, K.-R. (2019): Explainable AI:
  Deep Learning, Springer, , pp. 347–362.               Nevo, S. & El-Yaniv, R. (2020): HydroNets: Lever-         interpreting, explaining and visualizing deep
  Kratzert, F., Klotz, D., Herrnegger, M., Samp-        aging River Structure for Hydrologic Modeling,            learning, Vol. 11700, Springer Nature.
  son, A. K., Hochreiter, S. & Nearing, G. S.           in Workshop on AI for Earth Sciences 8th Inter-           Seibert, J. & Vis, M. J. P. (2012): Teaching
  (2019b): Toward improved predictions in un-           national Conference on Learning Representati-             hydrological modeling with a user-friendly
  gauged basins: Exploiting the power of machine        ons (ICLR 2020).                                          catchment-runoff-model software package,
  learning, Water Resources Research 55(12),            Nearing, G. S. & Gupta, H. V. (2015): The quan-           Hydrology and Earth System Sciences 16(9),
  11344–11354.                                          tity and quality of information in hydrologic mo-         3315–3325.
  Kratzert, F., Klotz, D., Brenner, C., Schulz, K.,     dels, Water Resources Research 51(1), 524–538.            Sivapalan, M. (2003): Prediction in ungauged
  and Herrnegger, M. (2018b): Rainfall–runoff           Nearing, G. S., Kratzert, F., Sampson, A. K., Pe-         basins: a grand challenge for theoretical hydro-
  modelling using Long Short-Term Memory                lissier, C. S., Klotz, D., Frame, J. M., Prieto, C. &     logy, Hydrological Processes 17(15), 3163–3170.
  (LSTM) networks, Hydrol. Earth Syst. Sci., 22,        Gupta, H. V. (2021): What role does hydrologi-            Sutskever, I., Vinyals, O. & Le, Q. V. (2014):
  6005–6022,      https://doi.org/10.5194/hess-22-      cal science play in the age of machine learning?.         Sequence to sequence learning with neural
  6005-2018.                                            Water Resources Research, 57, e2020WR028091.              networks, Advances in neural information pro-
  Kratzert, F., Klotz, D., Hochreiter, S., and Nea-     https://doi.org/10.1029/2020WR028091                      cessing systems 27, 3104–3112.
  ring, G. S. (2020): A note on leveraging synergy      Newman, A. J., Clark, M. P., Sampson, K., Wood,           Thornton, P. E., Thornton, M. M., Mayer, B.
  in multiple meteorological datasets with deep         A., Hay, L. E., Bock, A., Viger, R. J., Blodgett,         W., Wilhelmi, N., Wei, Y., Devarakonda, R. &
  learning for rainfall-runoff modeling, Hydrol.        D., Brekke, L., Arnold, J. R. & others (2015):            Cook, R. (2012): Daymet: Daily surface weather
  Earth Syst. Sci. Discuss. [preprint], https://doi.    Development of a large-sample watershed-scale             on a 1 km grid for North America, 1980–2008,
  org/10.5194/hess-2020-221, in review.                 hydrometeorological data set for the contiguous           Oak Ridge National Laboratory (ORNL) Distri-
  Kratzert, F., Klotz, D., Shalev, G., Klambauer, G.,   USA: data set characteristics and assessment of           buted Active Archive Center for Biogeochemical
  Hochreiter, S., and Nearing, G. (2019c): Towards      regional variability in hydrologic model perfor-          Dynamics (DAAC).
  learning universal, regional, and local hydrolo-      mance, Hydrology and Earth System Sciences                Xia, Y., Mitchell, K., Ek, M., Sheffield, J., Cos-
  gical behaviors via machine learning applied to       19(1), 209–223.                                           grove, B., Wood, E., Luo, L., Alonge, C., Wei,
  large-sample datasets, Hydrol. Earth Syst. Sci.,      Parajka, J., Viglione, A., Rogger, M., Salinas, J.        H., Meng, J. & others (2012): Continental-scale
  23, 5089–5110, https://doi.org/10.5194/hess-          L., Sivapalan, M., and Blöschl, G. (2013): Com-           water and energy flux analysis and validation
  23-5089-2019.                                         parative assessment of predictions in ungauged            for the North American Land Data Assimilation
  Krizhevsky, A., Sutskever, I. & Hinton, G. E.         basins – Part 1: Runoff-hydrograph studies, Hy-           System project phase 2 (NLDAS-2): 1. Intercom-
  (2017): Imagenet classification with deep con-        drol. Earth Syst. Sci., 17, 1783–1795, https://doi.       parison and application of model products, J.
  volutional neural networks, Communications of         org/10.5194/hess-17-1783-2013.                            Geophys. Res., 117, D03109, https://doi.org/10.
  the ACM 60(6), 84–90.                                 Radford, A., Jуzefowicz, R. & Sutskever, I.               1029/2011JD016048.
  Liang, X., Lettenmaier, D. P., Wood, E. F. & Bur-     (2017): Learning to Generate Reviews and Dis-
  ges, S. J. (1994): A simple hydrologically based      covering Sentiment, CoRR abs/1704.01444.
                                                                                                                Hinweis des Verlags Der Verlag bleibt
  model of land surface water and energy fluxes for     Salas, F. R., Somos-Valenzuela, M. A., Dugger,
  general circulation models, Journal of Geophysi-      A., Maidment, D. R., Gochis, D. J., David, C. H.,       in Hinblick auf geografische Zuordnun-
  cal Research: Atmospheres 99(D7), 14415–14428.        Yu, W., Ding, D., Clark, E. P. & Noman, N. (2018):      gen und Gebietsbezeichnungen in ver-
  Maurer, E. P., Wood, A. W., Adam, J. C., Letten-      Towards real-time continental scale streamflow          öffentlichten Karten und Institutsadres-
  maier, D. P. & Nijssen, B. (2002): A long-term hy-    simulation in continuous and discrete space,
  drologically based dataset of land surface fluxes     JAWRA Journal of the American Water Resources           sen neutral.
  and states for the conterminous United States,        Association 54(1), 7–27.
  Journal of climate 15(22), 3237–3251.

Niederschlags-Abfluss-Modellierung mit Long Short-Term Memory (LSTM)

Sie können auch lesen