Texte als Bausteine der Umweltforschung

Die Seite wird erstellt Kasimir Sauer

Reisen

Deutsch

Like
Teilen
Einbetten
Vollbild
Folien
HTML Herunterladen
PDF Herunterladen
Missbrauch

←

WEITER LESEN

→

Transkription von Seiteninhalten

Wenn Ihr Browser die Seite nicht korrekt rendert, bitte, lesen Sie den Inhalt der Seite unten

Siedlungsforschung. Archäologie – Geschichte – Geographie 39, 2022, S. 541–565

Texte als Bausteine der
Umweltforschung
Von der analogen Analyse über Datenbanken
und virtuelle Forschungsumgebungen zum
Crowdsourcing und Maschinellen Lernen
Rüdiger Glaser, Michael Kahle, Franck Borel, Rafael Hologa, Oliver Rau und
Antje Kellersohn

1 Texte und Textinterpretation als Bausteine der
Klima- und Umweltforschung

Texte sind wesentliche Bausteine wissenschaftlicher Erkenntnisse und Kommunikation.
Ihre Erschließung erfordert spezifische Praktiken und Zugänge (Reuber 2020, Pfaffenbach
2020, Dzudzek, Glasze u. Matissek 2020). Die in der historischen Umweltforschung ver
wendeten Quellen stellen eine Sonderform dar, da nicht immer alle für die moderne Text
analyse notwendigen Informationen greifbar sind. So fehlen in historischen Kontexten
bisweilen Hinweise auf die Verfasser. Häufig sind auch der Kontext der Abfassung oder
die Intention nicht überliefert. Zwischen der Abfassung und dem öffentlichen Zugang
liegt bisweilen ein zeitlicher Versatz. Zudem müssen Datierungsfragen geklärt werden, da
Kalenderreformen durchgeführt wurden und die historisch übliche Zuweisung auf den
nächsten Heiligentag zu entsprechenden Zeitsprüngen führten. Handschriftliche Über
lieferungen stellen besondere Herausforderungen an die Transkription, ebenso der Bedeu
tungswandel von Begriffen und die unterschiedlichen Schreibweisen. Ähnlich anspruchs
voll ist oft auch die örtliche Zuordnung. Für die Erschießung und Auswertung historischer
Quellen wurden daher eigene Standards entwickelt.

541

Rüdiger Glaser, Michael Kahle, Franck Borel, Rafael Hologa, Oliver Rau und Antje Kellersohn

2 Analoge Analyse der Auswertung
historischer Textquellen

Grundsätzlich folgt die Analyse von Textquellen in der Historischen Klimatologie den
Grundprinzipien der Hermeneutik. Ein besonderes Augenmerk ruht dabei auf der Quel
lenkritik. Ziel ist das Verständnis von Texten in ihrem historischen Entstehungskontext.
Von wem wurde die Quelle und mit welcher Intention wurde der Text erstellt? Zentrale
Frage dabei ist, welcher Deutungskontext sich aus dem Zeitgeist ergibt. Mit welcher In
tention wurde die Quelle geschaffen, welche Umwelt- und vor allem Klimawahrnehmung
herrschte zur Zeit der Abfassung und welche zeitspezifischen Erkenntnisformen standen
überhaupt zur Verfügung (Glaser 2013). Ziel der Hermeneutik ist es nach Mayring (2015),
eine „Kunstlehre“ des Auslegens bzw. Interpretierens von Texten und der Realität zu ent
wickeln. Im hermeneutischen Zirkel werden verschiedene Zugänge und Interpretations
perspektiven eingenommen, indem der gleiche Text immer wieder aus dem jeweils aktuell
herrschenden Kontext mit dem entsprechenden Vorverständnis neu interpretiert wird.
Die Diskrepanz zwischen der Abfassung und dem jeweiligen Erkenntnishorizont nennt
man hermeneutische Differenz. Der Übergang zur darauffolgenden Interpretation ist flie
ßend (Winiwarter u. Knoll 2007).
In vielen Ansätzen wird über die qualitative Analyse hinaus mittels einer systematischen
Textanalyse eine Quantifizierung angestrebt (Mayring 2015). Unter der systematischen Text
analyse wird die Analyse der Semiotik als Lehre des allgemeinen Bedeutungsaustausches
kommunizierender Individuen verstanden, ebenso die der Syntaktik, der Semantik und der
Pragmatik als Relation zwischen Zeichen und den diese benutzenden Individuen sowie die
Sigmatik der Quellen. Insgesamt soll über die verschiedenen Schritte der Explizierenden
und der zusammenschauenden Kontextanalyse eine Objektivierung erreicht werden.
Besonders aufschlussreich sind historische Quellen, in denen über einen längeren Zeit
raum bzw. über mehrere Generationen hinweg kontinuierlich das Umweltgeschehen für
eine bestimmte Region dokumentiert ist. Da in solchen Chroniken oftmals dieselben
Aspekte Gegenstand der Dokumentation sind, sind sie prädestiniert, um längere Zeitrei
hen zu spezifischen Umweltparametern abzuleiten. Auf diese Weise kann das Umweltge
schehen nicht nur im quellenkritischen Kontext, sondern auch komparativ im Laufe der
Zeit oder im Verhältnis zu anderen Regionen gesetzt werden. So liefert beispielsweise die
Hauschronik der Wiesenbronner Familie Hüßner mit ihren Aufzeichnungen vielfältige
Hinweise zu Klima, Anbaufrüchten, Phänologie, Wirtschaft und Geschichte in Mainfran
ken in den Jahren 1750–1894. Darin heißt es beispielsweise für das Jahr 1762:

„Anno 1762 war ein rechts hartes jahr, maßen der weinstock zu anfang deß Meyen halb
erfroren und gegen zu ende deß Meyen folgent den garauß gemacht, daß dabey auch
war eine solche trockene dürr dabey, daß es 2 monath nichts regnen that, dan hero der

542

Texte als Bausteine der Umweltforschung

edle same auch nicht fort wacksen kont, und eine schlechte ernde; daß korn galt im
Juny schon 12 fl. und 30 kr. frk., biß gegen den Herpst 11 thl. frk., der eymer most, weil
eß wenig geben, ist er noch gut worden, gult 3 thl. und der habern galt 4 fl. 16 kr. frk.“

Der Text wurde aus dem Manuskript transkribiert und mit dem Anfang der 1990er Jahre
weit verbreiteten Textverarbeitungsprogramm WORD5 in eine erste digitale Form über
führt und schließlich publiziert (Glaser, Schenk u. Schröder 1991). Die inhaltlichen Aus
sagen beziehen sich sehr typisch für eine mit der Landwirtschaft betraute Familie am Rand
des Steigerwalds Mitte des 18. Jahrhunderts auf den Witterungsgang, die entsprechenden
Auswirkungen auf die Landwirtschaft und die Preise: Offensichtlich war der Jahresbe
ginn 1762 kalt. Weitere Kennzeichen sind die zwei Frostereignisse im Mai, die den Reben
folgenschwer zusetzten. Zudem wird eine zweimonatige Dürreperiode angeführt, in der
es keinen Niederschlag gab, was sich wiederum schlecht auf die Entwicklung der Anbau
produkte auswirkte und eine schlechte Ernte zur Folge hatte. Verschiedene Preisangaben
zu Getreide und Wein, der gering, aber gut ausfiel, runden das Bild ab.
Derartige Hinweise wurden oft in mehrjähriger Recherchearbeit in umfassenden Daten
sammlungen zusammengeführt und publiziert. Bekannt ist beispielsweise die Sammlung
Weikinn (1958–1963), die von Börngen u. Tetzlaff (2000) abgeschlossen wurde. Derartige
Sammlungen haben eine lange Tradition, wie etwa die zu den Hochwasserereignissen an
der Elbe von Pötzsch (1784) zeigt. Kritikpunkte an diesen Sammlungen sind der oft unkri
tische kompilative Charakter sowie die Verwendung von nicht überprüften Sekundärquel
len. Trotz dieser berechtigten Kritik bieten sie wichtige Ansatzpunkte für weiterreichende
wissenschaftliche Forschung (Muddelsee et al. 2002).
Die Erschließung historischer Quellen erforderte in der analogen Zeit oftmals zeitauf
wendige akribische Archivrecherchen. Findbehelfe, wie Repertorien, hatten in dem bis
dato geltenden Verständnis von „historisch“ oftmals keine eigenen Rubriken für Umwelt
oder Wetter, Witterung und Klima. Erst mit dem ökologischen Turn der 1970er Jahre setz
te sich schließlich ein entsprechendes Verständnis und mit einem zeitlichen Versatz auch
eine Integration in einschlägigen Findhilfen durch.

3 Datenbanken, neue Formate und Zugänge
im Rahmen der Digitalisierung

Die rasant voranschreitende Digitalisierung seit den 1990er Jahren mit der Verbreitung
des Internets eröffnete neue Recherche-, Erfassungs- und Auswertungsmöglichkeiten: Wo
früher mühsame, zeitaufwändige und kostenintensive Archivrecherche notwendig war
oder langwierige Fernleihen bemüht werden mussten, können heute zunehmend digitale
Quellenbestände und Informationen über das Internet erschlossen werden. Zusätzlich er

543

Rüdiger Glaser, Michael Kahle, Franck Borel, Rafael Hologa, Oliver Rau und Antje Kellersohn

leichtern komfortable Suchfunktionen das Erschließen von Textquellen, wodurch relevan
te Textbausteine systematisch mittels a priori festgelegter Kodierschemata oder alternativ
über thesaurierende Suchverfahren gesammelt und kodiert werden können.
Aktuelle Beispiele für neue Zugangsoptionen liefern die digitalisierten Bestände der
Monumenta Germaniae Historica MGH (www.dmgh.de), oder die der Freiburger Zeitung
(https://www.ub.uni-freiburg.de/recherche/digitale-bibliothek/freiburger-historische-
bestaende/freiburger-zeitung). Auch einschlägige Werke aus den digitalisierten Beständen
von Google Books oder von Archive.org bieten leicht zugängliche Informationen. Mitt
lerweile sind auch umfassende Bildergalerien von Hochwassermarken und viele andere
Digitalisate online verfügbar.
Für fachlich einschlägige Analysen stehen mittlerweile eine Reihe von beeindruckenden
Datenbanken online zur Verfügung. Zu diesen zählen u. a. Pediflood (Barriendos et al.
2014), ORRION (Martin et al. 2016), ICOADS (Woodruff et al. 2011), CLIWOC (García-
Herrera et al. 2005), euroclimhist.ch (Pfister 2015) oder REACHES (Wang et al. 2018).
Dazu kommen fachlich spezifizierte Datenbanken, beispielsweise zu Dürren wie EDII
(Stahl et al. 2016), oder von marinen sowie frühen instrumentellen Daten (Kaspar et al.
2015, Cram et al. 2015). Weitere Zugänge finden sich unter https://www.ncdc.noaa.gov/
data-access/paleoclimatology-data/datasets/historical. In den national geförderten Digi
talisierungsprojekten DADIGI und HISTOR des DWD wurden entsprechende Sammlun
gen aus deutschen Archivbeständen integriert (Kaspar et al. 2015).
Im Rahmen dieser Bemühungen kommen zunehmend auch Fragen der Datenstandar
disierung auf. So werden bei PAGES verschiedene Paläodaten in einem gemeinsamen
Datenformat (LiPD) nach den FAIR (Findable-Accessible-Interoperable and Reusable)
Prinzipien zusammengeführt. Damit eröffnen sich neue Möglichkeiten der Big Data
Analyse sowie der Reanalyse (McKay u. Emile-Geay 2016, Wilhelm et al. 2018, Khider et
al. 2019).

3.1 HISKLID – Kodierung, Indizierung und Cross Validierung
historischer Quellentexte

Die recherchierten Quellentexte für den mitteleuropäischen Raum wurden zunächst in
HISKLID digital erfasst. Zeit bzw. Zeiträume, Ort, Quelle und Inhalt wurden dazu ko
diert bzw. indiziert. Ein Teil der HISKLID Daten sowie das Kodierschema sind publiziert
(Glaser u. Militzer 1993, Glaser 1996). In Tab. 1 ist die Kodierung des obigen Textzitates
nach dem HISKLID Format abgebildet. Die Texte wurden dabei in einen numerischen,
„maschinenlesbaren“ Code überführt. Wesentlicher Bestandteil dieses Arbeitsschrittes ist
die Indizierung der klimatischen Angaben (Glaser 1996).

544

Texte als Bausteine der Umweltforschung

Tab. 1: Kodierung des Textzitates von 1762 in HISKLID.

1762 05 41 18711–55 40 01
1762 05 40 18711–55 -2
1762 06 18711–55 02 01
1762 18711–55 0124 01
1762 18711–55 0132 01
1762 18711–55 04 01
1762 16 18711–55 02 01

Die Cross-Validierung des oben wiedergegebenen Textauszuges mit den numerischen
Angaben der Baur’schen Temperaturreihe für Mitteleuropa bestätigt die inhaltlichen Ge
wichtungen und Beschreibungen. War der Januar gegenüber der Klimanormalperiode
1961–1990 um nicht ganz 1°C zu mild, blieb der Februar rund 1°C unter den langjährigen
Vergleichswerten, der März sogar 3,3°C, was die Bezeichnung eines „harten Jahres“ ver
ständlich macht. Da der April 2,2°C zu warm ausfiel und auch der Mai 0,8°C über den Ver
gleichswerten lag, erscheint auch der Hinweis auf die Trockenheit und das Fehlen von Re
gen plausibel. Die Werte von März und April überstiegen auch die Grenzen der einfachen
Standardabweichung, was sie als auffällig bzw. extrem einordnen lässt. Zudem handelt es
sich um, wie ebenfalls erwähnt, – agrarökologisch wichtige Monate.
Die Cross-Validierung mit den instrumentellen Daten ermöglicht eine Bewertung der
Quelle und zeigt, wie plausibel die schriftlichen Hinweise sind. Wenn derartige Instru
mentendaten nicht vorliegen, kann eine Plausibilitätsprüfung auch über die zusammen
schauende Interpretation mit anderen Quellen erfolgen. Benachbarte Regionen sind
aufgrund der Synopsis, d. h. des Gesamtbildes von Wettersituationen und Witterungs
abläufen nicht unabhängig voneinander, sondern kausal miteinander verknüpft. Im Fall
der Hüßner-Hauschronik bestätigen Quellen aus Stuttgart und dem Raum Bodensee so
wie Mainfranken den Witterungsgang, insbesondere die Kälte im Februar und März, die
Frostereignisse im Mai sowie die Hitze und Dürre im Sommer. Auch die gute Weinqualität
dieses Jahrganges findet mehrfach Erwähnung. Damit werden die Inhalte der Wiesen
bronner Hauschronik gleich mehrfach bestätigt.
Das HISKLID Format wurde schließlich in tambora.org übernommen und weiterentwi
ckelt. Dies bezieht sich zum einen auf die Erweiterung des hierarchischen Kodierschemas,
zum anderen auf die Bezugnahme auf eine Ortsdatenbank, die nunmehr mit Geokoordi
naten hinterlegt ist. Die Quellen wurden in gängigen Formaten abgelegt und damit weiter
standardisiert.

545

Rüdiger Glaser, Michael Kahle, Franck Borel, Rafael Hologa, Oliver Rau und Antje Kellersohn

4 tambora.org – kollaborative Forschungsumgebung als
neue IT-basierte Form der Wissenskommunikation und
Partizipation in der Historischen Klimatologie
Durch die rasante Entwicklung der letzten Jahre ergeben sich nicht nur effektive Möglich
keiten der Datenvorhaltung, sie eröffnen auch grundlegend neue Perspektiven einer weit
reichenden Wertschöpfung und Kollaboration. Kollaborative Forschungsumgebungen,
die oft auch virtuelle Forschungsumgebung (VFU), E-Portale, oder Englisch „Collabora
tive Research Environment“ (CREs) genannt werden, stellen neue Formen partizipativer
Datenablage und Nutzung dar. Sie wurden seit den 2000er Jahren entwickelt, um großen,
ortsübergreifenden Arbeitsgruppen eine geeignete Plattform zu bieten, um Daten, Metho
den und Erkenntnisse zu kommunizieren, zu teilen und zu verbreiten. Dabei wurden sie
stets nicht nur als technisches Vehikel, sondern auch als sozial integrierendes Instrument
angesehen (Kahle, Glaser u. Hologa 2020, Carusi u. Reimers 2010). Durch die Öffnung
nach außen beinhalten sie auch eine gesellschaftspolitische Komponente, insbesondere
durch die Adressierung weiterer Stakeholder oder die Einbeziehung von Bürgerwissen
schaften (Candela et al. 2013).
Auf tambora.org ist der komplette Workflow der Historischen Klimatologie stringent
umgesetzt, ergänzt um ein Rechte- und Verwaltungssystem sowie Publikationsmöglich
keiten (Riemann et al. 2015).

Abb. 1: Ablaufschema in der Historischen Klimatologie in tambora.org.

546

Texte als Bausteine der Umweltforschung

In einer langjährigen Kooperation mit dem Institut für Länderkunde (IfL) in Leipzig
wurden in zwei DFGfinanzierten Förderphasen auch die 66.000 Einträge umfassenden
Datenbestände von Weikinn in tambora.org überführt (Weikinn 1958; Börngen u. Tetzlaff
2000). Im Laufe der Vorhaben kamen weitere Datenbestände, u. a. aus dem ANFDFG
geförderten Vorhaben Transrisk hinzu (Himmelsbach et al. 2015). Gespiegelt werden diese
Datensätze im Datenbankprojekt ORRION des französischen Projektpartners. Das Geo
graphische Institut der Universität Augsburg beteiligte sich mit dem IBT Datenbestand
(Inundationes Bavariae Thesaurus), in dem Hochwasserereignisse aus dem Alpenvorland
enthalten sind (Böhm 2013; Böhm et al. 2014).
Die Universitätsbibliothek Freiburg, die ganz wesentlich zur Entwicklung und technischen
Realisierung beitrug, verpflichtete sich zudem, tambora.org zu hosten und damit die Daten
bestände, aber auch die Erkenntnisse und Methoden langfristig zu sichern. Die UB Freiburg
als eine Körperschaft des öffentlichen Rechts garantiert auch rechtliche Standards wie die
freie Zugänglichkeit und einen an guter wissenschaftlicher Praxis orientierten Umgang.
Besonders hervorzuheben ist die Möglichkeit einer arbeitsteiligen Vorgehensweise vor
allem für jene Arbeitsschritte, die ein Expertenwissen erfordern, beispielsweise bei der
Transkription von Handschriften, für die spezifische paläographische Kenntnisse unab
dingbar sind. Ähnlich verhält es sich bei den Kalibrierungsverfahren, die in aller Regel
eine Anwendung statistischer Verfahren voraussetzen. Für die Ableitung von Schätz
werten der Temperatur und des Niederschlages wurden die Indexwerte kalibriert. Dazu
wurden Verfahren wie das VarianzScaling und Regressionsansätze verwendet (Glaser u.
Riemann 2009, Glaser u. Kahle 2020).

Abb. 2: Temperatur- und Niederschlagsentwicklung in Mitteleuropa seit 1500. Im oberen
Teil sind die Temperaturen als die einjährigen (1y), zweijährigen (2y) usw., im unteren
die Niederschlagswerte analog abgebildet. Die schwarze Linie repräsentiert das gefilterte
5-jährige Mittel (Quelle: Glaser et al. 2020).

547

Rüdiger Glaser, Michael Kahle, Franck Borel, Rafael Hologa, Oliver Rau und Antje Kellersohn

Für die Interpretation wiederum ist klimatologisches Fachwissen notwendig. Ein derart
arbeitsteiliges Vorgehen und standardisiertes Werkzeugrepertoire verbessert die Quali
tät von Projekten. Somit trägt es zur methodischen und inhaltlichen Konsolidierung bei,
schafft neue Netzwerke und ermöglicht neue Formen kollaborativer Zusammenarbeit.
Zugleich regt tambora.org die Kooperation über die enge Wissenschaftsgemeinde hinaus
an und ist im Sinne von OpenScience auch für weitere Nutzergruppen erreichbar (Heim
et al. 2018). Diese Facetten unterstreichen die immer wieder vorgetragene Komponente
kollaborativer Plattformen als soziales Konstrukt und des Wissenstransfers. Auch ermög
licht eine derartige Arbeitsweise ein fachlich breit aufgestelltes Peer-Reviewing-Verfahren.
tambora.org bietet durch die Vergabe von DOIs (Digital Object Identifier) eine zufrieden
stellende Lösung für die wichtige und zugleich sensible Frage der Urheberrechte bzw. der
Rechteverwertung und Publikation an. Textsammlungen, Quellenkompilationen, Tran
skriptionen oder sonstige Editionen können zitierfähig publiziert werden (Schönbein et al.
2016; Vogt et al. 2016).
Perspektivisch können über Algorithmen neue Einträge in kausale klimatologische Zu
sammenhänge und in den bisherigen Gesamtkontext gestellt werden, um unplausible Ein
träge zu identifizieren. Nutzer sollen auf diese Weise nicht nur eine zeitnahe Einordnung
zu ihren Einträgen erhalten und damit einen ersten motivierenden Eindruck der eigenen
Beiträge, sondern vor allem auch eine vorläufige Verifikation. Eine derartige Rückkopp
lung und Verifikation kann entsprechend kartographisch visualisiert und unterstützt wer
den (Kahle u. Glaser 2020).
Ein wichtiges Desiderat ist und bleibt die Erschließung und Einbindung neuer Daten
bestände und Nutzungsformen über die Erweiterung des Nutzerkreises, ebenso wie die
Vernetzung mit bestehenden Datenbanken. Vor allem über die Einbeziehung aktueller
Daten und Darstellungsformen wie der Bürgerwissenschaften sind neue Akzente möglich.

4.1 Einbindung tagesaktueller Textquellen

Besonders hervorzuheben ist der inhaltliche Anschluss von historischen Quellen an ta
gesaktuelle Texte und Meldungen, wie sie in Zeitungsartikeln, Berichten und Dokumen
ten enthalten sind. Für diese „aktuelle Klimahermeneutik“ gilt, dass sie die numerischen,
instrumentell generierten Daten durch die Betonung von Folgen, Wahrnehmungen und
Reaktionen, wie sie in den Texten schwerpunktmäßig enthalten sind, strukturell ergänzt.
Gerade auch die Bewertung des aktuellen Klimawandels und seiner Folgen anhand von
verschiedenen Medienformaten ist mittlerweile wissenschaftlich etabliert (Kirilenko u.
Stepchenkova 2012; Schmidt, Ivanova u. Schaefer 2013, Boussalis u. Coan 2016). Rezente,
schriftliche Aufzeichnungen stellen eine wichtige Ergänzung zu instrumentellen Messun
gen dar. Ihre Bewertung und Analyse unterliegt den gleichen Arbeitsschritten. Dies be

548

Texte als Bausteine der Umweltforschung

deutet auch, dass sie mit den aus historischen Texten extrahierten Daten direkt in Bezug
gesetzt werden können.
Der nachfolgende Artikel aus der MainPost (Amling 2018) veranschaulicht dies und
lässt aufgrund der regionalen Zuordnung Bezüge zur Hauschronik der Wiesenbronner Fa
milie Hüßner zu. Die MainPost hat 286.000 Leser, die digitale Ausgabe eine Gesamtreich
weite von 793.000.1 Das Verbreitungsgebiet liegt in Mainfranken um die Städte Würzburg
und Schweinfurt.

Abb. 3: Beispiel für die Integration rezenter Zeitungsartikel in
tambora.org aus der Main-Post.

Über geeignete Indexverfahren kann zudem der Zeitraum mit rein textbasierten Informa
tionen und den Abschnitten, die durch instrumentelle Messungen belegt sind, erweitert
werden. Zudem sind derartige, möglichst lange Überlappungen für die Kalibrierung der
Indexwerte sehr wichtig.
Insgesamt lassen sich damit durchgängige Zeitreihen ableiten, die gerade auch für heu
tige Fragestellungen wie Trendverhalten oder Wiederkehrzeiten von ausgewählten Klima
extremen wie Dürren und feuchten Perioden von Bedeutung sind (Glaser u. Kahle 2020,
Ionita et al. 2021). Die gesellschaftlichen Folgen von Dürren wurden von Erfurt et al. (2019
und 2020) dargestellt.

5 Crowdsourcing: Neue Medien und
digitale Beteiligungsformen

Gegenüber der historischen Umweltforschung stehen der aktuellen Analyse des Umweltge
schehens eine Reihe neuer Quellen zur Verfügung, die maßgeblich auf die Entwicklungen
neuer Medienformate und auf die Möglichkeiten vielfältiger digitaler Beteiligungsformate

1
https://www.mainpost.de/storage/med/mediadaten/936832_Online_Faltblatt_MainPost_
Einzelseiten.pdf (Zugriff: 15. April 2021).

549

Rüdiger Glaser, Michael Kahle, Franck Borel, Rafael Hologa, Oliver Rau und Antje Kellersohn

und des Crowdsourcings von relevanten Informationen zurückzuführen sind. Abhängig
vom Beteiligungs- und Medienformat sowie der Datenakquise werden Informationen ge
neriert, aus denen sich vielversprechende Daten für die Umweltforschung ableiten lassen.
Wettermelder auf diversen regionalen Radioprogrammen, imposante Bildsequenzen von
Sturmjägern, Twitter-Meldungen zu Klimakatastrophen, spontane Bottom-up-Initiativen,
die den Katastrophenschutz unterstützen, seien hierfür exemplarisch aufgeführt.
Somit bietet das digitale Zeitalter der Gesellschaft vielfältige Optionen, um den Ablauf,
aber auch Folgen und Maßnahmen zum aktuellen Wetter-, Witterungs- und Klimagesche
hen als Textnachricht, im Bild, oder in Ton- und Filmsequenzen festzuhalten. Neben dem
inhaltlichen Wert ermöglichen solche Informationen auch Einblicke in die gesellschaft
liche Perzeption von Umweltphänomenen.
Im Kontext von Wetter, Witterung und Klima lassen sich einerseits Quellen unterschei
den, deren Informationen sich auf ein konkretes Ereignis beziehen und bei denen Laien
aufgrund eines solchen indirekt Informationen für die Umweltforschung produzieren.
Andererseits entstehen zunehmend neue Beteiligungsformen in der Umweltforschung
durch bürgerwissenschaftliche Projekte. Dann erfolgt die Dokumentation von Umwelt
phänomenen vor dem Hintergrund einer spezifischen Agenda, beispielsweise bei phäno
logischen Beobachtungen.
Bei Informationsquellen, die vor dem Hintergrund eines konkreten Ereignisses entstan
den sind, handelt es sich meist um extreme Wetterereignisse, die Individuen dazu animie
ren, ihre Beobachtungen mittels sozialer Medien mit der allgemeinen Öffentlichkeit zu
teilen. Vor allem bei Unwettern und Klimakatastrophen steigt die Zahl von einschlägigen
Einträgen bzw. Meldungen rapide an. Solche Formen der „Umweltberichterstattung“ sind
in der Regel losgelöst von einer organisierten Beteiligung. Die auf diese Weise generierten
Informationen bzw. der mit Mitteln des Web 2.0 geteilte sog. user-generated content sind
hinsichtlich ihrer inhaltlichen Struktur sehr heterogen und unterscheiden sich abhängig
vom Medienformat. Aufgrund der großen Anzahl von Meldungen bei einem Wetterex
tremereignis ergeben sich vielfältige Möglichkeiten des Crowdsourcings, der statistischen
Auswertung. Insbesondere durch Verfahren des Textminings lassen sich beispielsweise
aus Twitter-Meldungen umfassende Einsichten über die gesellschaftliche Wahrnehmung
von Wetterphänomen und deren Kontextualisierungen ableiten.
Demgegenüber etablieren sich bei Informationen, die aus dem Kontext von bürger
wissenschaftlichen Aktivitäten stammen, oftmals feste, quasi institutionalisierte Beobach
tungs- und Meldestrukturen, die zum Teil auch von öffentlichen Trägern unterstützt wer
den. Im deutschsprachigen Raum haben sich insbesondere Projekte langfristig etablieren
können, die auf indirekte Umweltachtungen abzielen. Exemplarisch seien die Initiativen
„CrowdWater“, „Wettermelden.at“, das „Pollentagebuch“, „SenseBox“ und „Die Apfelblü
tenaktion“ genannt. Bei allen Projekten geht es darum, dass Laien ihre Beobachtungen
möglichst strukturiert melden. Die auf diese Weise überregional zusammengeführten
Daten können oft eine gute Grundlage bilden, um weitere Einblicke in die raum-zeitliche

550

Texte als Bausteine der Umweltforschung

Dynamik der beobachteten Phänomene zu ermöglichen. Zugleich stellen sie einen wichti
gen Beitrag zur Dokumentation des Klimawandels im regionalen Kontext dar.
Ebenso tragen bürgerwissenschaftliche Aktivitäten vielversprechend zur Erschließung und
Auswertung historischer Datenbestände bei. Besonders weit gediehen sind die Transkriptio
nen von klimarelevanten Informationen aus unzähligen Schiffstagebüchern, etwa im Projekt
oldweather.org. Diese stehen im Zusammenhang mit dem International Comprehensive Oce
an-Atmosphere Data Set (ICOADS) (Freeman et al. 2016). Hierbei werden die handschrift
lichen und daher nur schwer automatisch auswertbaren Aufzeichnungen von Schiffstagebü
chern von Bürgerwissenschaftlern transkribiert und damit einer weiterführenden Auswertung
zugänglich gemacht. Von den Wetterdetektiven (www.weatherdetective.net.au) konnten, un
terstützt von den öffentlichen Medien, bis Oktober 2015 mehr als 400.000 Einträge von 11.000
Bürgerwissenschaftlern transkribiert werden.
Auch im Rahmen von Forschungsarbeiten zur Historischen Klimatologie auf t ambora.org
wurden die Möglichkeiten bürgerwissenschaftlicher Öffnungen anhand von Transkriptio
nen der Freiburger Zeitung und des Nordischen Mercurius getestet. Potenziale bestehen
u. a. in Historischen Vereinen, denkbar ist die Adressierung von einschlägigen universi
tären Seminaren oder Transkriptionen im Rahmen von Schulprojekten. Somit kann eine
größere Erschließung erzielt werden, bei der die Beteiligten auch zur Kreuzvalidierung
eingebunden werden können. Denn die breite Nutzung von Laien erfordert solche For
men der Rückkopplung und Qualitätssicherung, um den wissenschaftlichen Standard und
die Authentizität zu garantieren.
Neben institutionalisierter Bürgerwissenschaft sind auch weitere Praktiken zu beob
achten, bei denen Laien aus der Bevölkerung aktuelle Wetter-, Witterungs- und Klima
ereignisse dokumentieren und somit potentielles Quellenmaterial für die Umweltfor
schung liefern. So binden verschiedene regionale Sendeprogramme oder Wetterdienste
Laien als Wettermelder ein. Sie verbreiten individuelle instrumentelle Messdaten von
Freiwilligen als aktuelle Wetternews und stärken damit sowohl ihr regionales Profil als
auch die Aktualität ihrer Berichterstattung. Einige Themen sind nicht nur aufgrund ihres
Inhaltes spektakulär, sondern auch beeindruckend umgesetzt, etwa die zeitnahe Meldung
und Bilddokumente von Sturmjägern (storm-chasers.de). Besonders viele und kreative
Beteiligungsformen treten jeweils im Kontext von Klimakatastrophen auf. So finden sich
beispielsweise in einem regionalen Mitmachlexikon zum Katastrophenhochwasser von
2013 in Halle an der Saale zum Teil minutiös aufgelöste Text- und Bilddokumentatio
nen. Auch Bürgerreporter, die umfassende Vor-Ort-Analysen liefern, oder Inhalte auf
spontan eingerichteten Hilfsportalen und entsprechenden Blogs, in denen Hilfesuchende
während eines solchen Extremereignisses Aufrufe schalten können, repräsentieren das
breite Spektrum solcher Informationsquellen. Zur Einschätzung der räumlichen Dimen
sion eines Ereignisses sind gerade auch neue Formen des kollaborativen Webmappings
und der kartographischen Dokumentation von Schäden und Auswirkungen besonders
aufschlussreich.

551

Rüdiger Glaser, Michael Kahle, Franck Borel, Rafael Hologa, Oliver Rau und Antje Kellersohn

Alle genannten Informationsquellen stellen neben den klassischen Textquellen ein eige
nes neues Genre aktueller hermeneutischer Vermittlung von Wetter, Witterung und Klima
dar. Aus deren Nutzung ergeben sich weitreichende Möglichkeiten einer inhaltlichen und
methodischen Brücke zwischen historischen und rezenten Daten. Um die Qualität der
Aussagen zu validieren, sind Verfahren zur Parallelisierung und zur komparativen Zu
sammenschau aktueller hermeneutischer Informationen einerseits und zeitgleich erhobe
ner Messdaten andererseits besonders aufschlussreich. Darüber hinaus könnten mit der
Nutzung aktueller hermeneutischer Einträge auch Schlüsse auf historische Informationen
gezogen werden. Im günstigsten Fall könnten damit durchgängige gleichartige Datenty
pen generiert und neue Möglichkeiten der Kalibrierung von Kodierschemata, Indizierung
und Kalibrierung getestet werden.

6 Maschinelles Lernen: Automatisierung
der Textanalyse

Als weiterer Schritt zur Bewältigung und Nutzung der enorm gestiegenen Datenmengen
werden zunehmend Verfahren der Automatisierung und deren Analyse mittels Statistik
und künstlicher Intelligenz angewandt. In diesem Kontext beschäftigen sich die „Digital
Humanities“ mit der Erforschung textbasierter geisteswissenschaftlicher Fragestellungen
mit digitalen Methoden. Eine methodologische Grundlage dieser Ansätze ist die her
meneutische Interpretation (Rabus 2019). Texte, die vor einigen Jahren noch selbst für
Menschen schwer lesbar waren, sind heute mittels automatischer Texterkennung (Optical
Character Recognition – OCR) in Sekundenbruchteilen erschlossen. In vielen Ansätzen
wird über die qualitative Analyse hinaus mittels Wortzerlegung (Tokenizing) eine Quanti
fizierung angestrebt. Um über Wortgrenzen hinweg zu kommen und die grammatikali
schen Zusammenhänge zu erkennen, kommen zunehmend Methoden aus dem Bereich
der Künstlichen Intelligenz und des Maschinellen Lernens zur Anwendung. Gängige Ver
fahren sind u. a. Text Mining (Matuschek 2014), Natural Language Processing (NLP), Re
inforcement Learning und Klassifizierung. Ihre Anwendung auf Zeitungsarchive und -in
formationen im Kontext klimatischer Fragestellungen zeigen u. a. Yzaguirre, Smit u.
Warren (2016) mit der beeindruckenden Analyse von über zwei Millionen Artikeln sowie
Kang u. Park (2018) anhand von koreanischen Zeitungen.

6.1 Automatisierung des quellenkritischen Ablaufschemas

Automatisierte Konzepte sind als Unterstützung bei der Erschließung und der Extrak
tion klimarelevanter Informationen aus schriftlichen Quellen gedacht. Nachfolgend ist

552

Texte als Bausteine der Umweltforschung

dargestellt, wie eine Automatisierung des quellenkritischen Ablaufs mit Hilfe von Al
gorithmen, wie z. B. maschinellem Lernen, in der Historischen Klimatologie umgesetzt
werden kann.
Zunächst stellt sich die Frage, welche Arbeitsschritte des quellenkritischen Ablaufs
grundsätzlich automatisiert werden können. Kann man beispielsweise mit Hilfe neuro
naler Netze Zeit, Ort oder das semantische Profil aus schriftlichen Quellen automatisch
ermitteln? Wo können allenfalls nur Verbesserungen in der Verarbeitung erwartet wer
den, wo können sie den Bearbeiter gar ersetzen? Um diese Fragen zu beantworten, werden
der quellenkritische Arbeitsablauf und seine Bestandteile im Detail betrachtet, um sie zu
systematisieren und zu formalisieren. Bei dieser Aufgabe sind folgende Gedanken von
zentraler Bedeutung:
Jede schriftliche Quelle wird mit einer spezifischen und unveränderlichen Fragestellung
konfrontiert: Welche Klimainformation ist in der vorliegenden Quelle enthalten? Diese
simple Feststellung markiert den Unterschied zu den historischen Wissenschaften, die
eine Quelle immer wieder neuen Fragestellungen unterwerfen.
1. Jeder quellenkritische Arbeitsablauf kann als geordnete Menge von Arbeits
schritten beschrieben werden.
2. Jeder Arbeitsschritt ist ein Vorgang in der Zeit, welcher ein Objekt erzeugt oder
ein gegebenes Objekt verändert.

Ein Modell, welches diese Überlegungen berücksichtigt, definiert einen Arbeitsschritt wie
in Abb. 4 dargestellt ist.

Abb. 4: Ein vollständiger Arbeitsschritt besteht aus einem Anfangszustand s, einer
Transition t und einem Endzustand f. Die Erzeugung oder Zustandsänderung des
Objektes geschieht von s über t nach f. Im Speicher befinden sich die Endzustände.
Diese können festgesetzt sein oder aber auch wachsen.

553

Rüdiger Glaser, Michael Kahle, Franck Borel, Rafael Hologa, Oliver Rau und Antje Kellersohn

Ein Arbeitsschritt ist eine Relation R zwischen der Menge der Anfangszustände S und den
Endzuständen F. Das entspricht der Abbildung von S auf F:

Rt:S → F

Automatisieren lassen sich jene Arbeitsschritte, bei denen der Definitionsbereich der An
fangszustände S mit einer Funktion f(S) auf die Zielmenge F abgebildet werden kann:

F = f(S)

Die Automatisierung bezeichnet somit den Vorgang, einen Anfangszustand mit einem
Endzustand paarweise in Relation zu stellen. Hierzu legen wir mögliche oder gegebene
Endzustände in einem Speicher ab. Solcherart sind wir auch für das Trainieren von Neuro
nalen Netzen gerüstet, wenn automatische Klassifikationen vorgenommen werden. Da der
Speicher die Menge der möglichen Endzustände darstellt, bildet er, fast schon nebenläufig,
die Grundlage einer Wissensbasis für die Historische Klimatologe: Mit jeder Aufnahme
eines neuen Urhebers oder Autors einer Quelle in den Speicher wächst die Kenntnis darü
ber, welcher Autor klimarelevante Beobachtungen gemacht hat. Dies ermöglicht dann z. B.
die gezielte Suche nach weiteren Quellen desselben Autors.
Es gibt Speicher mit endlichen Elementen, wie beispielsweise beim Arbeitsschritt zur
Bestimmung der Lesbarkeit der klimarelevanten Informationen einer Quelle. In diesem
Fall finden wir im Speicher die Elemente lesbar, zum Teil lesbar und nicht lesbar. Ande
re Speichertypen sind wachsende Speicher, deren Anzahl der Endzustände stetig wächst.
Dies ist z. B. der Fall bei der Verortung von Klimaereignissen.
Letzteres führt zur Frage, ob Arbeitsschritte mit wachsendem Speicher irgendwann ge
sättigt sind, bzw. ob die Grundmenge der Speicher, wie z. B. die Menge der schriftlichen
Quellen, endlich ist. Kenntnisse über die Grundmenge sind von entscheidender Bedeu
tung, wenn wir wissen wollen, wie zuverlässig ein Algorithmus mit unbekannten Quellen
umzugehen im Stande ist.
Da ein Arbeitsablauf nichts anderes als eine Abfolge von Arbeitsschritten ist, kann ein Arbeits
ablauf als lineare Ordnung, z. B. in Form eines Hasse-Diagramms, dargestellt werden (Abb. 5).
Bei näherer Analyse des Arbeitsablaufes werden Erkenntnisse über das Zusammenwir
ken der Arbeitsschritte, der Gestalt oder Typisierung von Arbeitsabläufen und die Mög
lichkeit, Arbeitsschritte zu parallelisieren, gewonnen.
Aus einem Arbeitsablauf lassen sich Ablaufpläne erstellen. Sie bestimmen, in welcher Rei
henfolge die einzelnen Arbeitsschritte erfolgen. Bei einem Ablaufplan handelt es sich um eine
lineare Erweiterung, welche auf den Arbeitsablauf angewandt wird. Die Anzahl der mögli
chen Ablaufpläne lässt sich auch berechnen (Abb. 6). Die fast schon absurd anmutende Anzahl
möglicher Ablaufpläne ist ein Zeichen für die Komplexität des quellenkritischen Ablaufes und
weist auf die Problematik der Nachvollziehbarkeit von Ergebnissen aus dem quellenkritischen

554

Texte als Bausteine der Umweltforschung

Ablauf hin: Ohne Kenntnisse des Ablaufplans lassen sich Ergebnisse kaum rekonstruieren. Es
stellt sich die Frage, ob unterschiedliche Ablaufpläne zum selben Ergebnis führen. Hier wird
die Bedeutung von virtuellen Forschungsumgebungen besonders deutlich: Arbeitsabläufe und
Arbeitsschritte sind formalisiert. Einzelne Arbeitsschritte können nachvollzogen werden und
sorgen für zuverlässige Ergebnisse und damit auch für verlässliche Daten. Diese sind wiederum
Voraussetzung für die Automatisierung und die Anwendung des Maschinellen Lernens.

Abb. 5: Beispiel für einen vollständigen Arbeitsablauf zur Erschließung schriftlicher Quellen
                  in der Historischen Klimaforschung als Hasse-Diagramm.

                                            555

Rüdiger Glaser, Michael Kahle, Franck Borel, Rafael Hologa, Oliver Rau und Antje Kellersohn

Abb. 6: Anzahl möglicher Ablaufpläne eines Arbeitsablaufes gruppiert
nach der Anzahl der Arbeitsschritte.

6.2 Textanalyse mittels Statistik und Künstlicher Intelligenz

Nachfolgend werden ein historisches und ein modernes klimarelevantes Textzitat zu Main
franken mittels Statistik und künstlicher Intelligenz verarbeitet und analysiert. Dazu wurde
der Textkorpus aus tambora.org in Wörter zerlegt und mit den Indizes der Temperatur und
des Niederschlags der entsprechenden Monate verschnitten. Über bayessche Verfahren kön
nen so einzelnen Wörtern Wahrscheinlichkeiten für ihr Auftreten in bestimmten Klassen
zugeordnet werden. Aus diesen lassen sich Wortwolken in unterschiedlichen Größen und
Farben darstellen. Verwendet wurden die mitteleuropäischen Angaben aus tambora.org seit
1500. Dabei kristallisieren sich Schlüsselwörter heraus, welche die Wahrscheinlichkeit für
eine Klasse entweder besonders erhöhen oder auch herabsenken (Abb. 7).
Umgekehrt lassen sich die ermittelten Wortlisten verwenden, um ein Zitat einer Klas
se zuzuordnen. Dies soll anhand zweier Beispiele aus historischer und rezenter Zeit ver
deutlicht werden. Der erste Satz stammt aus dem Jahr 1756 der Hauschronik der Wie
senbronner Familie Hüßner (Glaser, Schenk u. Schröder 1991): „In meyen aber, als der
weinstock auß der wollen hervorging, ist ein frost eingefallen und sind die augen sehr
erfroren, jedoch gewann er wieder einen guten fortgang, und trieben wieder frische au
gen und ein gutes ansehen.“ Das zweite, moderne Textbeispiel aus dem MainPostArtikel
von 2018 lautet (Amling 2018): „Für den heutigen Nachmittag waren eigentlich Gewitter
gemeldet, doch die Sonne strahlt wie so oft in den letzten Wochen fast ungetrübt vom
Himmel.“

556

Texte als Bausteine der Umweltforschung

Abb. 7: Wortwolken für aus dem tambora-Korpus generierte Schlüsselwörter in den sieben
 Indexklassen für die Temperatur (links) von ‚sehr heiss‘ Indexwert +3, rot) bis ‚sehr kalt‘
  (Indexwert -3, blau) und Niederschlag (rechts) von ,sehr feucht‘ (Indexwert +3, grün)
        bis ‚sehr trocken‘ (Indexwert -3, braun). Wörter, die eher unwahrscheinlich
                        in der Klasse auftreten, sind grau dargestellt.

Das Tokenizing für die markantesten Begriffe der beiden Textzitate ergibt folgendes Bild:
Für das Zitat von 1756 und die Zuweisung zu den thermischen Indexklassen sind bei
spielsweise die Begriffe ‚Frost‘ und ‚erfrieren‘ besonders prägend. Interessant ist auch der
Begriff ‚eingefallen‘, da er auf ein extremes Ereignis hinweist, mit gleicher Wahrschein
lichkeit für sehr heiße und sehr kalte Temperaturen. Für das Zitat von 2018 dominiert
hingegen der Begriff ‚Sonne‘ die thermische Prägung (Abb. 8). Bei der jahreszeitlichen
Zuweisung in Abb. 9 ist der Begriff ‚Gewitter‘ ein eindeutiges SommerPhänomen. Der
Begriff ‚Meyen‘ wird dem Frühling zugewiesen. Problematisch ist der Begriff ‚hervor+geh‘
für hervorgehen, da dieser dem Herbst und erst in zweiter Präferenz dem Frühling zu
gewiesen wird.

                                            557

Rüdiger Glaser, Michael Kahle, Franck Borel, Rafael Hologa, Oliver Rau und Antje Kellersohn

Abb. 8: Tokenizing für die beiden Quellenzitate der Hüßner-Hauschronik von 1756 und
des Main-Post-Artikels von 2018 bezüglich der Temperatur-Indexklassen. Dargestellt
sind die Schlüsselbegriffe und die Wahrscheinlichkeit des Auftretens.

Abb. 9: Tokenizing für die beiden Quellenzitate der Hüßner-Hauschronik von 1756
und des Main-Post-Artikels von 2018 bezüglich der assoziierten Jahreszeiten.

In der automatischen Zuordnung zu den Jahreszeiten und Temperaturklassen (siehe
Abb. 10 und Abb. 11) wurden die Einzelwahrscheinlichkeiten aller Wörter multipli
ziert. Die Zuweisung ergibt aufgrund der besonderen Disposition von Wein wie dar
gestellt zu Frühjahr und Herbst eine präferierte Zuweisung in den Herbst, vor dem
Frühjahr, obwohl ein Großteil des Zitates sich auf den Frühling bezieht und explizit
der Mai erwähnt wird. Der Begriff ‚hervorgehen‘ ist für diese Gewichtung verantwort
lich. Eine monatsweise Klassifizierung erweist sich in einem solchen Fall als präzi
ser. Der Begriff ‚Frost‘ und ‚erfroren‘ schlägt sich in der Klassenzuweisung 2 wieder
(Abb. 10).
Für den Satz „Für den heutigen Nachmittag waren eigentlich Gewitter gemeldet, doch
die Sonne strahlt wie so oft in den letzten Wochen fast ungetrübt vom Himmel“ aus
dem MainPostArtikel von 2018 ergibt sich eine eindeutige saisonale Zuweisung in den
Sommer und auch in die entsprechende Temperaturklasse (Abb. 11).

558

Texte als Bausteine der Umweltforschung

Abb. 10: Automatisch erzeugte Zuordnung der Jahreszeiten und der Temperaturklassen des
                            Hüßner-Zitates zum Jahr 1756.

           Abb. 11: Automatisch erzeugte Zuordnung der Jahreszeiten und der
                  Temperaturklassen des Main-Post-Zitates von 2018.

                                         559

Rüdiger Glaser, Michael Kahle, Franck Borel, Rafael Hologa, Oliver Rau und Antje Kellersohn

Auch andere Dimensionen eignen sich für eine derartige Klassifikation, beispielswei
se Niederschlagsindizes, Windstärken, Hochwasserintensitäten oder Zeitepochen wie
Jahrhunderte. Die Auswertung weiterer Textstellen aus dem betreffenden Gebiet und
Zeitraum erhöht die Genauigkeit und wird einfach durch Zusammenfügen der Zitate
bewerkstelligt. Auch durch weiteres Training von Begriffen und entsprechenden Zu
weisungen wird die automatische Klassifizierung verbessert. Dies kann beispielsweise
durch Harvesting von rezenten Zeitungsartikeln in Kombination mit amtlichen Messda
ten erfolgen. Fehlzuweisungen in historischen Dokumenten können fortlaufend manu
ell korrigiert werden, wobei dazu auch Verfahren des Crowdsourcings denkbar wären.
Der hier skizzierte einfache Ansatz über einzelne kontextlose Wörter kann weiter ver
feinert werden, indem Wortpaare oder ganze Phrasen verwendet werden. Durch solche
verbesserten Verfahren können die Syntax und vor allem auch die sprachlichen Be
sonderheiten der historischen Texte berücksichtigt werden. Durch ausgefeiltere Wort-
Vektorisierung und die Verwendung von rekursiven, neuronalen Netzen kann auch der
Informationsgehalt von grammatikalischen und semantischen Strukturen erschlossen
werden.
Alles in allem ist der Weg zukunftsweisend, weil damit große Datenmengen, wie sie
durch die Digitalisierung anfallen bzw. angeboten werden, bewältigt werden können.

7 Fazit
Durch die neuen Möglichkeiten der Informationstechnologien und durch die Verbrei
tung des Internets ergeben sich vielfache neue Perspektiven der Datenakquise und der
weiterreichenden Erschließung neuer Bestände sowie der Nutzung von bereits vorlie
genden Digitalisaten im Bereich der historischen wie auch rezenten Umwelt- und Klima
forschung.
Leistungsfähige Datensammlungen und Datenbanken bieten schon heute vielfältige
neue Möglichkeiten der Datenkombination und Interpretation.
Virtuelle Forschungsumgebungen ermöglichen darüber hinaus arbeitsteilige und de
zentrale Arbeitsweisen, was sich für überregionale Projekte und Arbeitsgruppen geradezu
aufdrängt. In ihnen kann die komplexe Arbeits- und Verwertungskette, die für die histo
rische Umweltforschung besteht, abgebildet werden. Die Einbindung in öffentliche Ein
richtungen wie Bibliotheken ist ein wichtiger Garant für die nachhaltige Sicherung, den
Regelbetrieb und die rechtliche Handhabung.
Die Einbeziehung von Bürgerwissenschaften und sozialen Netzwerken bietet wei
terreichende Möglichkeiten, etwa für die Erschließung und Aufbereitung historischer
Bestände. Einige Aktivitäten wie die von Sturmjägern, Wettermeldern ergänzen das
bisherige Portfolio. Von besonderem Interesse ist aber auch, inwieweit die neuen Me
dien neue Formen der Darstellung und neue Formen der Nutzbarmachung hervor

560

Texte als Bausteine der Umweltforschung

bringen. Oft sind diese räumlich dichter und zeitlich höher aufgelöst als andere In
formationen. Andererseits sind in sozialen Netzwerken auch viele Fakenews abrufbar
und Klimaleugner aktiv. Wie auch bei historischen Angaben ist eine kritische Sicht
unabdingbar.
Von besonderem Interesse ist aber die Erschließung tagesaktueller Klima- und Um
weltinformation, wie sie vielfach im Netz angeboten wird. Die Nutzung dieser aktuellen
hermeneutischen Klima- und Umweltangaben bietet die Möglichkeit, an die historischen
Informationen anzuschließen und kalibrierte lange Zeitreihen abzuleiten. Vor allem die
Umsetzung der Indexverfahren über Wort-Statistiken sind geeignet, die Schnittstelle zwi
schen textbasierten Informationen und instrumentellen Phasen zu überbrücken. Des Wei
teren können durch zeitgleich erhobene Messdaten Kalibrierungen und Abschätzungen
zur Qualität der aus Textangaben extrahierten Daten und Zeitreihen gemacht werden.
Das Ablaufschema, einschließlich der notwendigen quellenkritischen Bewertung, ist weit
gehend automatisierbar.
Textbasierte Quellen erlauben gegenüber instrumentellen Daten eine Bewertung von
Wahrnehmungen, Folgen, Reaktionen und gesellschaftlichen Kontexten, die durch instru
mentelle Messdaten nicht abbildbar sind. So gesehen ist die vielfach geäußerte Bewertung
der Objektivität von instrumentellen Daten gegenüber den a priori subjektiven Einschät
zungen der Betroffenen und Beteiligten zu relativieren bzw. durch geeignete Verfahren zu
evaluieren.
Die Digitalisierung hat auf die historische wie auch moderne Klima- und Um
weltforschung einen ähnlichen Einfluss wie die Erfindung des Buchdrucks durch
Gutenberg. Die Nutzung von Maschinellem Lernen und Künstlicher Intelligenz er
öffnet neue Möglichkeiten, was die Menge der bearbeiteten Daten anbelangt, und in
diesem Kontext auch neue Perspektiven der inhaltlichen Bewertung und methodi
schen Umsetzung.

Zusammenfassung

In dem Beitrag werden die weitreichenden methodischen Änderungen der textbasierten
historischen und aktuellen Umweltforschung thematisiert, wie sie sich seit den 1990er Jah
ren durch die Digitalisierung ergeben haben. In der Darstellung wird kurz die klassische,
analoge Analyse von Textquellen mit ihrer aufwendigen Archivarbeit, der Transkription
und quellenkritischen Interpretation skizziert. Darauf aufbauend wird die neuere Ent
wicklung, wie sie sich im Kontext der Digitalisierung ergibt, vorgestellt. Diese umfasst
die Einbindung in Datenbanken und die dafür notwendige Kodierung bis zur Integration
in virtuelle Forschungsumgebungen am Beispiel von tambora.org. Des Weiteren wird auf
die Besonderheiten der Verstetigung und nachhaltigen Sicherung sowie der Publikations
möglichkeiten eingegangen.

561

Rüdiger Glaser, Michael Kahle, Franck Borel, Rafael Hologa, Oliver Rau und Antje Kellersohn

Schließlich werden die Potenziale neuer Auswertungsformate von Künstlicher Intel
ligenz und anderen Analyseverfahren sowie die Möglichkeiten von Crowdsourcing und
automatischen Verfahren wie Data Harvesting thematisiert.

Summary: Texts as basic elements of environmental research –
from classical analysis to databases and collaborative research
environments towards machine learning and crowdsourcing

This paper addresses the far-reaching methodological changes in text-based historical and
contemporary environmental research that have occurred since the 1990s as a result of
digitisation. The paper briefly outlines the classical analogue analysis of text sources with
its laborious archival work, transcription, and source-critical interpretation.
Based on this, the more recent development, as it arises in the context of digitisation, is
presented. This includes the integration into databases and the coding necessary for this
up to the integration into collaborative research environments (CRE) using the example of
tambora.org. In addition, the particularities of the continuation and sustainable preserva
tion as well as the publication possibilities will be discussed.
Finally, the potentials of new evaluation formats of artificial intelligence and other ana
lysis methods as well as the possibilities of crowdsourcing and automatic methods such as
data harvesting will be addressed.

Literatur

Amling, K. (2018): Bratwurst und Flamingos in Marktsteft, Main Post, https://web.archive.org/
web/20210408120805/https://www.mainpost.de/regional/kitzingen/bratwurst-und-flamingos-in-
marktsteft-art-10039397 (Zugriff: 31. Mai 2021).
Börngen, M. u. Tetzlaff, G. (2000): Quellentexte zur Witterungsgeschichte Europas von der Zeiten
wende bis zum Jahr 1850, Bd. 5. – Berlin u. Stuttgart.
Borel, F. (2010): HISKLIDCore, Expressum Nr. 6; UB Freiburg,
https://ojs.ub.uni-freiburg.de/exp/article/view/389/338 (Zugriff: 31. Mai 2021).
Bruijn, J. A. de; de Moel, H. u. Jongman, B. (2019): A global database of historic and real-time flood
events based on social media. – In: Sci Data 6, S. 311, https://doi.org/10.1038/s41597-019-0326-9.
Dzudzek, I.; Glasze, G. u. Mattissek, A. (2020): Diskursanalyse als Methode der Humangeographie. –
In: Lehrbuch Geographie. – Berlin.
Erfurt, M.; Glaser, R. u. Blauhut, V. (2019): Changing impacts and societal responses to drought
in southwestern Germany since 1800. – In: Regional Environmental Che, S. 1–13,
https://doi.org/10.1007/s10113-019-01522-7.

562

Texte als Bausteine der Umweltforschung

Erfurt, M.; Skiadaresis, G.; Tijdeman, E.; Blauhut, V.; Bauhus, J; Glaser, R.; Schwarz, J.; Tegel, W.
  u. Stahl, K. (2020): A multidisciplinary drought catalogue for southwestern Germany dating
  back to 1801. – In: Nat. Hazards Earth Syst. Sci., 20 (11), S. 2979–2995, https://doi.org/10.5194/
  nhess-20-2979-2020.
García‐Herrera, R.; Können, G. P.; Wheeler, D. A.; Prieto, M. R.; Jones, P. D. u. Koek, F. B. (2005):
  CLIWOC: a climatological database for the World’s oceans 1750–1854. – In: Climatic Change 73,
  S. 1–12.
Glaser, R.; Schenk, W. u. Schröder, A. (1991): Die Hauschronik der Wiesenbronner Familie Hüß
  ner. Ihre Aufzeichnungen zu Wirtschaft, Geschichte, Klima und Geographie Mainfrankens von
  1750–1894. – In: Materialien zur Erforschung früherer Umwelten (MEFU) 1, S. 1–57.
Glaser, R. (1996): Data and Methods of Climatological Evaluation in Historical Climatology. – In:
  HSR (Historical Social Research) Vol. 21, 4, S. 56–88.
Glaser, R. (2013): Klimageschichte Mitteleuropas. 1200 Jahre Wetter, Klima, Katastrophen: [mit Pro
  gnosen für das 21. Jahrhundert]. Sonderausgabe, 3., unveränd. Aufl. – Darmstadt.
Glaser, R. u. Riemann, D. (2009): A thousand-year record of temperature variations for Germany
  and Central Europe based on documentary data. – In: Journal of Quaternary Science, 24 (5),
  S. 437–449.
Glaser, R.; Himmelsbach, I. u. Bösmeier, A. (2017): Climate of migration? How climate triggered mi
  gration from southwest Germany to North America during the 19th century. – In: Climate of the
  Past, 13, S. 1573–1592, https://doi.org/10.5194/cp-13-1573-2017.
Glaser, R.; Riemann, D.; Vogt, S. u. Himmelsbach, I. (2018): Long- and Short-Term Central European
  Climate Development in the Context of Vulnerability, Food Security, and Emigration. – In: Leg-
  gewie, C. u. Mauelshagen, F. [Hrsg.]: Climate Change and Cultural Transition in Europe. – Berlin
  (Climate und Culture 4), S. 85–118.
Glaser, R.; Hologa, R.; Bösmeier, A.; Heim, B.; Kahle, M.; Scholze, N. u. Schliermann-Krauss, E. (2020):
  Klimageschichte der Frühneuzeit als Topos der universitären Forschung und Lehre. Die Kleine
  Eiszeit (1430–1830) in Unterricht und Lehre, 120, S. 105–125.
Glaser, R. u. Kahle, M. (2020): Reconstructions of droughts in Germany sin
  ce 1500 – combining hermeneutic information and instrumental records in historical
  and modern perspectives. – In: Clim. Past (Climate of the Past), 16, S. 1207–1222:
  https://cp.copernicus.org/articles/16/1207/2020/cp-16-1207-2020-discussion.html, (Zugriff: 31. Mai
  2021).
Glaser, R.; Kahle, M.; Kellersohn, A. u. Rau, O. (2020): Dem Klimawandel auf der Spur. Der Weg
  schriftlicher Quellen aus den Archiven in die virtuelle Forschungsumgebung. – In: Archivnach
  richten, 60, S. 8–14.
Heim, B.; Glaser, R.; Kahle, M. u. Hologa, R. (2018): Westmittelfranken (1016–1840).
  DOI: 10.6094/tambora.org/2018/c331/csv.zip.
Ionita, M.; Dima, M. u. Nagavciuc, V. (2021): Past megadroughts in central Europe were longer, more
  severe and less warm than modern droughts. – In: Commun Earth Environ 2, 61,
  https://doi.org/10.1038/s43247-021-00130-w.
Kahle, M.; Glaser, R. u. Hologa, R. (2020): Virtuelle Forschungsumgebungen – neue Formen kol
  laborativer Zusammenarbeit. – In: Geographie. Physische Geographie und Humangeographie,
  S. 205–212.
Kahle, M. u. Glaser, R. (2020): Fossgis2020: Javascript-Bibliotheken zur Einbindung von historischen
  Umwelt-und Klimainformationen als Kartenlayer, DOI: 10.13140/RG.2.2.34723.40481 u. DOI:
  10.5446/46488.

                                                  563

Sie können auch lesen