Texte als Bausteine der Umweltforschung

Die Seite wird erstellt Kasimir Sauer
 
WEITER LESEN
Texte als Bausteine der Umweltforschung
Siedlungsforschung. Archäologie – Geschichte – Geographie 39, 2022, S. 541–565

                   Texte als Bausteine der
                     Umweltforschung
        Von der analogen Analyse über Datenbanken
         und virtuelle Forschungsumgebungen zum
         Crowdsourcing und Maschinellen Lernen
Rüdiger Glaser, Michael Kahle, Franck Borel, Rafael Hologa, Oliver Rau und
Antje Kellersohn

     1 Texte und Textinterpretation als Bausteine der
              Klima- und Umweltforschung

Texte sind wesentliche Bausteine wissenschaftlicher Erkenntnisse und Kommunikation.
Ihre Erschließung erfordert spezifische Praktiken und Zugänge (Reuber 2020, Pfaffenbach
2020, Dzudzek, Glasze u. Matissek 2020). Die in der historischen Umweltforschung ver­
wendeten Quellen stellen eine Sonderform dar, da nicht immer alle für die moderne Text­
analyse notwendigen Informationen greifbar sind. So fehlen in historischen Kontexten
bisweilen Hinweise auf die Verfasser. Häufig sind auch der Kontext der Abfassung oder
die Intention nicht überliefert. Zwischen der Abfassung und dem öffentlichen Zugang
liegt bisweilen ein zeitlicher Versatz. Zudem müssen Datierungsfragen geklärt werden, da
Kalenderreformen durchgeführt wurden und die historisch übliche Zuweisung auf den
nächsten Heiligentag zu entsprechenden Zeitsprüngen führten. Handschriftliche Über­
lieferungen stellen besondere Herausforderungen an die Transkription, ebenso der Bedeu­
tungswandel von Begriffen und die unterschiedlichen Schreibweisen. Ähnlich anspruchs­
voll ist oft auch die örtliche Zuordnung. Für die Erschießung und Auswertung historischer
Quellen wurden daher eigene Standards entwickelt.

                                          541
Texte als Bausteine der Umweltforschung
Rüdiger Glaser, Michael Kahle, Franck Borel, Rafael Hologa, Oliver Rau und Antje Kellersohn

                2 Analoge Analyse der Auswertung
                    historischer Textquellen

Grundsätzlich folgt die Analyse von Textquellen in der Historischen Klimatologie den
Grundprinzipien der Hermeneutik. Ein besonderes Augenmerk ruht dabei auf der Quel­
lenkritik. Ziel ist das Verständnis von Texten in ihrem historischen Entstehungskontext.
Von wem wurde die Quelle und mit welcher Intention wurde der Text erstellt? Zentrale
Frage dabei ist, welcher Deutungskontext sich aus dem Zeitgeist ergibt. Mit welcher In­
tention wurde die Quelle geschaffen, welche Umwelt- und vor allem Klimawahrnehmung
herrschte zur Zeit der Abfassung und welche zeitspezifischen Erkenntnisformen standen
überhaupt zur Verfügung (Glaser 2013). Ziel der Hermeneutik ist es nach Mayring (2015),
eine „Kunstlehre“ des Auslegens bzw. Interpretierens von Texten und der Realität zu ent­
wickeln. Im hermeneutischen Zirkel werden verschiedene Zugänge und Interpretations­
perspektiven eingenommen, indem der gleiche Text immer wieder aus dem jeweils aktuell
herrschenden Kontext mit dem entsprechenden Vorverständnis neu interpretiert wird.
Die Diskrepanz zwischen der Abfassung und dem jeweiligen Erkenntnishorizont nennt
man hermeneutische Differenz. Der Übergang zur darauffolgenden Interpretation ist flie­
ßend (Winiwarter u. Knoll 2007).
  In vielen Ansätzen wird über die qualitative Analyse hinaus mittels einer systematischen
Textanalyse eine Quantifizierung angestrebt (Mayring 2015). Unter der systematischen Text­
analyse wird die Analyse der Semiotik als Lehre des allgemeinen Bedeutungsaustausches
kommunizierender Individuen verstanden, ebenso die der Syntaktik, der Semantik und der
Pragmatik als Relation zwischen Zeichen und den diese benutzenden Individuen sowie die
Sigmatik der Quellen. Insgesamt soll über die verschiedenen Schritte der Explizierenden
und der zusammenschauenden Kontextanalyse eine Objektivierung erreicht werden.
  Besonders aufschlussreich sind historische Quellen, in denen über einen längeren Zeit­
raum bzw. über mehrere Generationen hinweg kontinuierlich das Umweltgeschehen für
eine bestimmte Region dokumentiert ist. Da in solchen Chroniken oftmals dieselben
Aspekte Gegenstand der Dokumentation sind, sind sie prädestiniert, um längere Zeitrei­
hen zu spezifischen Umweltparametern abzuleiten. Auf diese Weise kann das Umweltge­
schehen nicht nur im quellenkritischen Kontext, sondern auch komparativ im Laufe der
Zeit oder im Verhältnis zu anderen Regionen gesetzt werden. So liefert beispielsweise die
Hauschronik der Wiesenbronner Familie Hüßner mit ihren Aufzeichnungen vielfältige
Hinweise zu Klima, Anbaufrüchten, Phänologie, Wirtschaft und Geschichte in Mainfran­
ken in den Jahren 1750–1894. Darin heißt es beispielsweise für das Jahr 1762:

       „Anno 1762 war ein rechts hartes jahr, maßen der weinstock zu anfang deß Meyen halb
       erfroren und gegen zu ende deß Meyen folgent den garauß gemacht, daß dabey auch
       war eine solche trockene dürr dabey, daß es 2 monath nichts regnen that, dan hero der

                                               542
Texte als Bausteine der Umweltforschung
Texte als Bausteine der Umweltforschung

       edle same auch nicht fort wacksen kont, und eine schlechte ernde; daß korn galt im
       Juny schon 12 fl. und 30 kr. frk., biß gegen den Herpst 11 thl. frk., der eymer most, weil
       eß wenig geben, ist er noch gut worden, gult 3 thl. und der habern galt 4 fl. 16 kr. frk.“

Der Text wurde aus dem Manuskript transkribiert und mit dem Anfang der 1990er Jahre
weit verbreiteten Textverarbeitungsprogramm WORD5 in eine erste digitale Form über­
führt und schließlich publiziert (Glaser, Schenk u. Schröder 1991). Die inhaltlichen Aus­
sagen beziehen sich sehr typisch für eine mit der Landwirtschaft betraute Familie am Rand
des Steigerwalds Mitte des 18. Jahrhunderts auf den Witterungsgang, die entsprechenden
Auswirkungen auf die Landwirtschaft und die Preise: Offensichtlich war der Jahresbe­
ginn 1762 kalt. Weitere Kennzeichen sind die zwei Frostereignisse im Mai, die den Reben
folgenschwer zusetzten. Zudem wird eine zweimonatige Dürreperiode angeführt, in der
es keinen Niederschlag gab, was sich wiederum schlecht auf die Entwicklung der Anbau­
produkte auswirkte und eine schlechte Ernte zur Folge hatte. Verschiedene Preisangaben
zu Getreide und Wein, der gering, aber gut ausfiel, runden das Bild ab.
   Derartige Hinweise wurden oft in mehrjähriger Recherchearbeit in umfassenden Daten­
sammlungen zusammengeführt und publiziert. Bekannt ist beispielsweise die Sammlung
Weikinn (1958–1963), die von Börngen u. Tetzlaff (2000) abgeschlossen wurde. Derartige
Sammlungen haben eine lange Tradition, wie etwa die zu den Hochwasserereignissen an
der Elbe von Pötzsch (1784) zeigt. Kritikpunkte an diesen Sammlungen sind der oft unkri­
tische kompilative Charakter sowie die Verwendung von nicht überprüften Sekundärquel­
len. Trotz dieser berechtigten Kritik bieten sie wichtige Ansatzpunkte für weiterreichende
wissenschaftliche Forschung (Muddelsee et al. 2002).
   Die Erschließung historischer Quellen erforderte in der analogen Zeit oftmals zeitauf­
wendige akribische Archivrecherchen. Findbehelfe, wie Repertorien, hatten in dem bis
dato geltenden Verständnis von „historisch“ oftmals keine eigenen Rubriken für Umwelt
oder Wetter, Witterung und Klima. Erst mit dem ökologischen Turn der 1970er Jahre setz­
te sich schließlich ein entsprechendes Verständnis und mit einem zeitlichen Versatz auch
eine Integration in einschlägigen Findhilfen durch.

        3 Datenbanken, neue Formate und Zugänge
              im Rahmen der Digitalisierung

Die rasant voranschreitende Digitalisierung seit den 1990er Jahren mit der Verbreitung
des Internets eröffnete neue Recherche-, Erfassungs- und Auswertungsmöglichkeiten: Wo
früher mühsame, zeitaufwändige und kostenintensive Archivrecherche notwendig war
oder langwierige Fernleihen bemüht werden mussten, können heute zunehmend digitale
Quellenbestände und Informationen über das Internet erschlossen werden. Zusätzlich er­

                                                  543
Texte als Bausteine der Umweltforschung
Rüdiger Glaser, Michael Kahle, Franck Borel, Rafael Hologa, Oliver Rau und Antje Kellersohn

leichtern komfortable Suchfunktionen das Erschließen von Textquellen, wodurch relevan­
te Textbausteine systematisch mittels a priori festgelegter Kodierschemata oder alternativ
über thesaurierende Suchverfahren gesammelt und kodiert werden können.
   Aktuelle Beispiele für neue Zugangsoptionen liefern die digitalisierten Bestände der
Monumenta Germaniae Historica MGH (www.dmgh.de), oder die der Freiburger Zeitung
(https://www.ub.uni-freiburg.de/recherche/digitale-bibliothek/freiburger-historische-­
bestaende/freiburger-zeitung). Auch einschlägige Werke aus den digitalisierten Beständen
von Google Books oder von Archive.org bieten leicht zugängliche Informationen. Mitt­
lerweile sind auch umfassende Bildergalerien von Hochwassermarken und viele andere
Digitalisate online verfügbar.
   Für fachlich einschlägige Analysen stehen mittlerweile eine Reihe von beeindruckenden
Datenbanken online zur Verfügung. Zu diesen zählen u. a. Pediflood (Barriendos et al.
2014), ORRION (Martin et al. 2016), ICOADS (Woodruff et al. 2011), CLIWOC (García-
Herrera et al. 2005), euroclimhist.ch (Pfister 2015) oder REACHES (Wang et al. 2018).
Dazu kommen fachlich spezifizierte Datenbanken, beispielsweise zu Dürren wie EDII
(Stahl et al. 2016), oder von marinen sowie frühen instrumentellen Daten (Kaspar et al.
2015, Cram et al. 2015). Weitere Zugänge finden sich unter https://www.ncdc.noaa.gov/
data-access/paleoclimatology-data/datasets/historical. In den national geförderten Digi­
talisierungsprojekten DADIGI und HISTOR des DWD wurden entsprechende Sammlun­
gen aus deutschen Archivbeständen integriert (Kaspar et al. 2015).
   Im Rahmen dieser Bemühungen kommen zunehmend auch Fragen der Datenstandar­
disierung auf. So werden bei PAGES verschiedene Paläodaten in einem gemeinsamen
Datenformat (LiPD) nach den FAIR (Findable-Accessible-Interoperable and Reusable)
Prinzipien zusammengeführt. Damit eröffnen sich neue Möglichkeiten der Big Data
Analyse sowie der Reanalyse (McKay u. Emile-Geay 2016, Wilhelm et al. 2018, Khider et
al. 2019).

3.1 HISKLID – Kodierung, Indizierung und Cross Validierung
historischer Quellentexte

Die recherchierten Quellentexte für den mitteleuropäischen Raum wurden zunächst in
HISKLID digital erfasst. Zeit bzw. Zeiträume, Ort, Quelle und Inhalt wurden dazu ko­
diert bzw. indiziert. Ein Teil der HISKLID Daten sowie das Kodierschema sind publiziert
(Glaser u. Militzer 1993, Glaser 1996). In Tab. 1 ist die Kodierung des obigen Textzitates
nach dem HISKLID Format abgebildet. Die Texte wurden dabei in einen numerischen,
„maschinenlesbaren“ Code überführt. Wesentlicher Bestandteil dieses Arbeitsschrittes ist
die Indizierung der klimatischen Angaben (Glaser 1996).

                                             544
Texte als Bausteine der Umweltforschung
Texte als Bausteine der Umweltforschung

                  Tab. 1: Kodierung des Textzitates von 1762 in HISKLID.

 1762        05           41         18711–55          40          01
 1762        05           40         18711–55          -2
 1762        06                      18711–55                      02           01
 1762                                18711–55                      0124         01
 1762                                18711–55                      0132         01
 1762                                18711–55                      04           01
 1762        16                      18711–55                      02           01

Die Cross-Validierung des oben wiedergegebenen Textauszuges mit den numerischen
Angaben der Baur’schen Temperaturreihe für Mitteleuropa bestätigt die inhaltlichen Ge­
wichtungen und Beschreibungen. War der Januar gegenüber der Klimanormalperiode
1961–1990 um nicht ganz 1°C zu mild, blieb der Februar rund 1°C unter den langjährigen
Vergleichswerten, der März sogar 3,3°C, was die Bezeichnung eines „harten Jahres“ ver­
ständlich macht. Da der April 2,2°C zu warm ausfiel und auch der Mai 0,8°C über den Ver­
gleichswerten lag, erscheint auch der Hinweis auf die Trockenheit und das Fehlen von Re­
gen plausibel. Die Werte von März und April überstiegen auch die Grenzen der einfachen
Standardabweichung, was sie als auffällig bzw. extrem einordnen lässt. Zudem handelt es
sich um, wie ebenfalls erwähnt, – agrarökologisch wichtige Monate.
   Die Cross-Validierung mit den instrumentellen Daten ermöglicht eine Bewertung der
Quelle und zeigt, wie plausibel die schriftlichen Hinweise sind. Wenn derartige Instru­
mentendaten nicht vorliegen, kann eine Plausibilitätsprüfung auch über die zusammen­
schauende Interpretation mit anderen Quellen erfolgen. Benachbarte Regionen sind
aufgrund der Synopsis, d. h. des Gesamtbildes von Wettersituationen und Witterungs­
abläufen nicht unabhängig voneinander, sondern kausal miteinander verknüpft. Im Fall
der Hüßner-Hauschronik bestätigen Quellen aus Stuttgart und dem Raum Bodensee so­
wie Mainfranken den Witterungsgang, insbesondere die Kälte im Februar und März, die
Frost­ereignisse im Mai sowie die Hitze und Dürre im Sommer. Auch die gute Weinqualität
dieses Jahrganges findet mehrfach Erwähnung. Damit werden die Inhalte der Wiesen­
bronner Hauschronik gleich mehrfach bestätigt.
   Das HISKLID Format wurde schließlich in tambora.org übernommen und weiterentwi­
ckelt. Dies bezieht sich zum einen auf die Erweiterung des hierarchischen Kodierschemas,
zum anderen auf die Bezugnahme auf eine Ortsdatenbank, die nunmehr mit Geokoordi­
naten hinterlegt ist. Die Quellen wurden in gängigen Formaten abgelegt und damit weiter
standardisiert.

                                           545
Texte als Bausteine der Umweltforschung
Rüdiger Glaser, Michael Kahle, Franck Borel, Rafael Hologa, Oliver Rau und Antje Kellersohn

  4 tambora.org – kollaborative Forschungsumgebung als
  neue IT-basierte Form der Wissenskommunikation und
      Partizipation in der Historischen Klimatologie
Durch die rasante Entwicklung der letzten Jahre ergeben sich nicht nur effektive Möglich­
keiten der Datenvorhaltung, sie eröffnen auch grundlegend neue Perspektiven einer weit­
reichenden Wertschöpfung und Kollaboration. Kollaborative Forschungsumgebungen,
die oft auch virtuelle Forschungsumgebung (VFU), E-Portale, oder Englisch „Collabora­
tive Research Environment“ (CREs) genannt werden, stellen neue Formen partizipativer
Datenablage und Nutzung dar. Sie wurden seit den 2000er Jahren entwickelt, um großen,
ortsübergreifenden Arbeitsgruppen eine geeignete Plattform zu bieten, um Daten, Metho­
den und Erkenntnisse zu kommunizieren, zu teilen und zu verbreiten. Dabei wurden sie
stets nicht nur als technisches Vehikel, sondern auch als sozial integrierendes Instrument
angesehen (Kahle, Glaser u. Hologa 2020, Carusi u. Reimers 2010). Durch die Öffnung
nach außen beinhalten sie auch eine gesellschaftspolitische Komponente, insbesondere
durch die Adressierung weiterer Stakeholder oder die Einbeziehung von Bürgerwissen­
schaften (Candela et al. 2013).
   Auf tambora.org ist der komplette Workflow der Historischen Klimatologie stringent
umgesetzt, ergänzt um ein Rechte- und Verwaltungssystem sowie Publikationsmöglich­
keiten (Riemann et al. 2015).

          Abb. 1: Ablaufschema in der Historischen Klimatologie in tambora.org.

                                             546
Texte als Bausteine der Umweltforschung
Texte als Bausteine der Umweltforschung

In einer langjährigen Kooperation mit dem Institut für Länderkunde (IfL) in Leipzig
wurden in zwei DFG­finanzierten Förderphasen auch die 66.000 Einträge umfassenden
Datenbestände von Weikinn in tambora.org überführt (Weikinn 1958; Börngen u. Tetzlaff
2000). Im Laufe der Vorhaben kamen weitere Datenbestände, u. a. aus dem ANF­DFG
geförderten Vorhaben Transrisk hinzu (Himmelsbach et al. 2015). Gespiegelt werden diese
Datensätze im Datenbankprojekt ORRION des französischen Projektpartners. Das Geo­
graphische Institut der Universität Augsburg beteiligte sich mit dem IBT Datenbestand
(Inundationes Bavariae Thesaurus), in dem Hochwasserereignisse aus dem Alpenvorland
enthalten sind (Böhm 2013; Böhm et al. 2014).
   Die Universitätsbibliothek Freiburg, die ganz wesentlich zur Entwicklung und technischen
Realisierung beitrug, verpflichtete sich zudem, tambora.org zu hosten und damit die Daten­
bestände, aber auch die Erkenntnisse und Methoden langfristig zu sichern. Die UB Freiburg
als eine Körperschaft des öffentlichen Rechts garantiert auch rechtliche Standards wie die
freie Zugänglichkeit und einen an guter wissenschaftlicher Praxis orientierten Umgang.
   Besonders hervorzuheben ist die Möglichkeit einer arbeitsteiligen Vorgehensweise vor
allem für jene Arbeitsschritte, die ein Expertenwissen erfordern, beispielsweise bei der
Transkription von Handschriften, für die spezifische paläographische Kenntnisse unab­
dingbar sind. Ähnlich verhält es sich bei den Kalibrierungsverfahren, die in aller Regel
eine Anwendung statistischer Verfahren voraussetzen. Für die Ableitung von Schätz­
werten der Temperatur und des Niederschlages wurden die Indexwerte kalibriert. Dazu
wurden Verfahren wie das Varianz­Scaling und Regressionsansätze verwendet (Glaser u.
Riemann 2009, Glaser u. Kahle 2020).

 Abb. 2: Temperatur- und Niederschlagsentwicklung in Mitteleuropa seit 1500. Im oberen
  Teil sind die Temperaturen als die einjährigen (1y), zweijährigen (2y) usw., im unteren
 die Niederschlagswerte analog abgebildet. Die schwarze Linie repräsentiert das gefilterte
                       5-jährige Mittel (Quelle: Glaser et al. 2020).

                                           547
Texte als Bausteine der Umweltforschung
Rüdiger Glaser, Michael Kahle, Franck Borel, Rafael Hologa, Oliver Rau und Antje Kellersohn

Für die Interpretation wiederum ist klimatologisches Fachwissen notwendig. Ein derart
arbeitsteiliges Vorgehen und standardisiertes Werkzeugrepertoire verbessert die Quali­
tät von Projekten. Somit trägt es zur methodischen und inhaltlichen Konsolidierung bei,
schafft neue Netzwerke und ermöglicht neue Formen kollaborativer Zusammenarbeit.
Zugleich regt tambora.org die Kooperation über die enge Wissenschaftsgemeinde hinaus
an und ist im Sinne von OpenScience auch für weitere Nutzergruppen erreichbar (Heim
et al. 2018). Diese Facetten unterstreichen die immer wieder vorgetragene Komponente
kollaborativer Plattformen als soziales Konstrukt und des Wissenstransfers. Auch ermög­
licht eine derartige Arbeitsweise ein fachlich breit aufgestelltes Peer-Reviewing-Verfahren.
tambora.org bietet durch die Vergabe von DOIs (Digital Object Identifier) eine zufrieden­
stellende Lösung für die wichtige und zugleich sensible Frage der Urheberrechte bzw. der
Rechteverwertung und Publikation an. Textsammlungen, Quellenkompilationen, Tran­
skriptionen oder sonstige Editionen können zitierfähig publiziert werden (Schönbein et al.
2016; Vogt et al. 2016).
   Perspektivisch können über Algorithmen neue Einträge in kausale klimatologische Zu­
sammenhänge und in den bisherigen Gesamtkontext gestellt werden, um unplausible Ein­
träge zu identifizieren. Nutzer sollen auf diese Weise nicht nur eine zeitnahe Einordnung
zu ihren Einträgen erhalten und damit einen ersten motivierenden Eindruck der eigenen
Beiträge, sondern vor allem auch eine vorläufige Verifikation. Eine derartige Rückkopp­
lung und Verifikation kann entsprechend kartographisch visualisiert und unterstützt wer­
den (Kahle u. Glaser 2020).
   Ein wichtiges Desiderat ist und bleibt die Erschließung und Einbindung neuer Daten­
bestände und Nutzungsformen über die Erweiterung des Nutzerkreises, ebenso wie die
Vernetzung mit bestehenden Datenbanken. Vor allem über die Einbeziehung aktueller
Daten und Darstellungsformen wie der Bürgerwissenschaften sind neue Akzente möglich.

4.1 Einbindung tagesaktueller Textquellen

Besonders hervorzuheben ist der inhaltliche Anschluss von historischen Quellen an ta­
gesaktuelle Texte und Meldungen, wie sie in Zeitungsartikeln, Berichten und Dokumen­
ten enthalten sind. Für diese „aktuelle Klimahermeneutik“ gilt, dass sie die numerischen,
instrumentell generierten Daten durch die Betonung von Folgen, Wahrnehmungen und
Reaktionen, wie sie in den Texten schwerpunktmäßig enthalten sind, strukturell ergänzt.
Gerade auch die Bewertung des aktuellen Klimawandels und seiner Folgen anhand von
verschiedenen Medienformaten ist mittlerweile wissenschaftlich etabliert (Kirilenko u.
Stepchenkova 2012; Schmidt, Ivanova u. Schaefer 2013, Boussalis u. Coan 2016). Rezente,
schriftliche Aufzeichnungen stellen eine wichtige Ergänzung zu instrumentellen Messun­
gen dar. Ihre Bewertung und Analyse unterliegt den gleichen Arbeitsschritten. Dies be­

                                             548
Texte als Bausteine der Umweltforschung
Texte als Bausteine der Umweltforschung

deutet auch, dass sie mit den aus historischen Texten extrahierten Daten direkt in Bezug
gesetzt werden können.
  Der nachfolgende Artikel aus der Main­Post (Amling 2018) veranschaulicht dies und
lässt aufgrund der regionalen Zuordnung Bezüge zur Hauschronik der Wiesenbronner Fa­
milie Hüßner zu. Die Main­Post hat 286.000 Leser, die digitale Ausgabe eine Gesamtreich­
weite von 793.000.1 Das Verbreitungsgebiet liegt in Mainfranken um die Städte Würzburg
und Schweinfurt.

               Abb. 3: Beispiel für die Integration rezenter Zeitungsartikel in
                              tambora.org aus der Main-Post.

Über geeignete Indexverfahren kann zudem der Zeitraum mit rein textbasierten Informa­
tionen und den Abschnitten, die durch instrumentelle Messungen belegt sind, erweitert
werden. Zudem sind derartige, möglichst lange Überlappungen für die Kalibrierung der
Indexwerte sehr wichtig.
   Insgesamt lassen sich damit durchgängige Zeitreihen ableiten, die gerade auch für heu­
tige Fragestellungen wie Trendverhalten oder Wiederkehrzeiten von ausgewählten Klima­
extremen wie Dürren und feuchten Perioden von Bedeutung sind (Glaser u. Kahle 2020,
Ionita et al. 2021). Die gesellschaftlichen Folgen von Dürren wurden von Erfurt et al. (2019
und 2020) dargestellt.

               5 Crowdsourcing: Neue Medien und
                   digitale Beteiligungsformen

Gegenüber der historischen Umweltforschung stehen der aktuellen Analyse des Umweltge­
schehens eine Reihe neuer Quellen zur Verfügung, die maßgeblich auf die Entwicklungen
neuer Medienformate und auf die Möglichkeiten vielfältiger digitaler Beteiligungsformate

1
    https://www.mainpost.de/storage/med/mediadaten/936832_Online_Faltblatt_Main­Post_
    Einzelseiten.pdf (Zugriff: 15. April 2021).

                                             549
Texte als Bausteine der Umweltforschung
Rüdiger Glaser, Michael Kahle, Franck Borel, Rafael Hologa, Oliver Rau und Antje Kellersohn

und des Crowdsourcings von relevanten Informationen zurückzuführen sind. Abhängig
vom Beteiligungs- und Medienformat sowie der Datenakquise werden Informationen ge­
neriert, aus denen sich vielversprechende Daten für die Umweltforschung ableiten lassen.
Wettermelder auf diversen regionalen Radioprogrammen, imposante Bildsequenzen von
Sturmjägern, Twitter-Meldungen zu Klimakatastrophen, spontane Bottom-up-Initiativen,
die den Katastrophenschutz unterstützen, seien hierfür exemplarisch aufgeführt.
   Somit bietet das digitale Zeitalter der Gesellschaft vielfältige Optionen, um den Ablauf,
aber auch Folgen und Maßnahmen zum aktuellen Wetter-, Witterungs- und Klimagesche­
hen als Textnachricht, im Bild, oder in Ton- und Filmsequenzen festzuhalten. Neben dem
inhaltlichen Wert ermöglichen solche Informationen auch Einblicke in die gesellschaft­
liche Perzeption von Umweltphänomenen.
   Im Kontext von Wetter, Witterung und Klima lassen sich einerseits Quellen unterschei­
den, deren Informationen sich auf ein konkretes Ereignis beziehen und bei denen Laien
aufgrund eines solchen indirekt Informationen für die Umweltforschung produzieren.
Andererseits entstehen zunehmend neue Beteiligungsformen in der Umweltforschung
durch bürgerwissenschaftliche Projekte. Dann erfolgt die Dokumentation von Umwelt­
phänomenen vor dem Hintergrund einer spezifischen Agenda, beispielsweise bei phäno­
logischen Beobachtungen.
   Bei Informationsquellen, die vor dem Hintergrund eines konkreten Ereignisses entstan­
den sind, handelt es sich meist um extreme Wetterereignisse, die Individuen dazu animie­
ren, ihre Beobachtungen mittels sozialer Medien mit der allgemeinen Öffentlichkeit zu
teilen. Vor allem bei Unwettern und Klimakatastrophen steigt die Zahl von einschlägigen
Einträgen bzw. Meldungen rapide an. Solche Formen der „Umweltberichterstattung“ sind
in der Regel losgelöst von einer organisierten Beteiligung. Die auf diese Weise generierten
Informationen bzw. der mit Mitteln des Web 2.0 geteilte sog. user-generated content sind
hinsichtlich ihrer inhaltlichen Struktur sehr heterogen und unterscheiden sich abhängig
vom Medienformat. Aufgrund der großen Anzahl von Meldungen bei einem Wetterex­
tremereignis ergeben sich vielfältige Möglichkeiten des Crowdsourcings, der statistischen
Auswertung. Insbesondere durch Verfahren des Textminings lassen sich beispielsweise
aus Twitter-Meldungen umfassende Einsichten über die gesellschaftliche Wahrnehmung
von Wetterphänomen und deren Kontextualisierungen ableiten.
   Demgegenüber etablieren sich bei Informationen, die aus dem Kontext von bürger­
wissenschaftlichen Aktivitäten stammen, oftmals feste, quasi institutionalisierte Beobach­
tungs- und Meldestrukturen, die zum Teil auch von öffentlichen Trägern unterstützt wer­
den. Im deutschsprachigen Raum haben sich insbesondere Projekte langfristig etablieren
können, die auf indirekte Umweltachtungen abzielen. Exemplarisch seien die Initiativen
„CrowdWater“, „Wettermelden.at“, das „Pollentagebuch“, „SenseBox“ und „Die Apfelblü­
tenaktion“ genannt. Bei allen Projekten geht es darum, dass Laien ihre Beobachtungen
möglichst strukturiert melden. Die auf diese Weise überregional zusammengeführten
Daten können oft eine gute Grundlage bilden, um weitere Einblicke in die raum-zeitliche

                                             550
Texte als Bausteine der Umweltforschung

Dynamik der beobachteten Phänomene zu ermöglichen. Zugleich stellen sie einen wichti­
gen Beitrag zur Dokumentation des Klimawandels im regionalen Kontext dar.
   Ebenso tragen bürgerwissenschaftliche Aktivitäten vielversprechend zur Erschließung und
Auswertung historischer Datenbestände bei. Besonders weit gediehen sind die Transkriptio­
nen von klimarelevanten Informationen aus unzähligen Schiffstagebüchern, etwa im Projekt
­oldweather.org. Diese stehen im Zusammenhang mit dem International Comprehensive Oce­
 an-Atmosphere Data Set (ICOADS) (Freeman et al. 2016). Hierbei werden die handschrift­
lichen und daher nur schwer automatisch auswertbaren Aufzeichnungen von Schiffstagebü­
chern von Bürgerwissenschaftlern transkribiert und damit einer weiterführenden Auswertung
zugänglich gemacht. Von den Wetterdetektiven (www.weatherdetective.net.au) konnten, un­
terstützt von den öffentlichen Medien, bis Oktober 2015 mehr als 400.000 Einträge von 11.000
Bürgerwissenschaftlern transkribiert werden.
   Auch im Rahmen von Forschungsarbeiten zur Historischen Klimatologie auf t­ ambora.org
wurden die Möglichkeiten bürgerwissenschaftlicher Öffnungen anhand von Transkriptio­
nen der Freiburger Zeitung und des Nordischen Mercurius getestet. Potenziale bestehen
u. a. in Historischen Vereinen, denkbar ist die Adressierung von einschlägigen universi­
tären Seminaren oder Transkriptionen im Rahmen von Schulprojekten. Somit kann eine
größere Erschließung erzielt werden, bei der die Beteiligten auch zur Kreuzvalidierung
eingebunden werden können. Denn die breite Nutzung von Laien erfordert solche For­
men der Rückkopplung und Qualitätssicherung, um den wissenschaftlichen Standard und
die Authentizität zu garantieren.
   Neben institutionalisierter Bürgerwissenschaft sind auch weitere Praktiken zu beob­
achten, bei denen Laien aus der Bevölkerung aktuelle Wetter-, Witterungs- und Klima­
ereignisse dokumentieren und somit potentielles Quellenmaterial für die Umweltfor­
schung liefern. So binden verschiedene regionale Sendeprogramme oder Wetterdienste
Laien als Wettermelder ein. Sie verbreiten individuelle instrumentelle Messdaten von
Freiwilligen als aktuelle Wetternews und stärken damit sowohl ihr regionales Profil als
auch die Aktualität ihrer Berichterstattung. Einige Themen sind nicht nur aufgrund ihres
Inhaltes spektakulär, sondern auch beeindruckend umgesetzt, etwa die zeitnahe Meldung
und Bilddokumente von Sturmjägern (storm-chasers.de). Besonders viele und kreative
Beteiligungsformen treten jeweils im Kontext von Klimakatastrophen auf. So finden sich
beispielsweise in einem regionalen Mitmachlexikon zum Katastrophenhochwasser von
2013 in Halle an der Saale zum Teil minutiös aufgelöste Text- und Bilddokumentatio­
nen. Auch Bürgerreporter, die umfassende Vor-Ort-Analysen liefern, oder Inhalte auf
spontan eingerichteten Hilfsportalen und entsprechenden Blogs, in denen Hilfesuchende
während eines solchen Extremereignisses Aufrufe schalten können, repräsentieren das
breite Spektrum solcher Informationsquellen. Zur Einschätzung der räumlichen Dimen­
sion eines Ereignisses sind gerade auch neue Formen des kollaborativen Webmappings
und der kartographischen Dokumentation von Schäden und Auswirkungen besonders
aufschlussreich.

                                            551
Rüdiger Glaser, Michael Kahle, Franck Borel, Rafael Hologa, Oliver Rau und Antje Kellersohn

  Alle genannten Informationsquellen stellen neben den klassischen Textquellen ein eige­
nes neues Genre aktueller hermeneutischer Vermittlung von Wetter, Witterung und Klima
dar. Aus deren Nutzung ergeben sich weitreichende Möglichkeiten einer inhaltlichen und
methodischen Brücke zwischen historischen und rezenten Daten. Um die Qualität der
Aussagen zu validieren, sind Verfahren zur Parallelisierung und zur komparativen Zu­
sammenschau aktueller hermeneutischer Informationen einerseits und zeitgleich erhobe­
ner Messdaten andererseits besonders aufschlussreich. Darüber hinaus könnten mit der
Nutzung aktueller hermeneutischer Einträge auch Schlüsse auf historische Informationen
gezogen werden. Im günstigsten Fall könnten damit durchgängige gleichartige Datenty­
pen generiert und neue Möglichkeiten der Kalibrierung von Kodierschemata, Indizierung
und Kalibrierung getestet werden.

            6 Maschinelles Lernen: Automatisierung
                       der Textanalyse

Als weiterer Schritt zur Bewältigung und Nutzung der enorm gestiegenen Datenmengen
werden zunehmend Verfahren der Automatisierung und deren Analyse mittels Statistik
und künstlicher Intelligenz angewandt. In diesem Kontext beschäftigen sich die „Digital
Humanities“ mit der Erforschung textbasierter geisteswissenschaftlicher Fragestellungen
mit digitalen Methoden. Eine methodologische Grundlage dieser Ansätze ist die her­
meneutische Interpretation (Rabus 2019). Texte, die vor einigen Jahren noch selbst für
Menschen schwer lesbar waren, sind heute mittels automatischer Texterkennung (Optical
Character Recognition – OCR) in Sekundenbruchteilen erschlossen. In vielen Ansätzen
wird über die qualitative Analyse hinaus mittels Wortzerlegung (Tokenizing) eine Quanti­
fizierung angestrebt. Um über Wortgrenzen hinweg zu kommen und die grammatikali­
schen Zusammenhänge zu erkennen, kommen zunehmend Methoden aus dem Bereich
der Künstlichen Intelligenz und des Maschinellen Lernens zur Anwendung. Gängige Ver­
fahren sind u. a. Text Mining (Matuschek 2014), Natural Language Processing (NLP), Re­
inforcement Learning und Klassifizierung. Ihre Anwendung auf Zeitungsarchive und -in­
formationen im Kontext klimatischer Fragestellungen zeigen u. a. Yzaguirre, Smit u.
Warren (2016) mit der beeindruckenden Analyse von über zwei Millionen Artikeln sowie
Kang u. Park (2018) anhand von koreanischen Zeitungen.

6.1 Automatisierung des quellenkritischen Ablaufschemas

Automatisierte Konzepte sind als Unterstützung bei der Erschließung und der Extrak­
tion klimarelevanter Informationen aus schriftlichen Quellen gedacht. Nachfolgend ist

                                             552
Texte als Bausteine der Umweltforschung

dargestellt, wie eine Automatisierung des quellenkritischen Ablaufs mit Hilfe von Al­
gorithmen, wie z. B. maschinellem Lernen, in der Historischen Klimatologie umgesetzt
werden kann.
  Zunächst stellt sich die Frage, welche Arbeitsschritte des quellenkritischen Ablaufs
grundsätzlich automatisiert werden können. Kann man beispielsweise mit Hilfe neuro­
naler Netze Zeit, Ort oder das semantische Profil aus schriftlichen Quellen automatisch
ermitteln? Wo können allenfalls nur Verbesserungen in der Verarbeitung erwartet wer­
den, wo können sie den Bearbeiter gar ersetzen? Um diese Fragen zu beantworten, werden
der quellenkritische Arbeitsablauf und seine Bestandteile im Detail betrachtet, um sie zu
systematisieren und zu formalisieren. Bei dieser Aufgabe sind folgende Gedanken von
zentraler Bedeutung:
  Jede schriftliche Quelle wird mit einer spezifischen und unveränderlichen Fragestellung
konfrontiert: Welche Klimainformation ist in der vorliegenden Quelle enthalten? Diese
simple Feststellung markiert den Unterschied zu den historischen Wissenschaften, die
eine Quelle immer wieder neuen Fragestellungen unterwerfen.
     1. Jeder quellenkritische Arbeitsablauf kann als geordnete Menge von Arbeits­
          schritten beschrieben werden.
     2. Jeder Arbeitsschritt ist ein Vorgang in der Zeit, welcher ein Objekt erzeugt oder
          ein gegebenes Objekt verändert.

Ein Modell, welches diese Überlegungen berücksichtigt, definiert einen Arbeitsschritt wie
in Abb. 4 dargestellt ist.

    Abb. 4: Ein vollständiger Arbeitsschritt besteht aus einem Anfangszustand s, einer
    Transition t und einem Endzustand f. Die Erzeugung oder Zustandsänderung des
    Objektes geschieht von s über t nach f. Im Speicher befinden sich die Endzustände.
                  Diese können festgesetzt sein oder aber auch wachsen.

                                           553
Rüdiger Glaser, Michael Kahle, Franck Borel, Rafael Hologa, Oliver Rau und Antje Kellersohn

Ein Arbeitsschritt ist eine Relation R zwischen der Menge der Anfangszustände S und den
Endzuständen F. Das entspricht der Abbildung von S auf F:

                                             Rt:S → F

Automatisieren lassen sich jene Arbeitsschritte, bei denen der Definitionsbereich der An­
fangszustände S mit einer Funktion f(S) auf die Zielmenge F abgebildet werden kann:

                                             F = f(S)

Die Automatisierung bezeichnet somit den Vorgang, einen Anfangszustand mit einem
Endzustand paarweise in Relation zu stellen. Hierzu legen wir mögliche oder gegebene
Endzustände in einem Speicher ab. Solcherart sind wir auch für das Trainieren von Neuro­
nalen Netzen gerüstet, wenn automatische Klassifikationen vorgenommen werden. Da der
Speicher die Menge der möglichen Endzustände darstellt, bildet er, fast schon nebenläufig,
die Grundlage einer Wissensbasis für die Historische Klimatologe: Mit jeder Aufnahme
eines neuen Urhebers oder Autors einer Quelle in den Speicher wächst die Kenntnis darü­
ber, welcher Autor klimarelevante Beobachtungen gemacht hat. Dies ermöglicht dann z. B.
die gezielte Suche nach weiteren Quellen desselben Autors.
   Es gibt Speicher mit endlichen Elementen, wie beispielsweise beim Arbeitsschritt zur
Bestimmung der Lesbarkeit der klimarelevanten Informationen einer Quelle. In diesem
Fall finden wir im Speicher die Elemente lesbar, zum Teil lesbar und nicht lesbar. Ande­
re Speichertypen sind wachsende Speicher, deren Anzahl der Endzustände stetig wächst.
Dies ist z. B. der Fall bei der Verortung von Klimaereignissen.
   Letzteres führt zur Frage, ob Arbeitsschritte mit wachsendem Speicher irgendwann ge­
sättigt sind, bzw. ob die Grundmenge der Speicher, wie z. B. die Menge der schriftlichen
Quellen, endlich ist. Kenntnisse über die Grundmenge sind von entscheidender Bedeu­
tung, wenn wir wissen wollen, wie zuverlässig ein Algorithmus mit unbekannten Quellen
umzugehen im Stande ist.
   Da ein Arbeitsablauf nichts anderes als eine Abfolge von Arbeitsschritten ist, kann ein Arbeits­
ablauf als lineare Ordnung, z. B. in Form eines Hasse-Diagramms, dargestellt werden (Abb. 5).
   Bei näherer Analyse des Arbeitsablaufes werden Erkenntnisse über das Zusammenwir­
ken der Arbeitsschritte, der Gestalt oder Typisierung von Arbeitsabläufen und die Mög­
lichkeit, Arbeitsschritte zu parallelisieren, gewonnen.
   Aus einem Arbeitsablauf lassen sich Ablaufpläne erstellen. Sie bestimmen, in welcher Rei­
henfolge die einzelnen Arbeitsschritte erfolgen. Bei einem Ablaufplan handelt es sich um eine
lineare Erweiterung, welche auf den Arbeitsablauf angewandt wird. Die Anzahl der mögli­
chen Ablaufpläne lässt sich auch berechnen (Abb. 6). Die fast schon absurd anmutende Anzahl
möglicher Ablaufpläne ist ein Zeichen für die Komplexität des quellenkritischen Ablaufes und
weist auf die Problematik der Nachvollziehbarkeit von Ergebnissen aus dem quellenkritischen

                                               554
Texte als Bausteine der Umweltforschung

Ablauf hin: Ohne Kenntnisse des Ablaufplans lassen sich Ergebnisse kaum rekonstruieren. Es
stellt sich die Frage, ob unterschiedliche Ablaufpläne zum selben Ergebnis führen. Hier wird
die Bedeutung von virtuellen Forschungsumgebungen besonders deutlich: Arbeitsabläufe und
Arbeitsschritte sind formalisiert. Einzelne Arbeitsschritte können nachvollzogen werden und
sorgen für zuverlässige Ergebnisse und damit auch für verlässliche Daten. Diese sind wiederum
Voraussetzung für die Automatisierung und die Anwendung des Maschinellen Lernens.

Abb. 5: Beispiel für einen vollständigen Arbeitsablauf zur Erschließung schriftlicher Quellen
                  in der Historischen Klimaforschung als Hasse-Diagramm.

                                            555
Rüdiger Glaser, Michael Kahle, Franck Borel, Rafael Hologa, Oliver Rau und Antje Kellersohn

           Abb. 6: Anzahl möglicher Ablaufpläne eines Arbeitsablaufes gruppiert
                           nach der Anzahl der Arbeitsschritte.

6.2 Textanalyse mittels Statistik und Künstlicher Intelligenz

Nachfolgend werden ein historisches und ein modernes klimarelevantes Textzitat zu Main­
franken mittels Statistik und künstlicher Intelligenz verarbeitet und analysiert. Dazu wurde
der Textkorpus aus tambora.org in Wörter zerlegt und mit den Indizes der Temperatur und
des Niederschlags der entsprechenden Monate verschnitten. Über bayessche Verfahren kön­
nen so einzelnen Wörtern Wahrscheinlichkeiten für ihr Auftreten in bestimmten Klassen
zugeordnet werden. Aus diesen lassen sich Wortwolken in unterschiedlichen Größen und
Farben darstellen. Verwendet wurden die mitteleuropäischen Angaben aus tambora.org seit
1500. Dabei kristallisieren sich Schlüsselwörter heraus, welche die Wahrscheinlichkeit für
eine Klasse entweder besonders erhöhen oder auch herabsenken (Abb. 7).
   Umgekehrt lassen sich die ermittelten Wortlisten verwenden, um ein Zitat einer Klas­
se zuzuordnen. Dies soll anhand zweier Beispiele aus historischer und rezenter Zeit ver­
deutlicht werden. Der erste Satz stammt aus dem Jahr 1756 der Hauschronik der Wie­
senbronner Familie Hüßner (Glaser, Schenk u. Schröder 1991): „In meyen aber, als der
weinstock auß der wollen hervorging, ist ein frost eingefallen und sind die augen sehr
erfroren, jedoch gewann er wieder einen guten fortgang, und trieben wieder frische au­
gen und ein gutes ansehen.“ Das zweite, moderne Textbeispiel aus dem Main­Post­Artikel
von 2018 lautet (Amling 2018): „Für den heutigen Nachmittag waren eigentlich Gewitter
gemeldet, doch die Sonne strahlt wie so oft in den letzten Wochen fast ungetrübt vom
Himmel.“

                                             556
Texte als Bausteine der Umweltforschung

Abb. 7: Wortwolken für aus dem tambora-Korpus generierte Schlüsselwörter in den sieben
 Indexklassen für die Temperatur (links) von ‚sehr heiss‘ Indexwert +3, rot) bis ‚sehr kalt‘
  (Indexwert -3, blau) und Niederschlag (rechts) von ,sehr feucht‘ (Indexwert +3, grün)
        bis ‚sehr trocken‘ (Indexwert -3, braun). Wörter, die eher unwahrscheinlich
                        in der Klasse auftreten, sind grau dargestellt.

Das Tokenizing für die markantesten Begriffe der beiden Textzitate ergibt folgendes Bild:
Für das Zitat von 1756 und die Zuweisung zu den thermischen Indexklassen sind bei­
spielsweise die Begriffe ‚Frost‘ und ‚erfrieren‘ besonders prägend. Interessant ist auch der
Begriff ‚eingefallen‘, da er auf ein extremes Ereignis hinweist, mit gleicher Wahrschein­
lichkeit für sehr heiße und sehr kalte Temperaturen. Für das Zitat von 2018 dominiert
hingegen der Begriff ‚Sonne‘ die thermische Prägung (Abb. 8). Bei der jahreszeitlichen
Zuweisung in Abb. 9 ist der Begriff ‚Gewitter‘ ein eindeutiges Sommer­Phänomen. Der
Begriff ‚Meyen‘ wird dem Frühling zugewiesen. Problematisch ist der Begriff ‚hervor+geh‘
für hervorgehen, da dieser dem Herbst und erst in zweiter Präferenz dem Frühling zu­
gewiesen wird.

                                            557
Rüdiger Glaser, Michael Kahle, Franck Borel, Rafael Hologa, Oliver Rau und Antje Kellersohn

  Abb. 8: Tokenizing für die beiden Quellenzitate der Hüßner-Hauschronik von 1756 und
   des Main-Post-Artikels von 2018 bezüglich der Temperatur-Indexklassen. Dargestellt
            sind die Schlüsselbegriffe und die Wahrscheinlichkeit des Auftretens.

    Abb. 9: Tokenizing für die beiden Quellenzitate der Hüßner-Hauschronik von 1756
      und des Main-Post-Artikels von 2018 bezüglich der assoziierten Jahreszeiten.

In der automatischen Zuordnung zu den Jahreszeiten und Temperaturklassen (siehe
Abb. 10 und Abb. 11) wurden die Einzelwahrscheinlichkeiten aller Wörter multipli­
ziert. Die Zuweisung ergibt aufgrund der besonderen Disposition von Wein wie dar­
gestellt zu Frühjahr und Herbst eine präferierte Zuweisung in den Herbst, vor dem
Frühjahr, obwohl ein Großteil des Zitates sich auf den Frühling bezieht und explizit
der Mai erwähnt wird. Der Begriff ‚hervorgehen‘ ist für diese Gewichtung verantwort­
lich. Eine monatsweise Klassifizierung erweist sich in einem solchen Fall als präzi­
ser. Der Begriff ‚Frost‘ und ‚erfroren‘ schlägt sich in der Klassenzuweisung ­2 wieder
(Abb. 10).
   Für den Satz „Für den heutigen Nachmittag waren eigentlich Gewitter gemeldet, doch
die Sonne strahlt wie so oft in den letzten Wochen fast ungetrübt vom Himmel“ aus
dem Main­Post­Artikel von 2018 ergibt sich eine eindeutige saisonale Zuweisung in den
Sommer und auch in die entsprechende Temperaturklasse (Abb. 11).

                                             558
Texte als Bausteine der Umweltforschung

Abb. 10: Automatisch erzeugte Zuordnung der Jahreszeiten und der Temperaturklassen des
                            Hüßner-Zitates zum Jahr 1756.

           Abb. 11: Automatisch erzeugte Zuordnung der Jahreszeiten und der
                  Temperaturklassen des Main-Post-Zitates von 2018.

                                         559
Rüdiger Glaser, Michael Kahle, Franck Borel, Rafael Hologa, Oliver Rau und Antje Kellersohn

Auch andere Dimensionen eignen sich für eine derartige Klassifikation, beispielswei­
se Niederschlagsindizes, Windstärken, Hochwasserintensitäten oder Zeitepochen wie
Jahrhunderte. Die Auswertung weiterer Textstellen aus dem betreffenden Gebiet und
Zeitraum erhöht die Genauigkeit und wird einfach durch Zusammenfügen der Zitate
bewerkstelligt. Auch durch weiteres Training von Begriffen und entsprechenden Zu­
weisungen wird die automatische Klassifizierung verbessert. Dies kann beispielsweise
durch Harvesting von rezenten Zeitungsartikeln in Kombination mit amtlichen Messda­
ten erfolgen. Fehlzuweisungen in historischen Dokumenten können fortlaufend manu­
ell korrigiert werden, wobei dazu auch Verfahren des Crowdsourcings denkbar wären.
Der hier skizzierte einfache Ansatz über einzelne kontextlose Wörter kann weiter ver­
feinert werden, indem Wortpaare oder ganze Phrasen verwendet werden. Durch solche
verbesserten Verfahren können die Syntax und vor allem auch die sprachlichen Be­
sonderheiten der historischen Texte berücksichtigt werden. Durch ausgefeiltere Wort-
Vektorisierung und die Verwendung von rekursiven, neuronalen Netzen kann auch der
Informationsgehalt von grammatikalischen und semantischen Strukturen erschlossen
werden.
   Alles in allem ist der Weg zukunftsweisend, weil damit große Datenmengen, wie sie
durch die Digitalisierung anfallen bzw. angeboten werden, bewältigt werden können.

                                         7 Fazit
Durch die neuen Möglichkeiten der Informationstechnologien und durch die Verbrei­
tung des Internets ergeben sich vielfache neue Perspektiven der Datenakquise und der
weiterreichenden Erschließung neuer Bestände sowie der Nutzung von bereits vorlie­
genden Digitalisaten im Bereich der historischen wie auch rezenten Umwelt- und Klima­
forschung.
   Leistungsfähige Datensammlungen und Datenbanken bieten schon heute vielfältige
neue Möglichkeiten der Datenkombination und Interpretation.
   Virtuelle Forschungsumgebungen ermöglichen darüber hinaus arbeitsteilige und de­
zentrale Arbeitsweisen, was sich für überregionale Projekte und Arbeitsgruppen geradezu
aufdrängt. In ihnen kann die komplexe Arbeits- und Verwertungskette, die für die histo­
rische Umweltforschung besteht, abgebildet werden. Die Einbindung in öffentliche Ein­
richtungen wie Bibliotheken ist ein wichtiger Garant für die nachhaltige Sicherung, den
Regelbetrieb und die rechtliche Handhabung.
   Die Einbeziehung von Bürgerwissenschaften und sozialen Netzwerken bietet wei­
terreichende Möglichkeiten, etwa für die Erschließung und Aufbereitung historischer
Bestände. Einige Aktivitäten wie die von Sturmjägern, Wettermeldern ergänzen das
bisherige Portfolio. Von besonderem Interesse ist aber auch, inwieweit die neuen Me­
dien neue Formen der Darstellung und neue Formen der Nutzbarmachung hervor­

                                             560
Texte als Bausteine der Umweltforschung

bringen. Oft sind diese räumlich dichter und zeitlich höher aufgelöst als andere In­
formationen. Andererseits sind in sozialen Netzwerken auch viele Fakenews abrufbar
und Klimaleugner aktiv. Wie auch bei historischen Angaben ist eine kritische Sicht
unabdingbar.
  Von besonderem Interesse ist aber die Erschließung tagesaktueller Klima- und Um­
weltinformation, wie sie vielfach im Netz angeboten wird. Die Nutzung dieser aktuellen
hermeneutischen Klima- und Umweltangaben bietet die Möglichkeit, an die historischen
Informationen anzuschließen und kalibrierte lange Zeitreihen abzuleiten. Vor allem die
Umsetzung der Indexverfahren über Wort-Statistiken sind geeignet, die Schnittstelle zwi­
schen textbasierten Informationen und instrumentellen Phasen zu überbrücken. Des Wei­
teren können durch zeitgleich erhobene Messdaten Kalibrierungen und Abschätzungen
zur Qualität der aus Textangaben extrahierten Daten und Zeitreihen gemacht werden.
Das Ablaufschema, einschließlich der notwendigen quellenkritischen Bewertung, ist weit­
gehend automatisierbar.
  Textbasierte Quellen erlauben gegenüber instrumentellen Daten eine Bewertung von
Wahrnehmungen, Folgen, Reaktionen und gesellschaftlichen Kontexten, die durch instru­
mentelle Messdaten nicht abbildbar sind. So gesehen ist die vielfach geäußerte Bewertung
der Objektivität von instrumentellen Daten gegenüber den a priori subjektiven Einschät­
zungen der Betroffenen und Beteiligten zu relativieren bzw. durch geeignete Verfahren zu
evaluieren.
  Die Digitalisierung hat auf die historische wie auch moderne Klima- und Um­
weltforschung einen ähnlichen Einfluss wie die Erfindung des Buchdrucks durch
Gutenberg. Die Nutzung von Maschinellem Lernen und Künstlicher Intelligenz er­
öffnet neue Möglichkeiten, was die Menge der bearbeiteten Daten anbelangt, und in
diesem Kontext auch neue Perspektiven der inhaltlichen Bewertung und methodi­
schen Umsetzung.

Zusammenfassung

In dem Beitrag werden die weitreichenden methodischen Änderungen der textbasierten
historischen und aktuellen Umweltforschung thematisiert, wie sie sich seit den 1990er Jah­
ren durch die Digitalisierung ergeben haben. In der Darstellung wird kurz die klassische,
analoge Analyse von Textquellen mit ihrer aufwendigen Archivarbeit, der Transkription
und quellenkritischen Interpretation skizziert. Darauf aufbauend wird die neuere Ent­
wicklung, wie sie sich im Kontext der Digitalisierung ergibt, vorgestellt. Diese umfasst
die Einbindung in Datenbanken und die dafür notwendige Kodierung bis zur Integration
in virtuelle Forschungsumgebungen am Beispiel von tambora.org. Des Weiteren wird auf
die Besonderheiten der Verstetigung und nachhaltigen Sicherung sowie der Publikations­
möglichkeiten eingegangen.

                                           561
Rüdiger Glaser, Michael Kahle, Franck Borel, Rafael Hologa, Oliver Rau und Antje Kellersohn

   Schließlich werden die Potenziale neuer Auswertungsformate von Künstlicher Intel­
ligenz und anderen Analyseverfahren sowie die Möglichkeiten von Crowdsourcing und
automatischen Verfahren wie Data Harvesting thematisiert.

Summary: Texts as basic elements of environmental research –
from classical analysis to databases and collaborative research
environments towards machine learning and crowdsourcing

This paper addresses the far-reaching methodological changes in text-based historical and
contemporary environmental research that have occurred since the 1990s as a result of
digitisation. The paper briefly outlines the classical analogue analysis of text sources with
its laborious archival work, transcription, and source-critical interpretation.
   Based on this, the more recent development, as it arises in the context of digitisation, is
presented. This includes the integration into databases and the coding necessary for this
up to the integration into collaborative research environments (CRE) using the example of
tambora.org. In addition, the particularities of the continuation and sustainable preserva­
tion as well as the publication possibilities will be discussed.
   Finally, the potentials of new evaluation formats of artificial intelligence and other ana­
lysis methods as well as the possibilities of crowdsourcing and automatic methods such as
data harvesting will be addressed.

Literatur

Amling, K. (2018): Bratwurst und Flamingos in Marktsteft, Main Post, https://web.archive.org/
 web/20210408120805/https://www.mainpost.de/regional/kitzingen/bratwurst-und-flamingos-in-
 marktsteft-art-10039397 (Zugriff: 31. Mai 2021).
Börngen, M. u. Tetzlaff, G. (2000): Quellentexte zur Witterungsgeschichte Europas von der Zeiten­
  wende bis zum Jahr 1850, Bd. 5. – Berlin u. Stuttgart.
Borel, F. (2010): HISKLIDCore, Expressum Nr. 6; UB Freiburg,
  https://ojs.ub.uni-freiburg.de/exp/article/view/389/338 (Zugriff: 31. Mai 2021).
Bruijn, J. A. de; de Moel, H. u. Jongman, B. (2019): A global database of historic and real-time flood
  events based on social media. – In: Sci Data 6, S. 311, https://doi.org/10.1038/s41597-019-0326-9.
Dzudzek, I.; Glasze, G. u. Mattissek, A. (2020): Diskursanalyse als Methode der Humangeographie. –
  In: Lehrbuch Geographie. – Berlin.
Erfurt, M.; Glaser, R. u. Blauhut, V. (2019): Changing impacts and societal responses to drought
  in southwestern Germany since 1800. – In: Regional Environmental Che, S. 1–13,
  https://doi.org/10.1007/s10113-019-01522-7.

                                                 562
Texte als Bausteine der Umweltforschung

Erfurt, M.; Skiadaresis, G.; Tijdeman, E.; Blauhut, V.; Bauhus, J; Glaser, R.; Schwarz, J.; Tegel, W.
  u. Stahl, K. (2020): A multidisciplinary drought catalogue for southwestern Germany dating
  back to 1801. – In: Nat. Hazards Earth Syst. Sci., 20 (11), S. 2979–2995, https://doi.org/10.5194/
  nhess-20-2979-2020.
García‐Herrera, R.; Können, G. P.; Wheeler, D. A.; Prieto, M. R.; Jones, P. D. u. Koek, F. B. (2005):
  CLIWOC: a climatological database for the World’s oceans 1750–1854. – In: Climatic Change 73,
  S. 1–12.
Glaser, R.; Schenk, W. u. Schröder, A. (1991): Die Hauschronik der Wiesenbronner Familie Hüß­
  ner. Ihre Aufzeichnungen zu Wirtschaft, Geschichte, Klima und Geographie Mainfrankens von
  1750–1894. – In: Materialien zur Erforschung früherer Umwelten (MEFU) 1, S. 1–57.
Glaser, R. (1996): Data and Methods of Climatological Evaluation in Historical Climatology. – In:
  HSR (Historical Social Research) Vol. 21, 4, S. 56–88.
Glaser, R. (2013): Klimageschichte Mitteleuropas. 1200 Jahre Wetter, Klima, Katastrophen: [mit Pro­
  gnosen für das 21. Jahrhundert]. Sonderausgabe, 3., unveränd. Aufl. – Darmstadt.
Glaser, R. u. Riemann, D. (2009): A thousand-year record of temperature variations for Germany
  and Central Europe based on documentary data. – In: Journal of Quaternary Science, 24 (5),
  S. 437–449.
Glaser, R.; Himmelsbach, I. u. Bösmeier, A. (2017): Climate of migration? How climate triggered mi­
  gration from southwest Germany to North America during the 19th century. – In: Climate of the
  Past, 13, S. 1573–1592, https://doi.org/10.5194/cp-13-1573-2017.
Glaser, R.; Riemann, D.; Vogt, S. u. Himmelsbach, I. (2018): Long- and Short-Term Central European
  Climate Development in the Context of Vulnerability, Food Security, and Emigration. – In: Leg-
  gewie, C. u. Mauelshagen, F. [Hrsg.]: Climate Change and Cultural Transition in Europe. – Berlin
  (Climate und Culture 4), S. 85–118.
Glaser, R.; Hologa, R.; Bösmeier, A.; Heim, B.; Kahle, M.; Scholze, N. u. Schliermann-Krauss, E. (2020):
  Klimageschichte der Frühneuzeit als Topos der universitären Forschung und Lehre. Die Kleine
  Eiszeit (1430–1830) in Unterricht und Lehre, 120, S. 105–125.
Glaser, R. u. Kahle, M. (2020): Reconstructions of droughts in Germany sin­
  ce 1500 – combining hermeneutic information and instrumental records in historical
  and modern perspectives. – In: Clim. Past (Climate of the Past), 16, S. 1207–1222:
  https://cp.copernicus.org/articles/16/1207/2020/cp-16-1207-2020-discussion.html, (Zugriff: 31. Mai
  2021).
Glaser, R.; Kahle, M.; Kellersohn, A. u. Rau, O. (2020): Dem Klimawandel auf der Spur. Der Weg
  schriftlicher Quellen aus den Archiven in die virtuelle Forschungsumgebung. – In: Archivnach­
  richten, 60, S. 8–14.
Heim, B.; Glaser, R.; Kahle, M. u. Hologa, R. (2018): Westmittelfranken (1016–1840).
  DOI: 10.6094/tambora.org/2018/c331/csv.zip.
Ionita, M.; Dima, M. u. Nagavciuc, V. (2021): Past megadroughts in central Europe were longer, more
  severe and less warm than modern droughts. – In: Commun Earth Environ 2, 61,
  https://doi.org/10.1038/s43247-021-00130-w.
Kahle, M.; Glaser, R. u. Hologa, R. (2020): Virtuelle Forschungsumgebungen – neue Formen kol­
  laborativer Zusammenarbeit. – In: Geographie. Physische Geographie und Humangeographie,
  S. 205–212.
Kahle, M. u. Glaser, R. (2020): Fossgis2020: Javascript-Bibliotheken zur Einbindung von historischen
  Umwelt-und Klimainformationen als Kartenlayer, DOI: 10.13140/RG.2.2.34723.40481 u. DOI:
  10.5446/46488.

                                                  563
Sie können auch lesen