Prognose für die USA 14.04.2020 Prognosen bestätigter Neuinfektionen

Die Seite wird erstellt Milla Altmann
 
WEITER LESEN
Prognose für die USA 14.04.2020 Prognosen bestätigter Neuinfektionen
Der biostatistische Corona-Blog

Von Dr. habil. Steffen Uhlig, Berlin

14.04.2020 Prognosen bestätigter Neuinfektionen
Prognose für die USA
Die Trendindikatoren deuten seit Anfang April auf einen recht stabilen Trend hin, so dass
eine Prognose für die USA möglich geworden ist. Der auf der folgenden Seite prognostizierte
Kurvenverlauf deutet darauf hin, dass der Peak der (ersten) Welle in der letzten Woche
erreicht wurde; seitdem ist mit einem kontinuierlichen Rückgang neuer Infektionen zu
rechnen, bis zu einem Unterschreiten der Schwelle von 5000 bestätigten Infektionen
vermutlich in der ersten Maihälfte.

Naturgemäß sind weit in die Zukunft gerichtete Prognosen fast immer falsch bzw. sie gelten
nur bis zu einem bestimmten Zeitpunkt – den man aber zu Beginn nicht kennt. Dieser
Zeitpunkt ergibt sich daraus, dass sich erfahrungsgemäß die Bedingungen und
Voraussetzungen der Prognose früher oder später mehr oder weniger abrupt ändern und
damit auch die Prognose – meist – in einem scheinbaren Desaster endet.

Zunächst einmal ist klar, dass die Kurve nur so lange Bestand haben kann, solange die
aktuellen Eindämmungsmaßnahmen wirksam sind. Sobald diese Maßnahmen schrittweise
aufgehoben werden, und sei es auch nur, dass dies in einzelnen Bundesstaaten erfolgt,
könnte die Aufhebung einzelner Maßnahmen in der Bevölkerung als Signal verstanden
werden, dass individuelle Bemühungen um physische Distanzierung nicht mehr so wichtig
sind.

Angesichts der stark ausgeprägten Heterogenität der Bevölkerung in den USA kann auch
nicht ausgeschlossen werden, dass bestimmte Bevölkerungsgruppen noch gar nicht erreicht
wurden, in denen das Virus aber möglicherweise – zum Beispiel aus religiösen Gründen - ein
leichtes Spiel hat.

Copyright 2020 QuoData GmbH - Quality and Statistics!
Wenn wir eine Prognose erstellen, so schauen wir uns jeweils an, ob der beobachtete
Verlauf dem prognostizierten Verlauf entspricht. Treten systematische Abweichungen auf, ist
davon auszugehen, dass der für die Prognose unterstellte Mechanismus nicht mehr zutrifft.
Umso wichtiger ist es dann, die Effekte zu identifizieren, welche zu dem veränderten
Kurvenverlauf führen.

Aus diesem Grund schauen wir uns nun die am 06.40.2020 prognostizierten Kurvenverläufe
für Deutschland, Spanien, Italien und Großbritannien im Vergleich zu den bislang berichteten
Infektionen an.

Copyright 2020 QuoData GmbH - Quality and Statistics!
Überprüfung der Prognosen vom 06.04.2020
In den folgenden Grafiken sind für Deutschland, Spanien und Großbritannien die gemeldeten
Neuinfektionen zusammen mit den Prognosen vom 06.04.2020 zusammengestellt. Die
aktuellen Zahlen liegen im prognostizierten Bereich.

Copyright 2020 QuoData GmbH - Quality and Statistics!
Copyright 2020 QuoData GmbH - Quality and Statistics!
Einzig für Italien entspricht der Verlauf nicht dem prognostizierten Trend. So hat sich die Zahl
der bestätigten Neuinfektionen in Italien in der letzten Woche nicht weiter reduziert. Vielmehr
ist für den 08.04.2020 ein deutlicher Sprung von ca. 3000 auf nahezu 4000 Neuinfektionen
zu verzeichnen, und unsere Warnung vom 06.04.2020, dass der Trend früher oder später
mehr oder weniger abrupt enden könnte, hat sich früher als erwartet bewahrheitet. Seit dem
08.04.2020 pendeln die täglichen Neuinfektionen im Bereich um 3800-4700. Gibt es hierfür
eine Erklärung?

Werfen wir einen Blick auf die Zahl der täglich durchgeführten Tests sowie auf den
prozentualen Anteil positiver Tests (Grafik auf der folgenden Seite). Für die Zahl der täglich
durchgeführten Tests (rote Linie, rechte Skala) ist ein deutlicher Aufwärtstrend zu erkennen,
wobei jeweils am Montag ein besonders niedriger Wert zu verzeichnen ist. Gleichzeitig geht
der prozentuale Anteil bestätigter Fälle kontinuierlich zurück. Lag dieser Anteil Mitte März bei
25-30%, so waren es zwischen dem 02.04.2020 und dem 06.04.2020 im Mittel 12,2%, und
zwischen dem 07.04.2020 und dem 11.04.2020 im Mittel nur noch 8,2%.

Copyright 2020 QuoData GmbH - Quality and Statistics!
Die folgende Tabelle gibt einen Überblick über diese beiden Perioden:

Period        Time           Average      Average number    Average rate    Min – Max of daily
                           daily number    of confirmed     of confirmed     rate of confirmed
                             of tests         cases            cases              cases
  1      02.04. – 06.04.      36062           4395             12,2%          11,7% - 12,9%
  2      07.04. – 11.04.      48348           3945              8,2%           7,4% - 8,2%

Gegenüber Periode 1 hat sich die Zahl der täglichen Tests in Periode 2 um 34% erhöht.
Diese Zunahme kann nur bedeuten, dass die Auswahlkriterien für die Testung einer Person
gelockert wurden, denn gleichzeitig hat sich ja die Zahl bestätigter Fälle reduziert. Weil in
Italien – ebenso wie in Spanien – der Mortalitätsfaktor auf Basis der Zahl der Infektionen vor
7 Tagen immer noch sehr hoch ist, spricht vieles dafür, dass die Dunkelziffer unentdeckter
Infektionen derzeit im Bereich von ca. 10-20 liegt, d.h. auf eine bestätigte Diagnose kommen
ca. 10-20 nicht diagnostizierte Infizierte. Eine Ausweitung der Tests führt daher sehr
wahrscheinlich zu einer Erhöhung der Zahl der bestätigten Diagnosen. Vieles spricht deshalb
dafür, dass bei Beibehaltung der bisherigen Auswahlkriterien die Zahl bestätigter
Neuinfektionen in Periode 2 im Einklang mit unserer Prognose deutlich zurückgegangen
wäre.

Die Ausweitung der Testung kann zwar dazu führen, dass sich die Zahl der bestätigten
Neuinfektionen zunächst auf ein Mehrfaches des zunächst prognostizierten Wertes erhöht.
Jedoch gehen wir nicht davon aus, dass sich dadurch der von uns prognostizierte
Trendverlauf um mehr als 10 Tage verzögert.

Eine deutliche Ausweitung der Testung ist seit wenigen Tagen auch in Spanien zu
beobachten, so dass sich auch dort der prognostizierte Trendverlauf um einige Tage
verzögern könnte. Ähnliche Effekte sind ggf. auch für die USA zu erwarten.

Copyright 2020 QuoData GmbH - Quality and Statistics!
07.04.2020 14-Tages-Prognosen bestätigter Neuinfektionen
Italien
Werfen wir zunächst einen Blick auf die aktuellen bestätigten Neuinfektionen der letzten 4
Tage und vergleichen sie mit unserer Prognose vom 02.04.2020. Hierzu haben wir in der
folgenden Grafik aus dem Blog vom 03.04.2020 zusätzlich die für Italien berichteten
Neuinfektionen vom 03.04.2020 bis zum 06.04.2020 eingetragen:

Es ist zunächst festzuhalten, dass die in den letzten 4 Tagen bekannt gegebenen Zahlen
bislang nicht signifikant von dem prognostizierten Verlauf abweichen. Dennoch fällt auf, dass
alle Zahlen der letzten 4 Tage oberhalb der bislang prognostizierten Kurve liegen. Damit
stellt sich die Frage, wie sich der prognostizierte Verlauf ändert, wenn alle Daten bis zum
06.04.2020 einbezogen werden. Das von uns verwendete Prognoseverfahren liefert hierfür
das folgende Ergebnis:

Copyright 2020 QuoData GmbH - Quality and Statistics!
Die Abbildung zeigt, dass im Vergleich zur Prognose vom 02.04.2020 (blau gepunktete
Kurve) die Trendkurve der aktuellen Prognose etwas höhere Fallzahlen ausweist, dass aber
die aktuelle Trendkurve nahezu parallel zur Trendkurve vom 02.04.2020 verläuft. Der
Unterschied der beiden Kurven liegt im Unsicherheitsbereich der neuen Kurve. Wir können
also nach wie vor davon ausgehen, dass bei Fortsetzung des aktuellen Trends in der
zweiten Aprilhälfte ein Rückgang auf 200 Fälle pro Tag möglich sein sollte. Ich möchte aber
auch darauf hinweisen, dass dieser Trend früher oder später vermutlich mehr oder weniger
abrupt stoppen könnte. Dies jedenfalls legen die bisherigen Erfahrungen in China und in
Südkorea nahe.

Copyright 2020 QuoData GmbH - Quality and Statistics!
Spanien
Mittlerweile zeichnet sich auch in Spanien ein leichter Rückgang der Neuinfektionen ab.
Gleichzeitig weisen die gemeldeten Zahlen inzwischen deutlich geringere erratische
Schwankungen auf, was eine Prognose deutlich vereinfacht. Hier also nun die Prognose auf
Basis der Zahlen vom gestrigen Abend:

Diese Prognose spricht also für einen weiteren deutlichen Rückgang der Neuinfektionen in
den kommenden zwei Wochen und eine Unterschreitung der Marke von 1000
Neuinfektionen bis Ende April.

Copyright 2020 QuoData GmbH - Quality and Statistics!
Deutschland
Auch in Deutschland nahmen der gemeldeten Zahlen zuletzt sehr stark ab. Dabei ist aber zu
beachten, dass auch in den letzten Wochen bei den gemeldeten Neuinfektionen
beträchtliche Schwankungen von Tag zu Tag zu verzeichnen waren. Es ist daher davon
auszugehen, dass der Trend bei den Neuinfektionen schwächer sein wird, als es die aktuell
berichteten nackten Zahlen der letzten 4 oder 5 Tage suggerieren:

Für die zweite Aprilhälfte erwarten wir ebenso wie für Spanien eine Unterschreitung der Zahl
von 1000 bestätigten Neuinfektionen.

Copyright 2020 QuoData GmbH - Quality and Statistics!
Großbritannien
In Großbritannien sehen wir nach wie vor deutlich ansteigende Neuinfektionen. Gleichwohl
sind auch hier die Zeichen unverkennbar, dass der Trendverlauf in Kürze sein Maximum
erreicht haben wird oder bereits erreicht hat. Hier der prognostizierte Verlauf:

Der Konfidenzbereich, der durch die rote und grüne Kurve markiert wird, ist offenkundig weit
größer als bei Italien, Spanien oder Deutschland. Dies hängt damit zusammen, dass die
bisher zu beobachtende Verlangsamung des Wachstums der Neuinfektionen noch nicht sehr
ausgeprägt ist. Dennoch erwarten wir auch für Großbritannien spätestens im Mai einen
Rückgang auf unter 1000 Neuinfektionen pro Tag.

Copyright 2020 QuoData GmbH - Quality and Statistics!
04.04.2020 7-Tages-Prognosen der Todesfallzahlen
USA
Die Zahl der bestätigten Diagnosen in den USA ist in den letzten Tagen sehr stark gestiegen,
so dass Ähnliches nun auch für die Todesfallzahlen zu befürchten ist. Tatsächlich sind diese
Zahlen in den letzten Tagen stark angestiegen. Der sich aus den Zahlen der letzten 5 Tage
ergebende exponentielle Trend erreicht in einer Woche einen Wert von mehr als 32000
Todesfällen. Dieser Trend ist in der folgenden Grafik als rot gepunktete Kurve eingezeichnet.
Bei einem linearen Verlauf würde sich die grün gepunktete Kurve ergeben. Die blaue Kurve
beschreibt den Verlauf, den unser Prognosemodell liefert. Danach steigt die Zahl der
Todesfälle binnen einer Woche auf einen Wert von gut 18000.

Dieser gegenüber einer exponentiellen Entwicklung deutlich reduzierte Wert erklärt sich aus
dem Umstand, dass zuletzt die Sterblichkeitsrate in der Gruppe der Fälle mit bestätigten
Diagnosen kontinuierlich gesunken ist. Der Mortalitätsfaktor für die Zahl der Todesfälle
bezogen auf die Zahl bestätigter Diagnosen eine Woche zuvor lag am 8. März 2020 noch bei
22.5, nun aber nur noch bei 7, bei weiter fallender Tendenz. Dies deutet darauf hin, dass
möglicherweise ein erheblicher Anteil des zuletzt beobachteten Anstiegs bei den bestätigten
Diagnosen auf eine starke Ausweitung der Testungen zurückzuführen ist.

Copyright 2020 QuoData GmbH - Quality and Statistics!
Italien
Wie es sich bei den italienischen Zahlen der täglich neu bestätigten Diagnosen bereits seit
einigen Tagen andeutet, ist in Kürze mit einem weniger starken Zuwachs bei den
Todesfällen zu rechnen. Dabei legen unsere Prognosen nahe, dass der Rückgang sogar
noch etwas stärker ausfallen könnte, als es die Kurven für die bestätigten Diagnosen
erwarten lassen würden: Nachdem an den letzten 7 Tagen durchschnittlich knapp 800
Todesfälle hinzugekommen sind, könnte dieser Wert in den kommenden Tagen auf gut 570
Todesfälle sinken. Verantwortlich für den stärkeren Rückgang des Prognosewertes ist der
Umstand, dass sich die Sterblichkeit in der Gruppe jener Personen, bei denen eine Diagnose
bestätigt wurde, zuletzt leicht reduziert hat: Der Mortalitätsfaktor für die Zahl der Todesfälle
bezogen auf die Zahl bestätigter Diagnosen eine Woche zuvor pendelte im Zeitraum
zwischen dem 08.03.2020 und dem 25.03.2020 im Bereich zwischen 21 und 27, ist aber
seitdem weiter gesunken und lag zuletzt nur noch bei 17, bei weiter fallender Tendenz. Dies
könnte ein Hinweis darauf sein, dass zunehmend auch Personen getestet wurden, bei denen
die Krankheit einen weniger schweren Verlauf genommen hat. Es könnte aber auch
bedeuten, dass sich die Situation in den italienischen Kliniken zuletzt gebessert hat.

Die 7-Tages-Prognose ist in der folgenden Abbildung als blaue durchgezogene Linie
wiedergegeben. Zusätzlich dargestellt ist der exponentielle Trend als rot gepunktete Kurve
sowie der lineare Trend als grün gepunktete Linie.

Copyright 2020 QuoData GmbH - Quality and Statistics!
Für die Zahl der Todesfälle am 10.04.2020 prognostiziert das Modell einen Wert von ca.
18000 Personen. Das ist deutlich weniger, als auf Basis einer simplen linearen oder
exponentiellen Trendfortschreibung zu erwarten wäre.

Copyright 2020 QuoData GmbH - Quality and Statistics!
Deutschland
Bei der Entwicklung der Todesfallziffern in Deutschland war zuletzt ein exponentieller
Anstieg mit abnehmenden Wachstumsraten festzustellen. Bereits die gestrige Prognose
lieferte für den weiteren Verlauf eine nahezu lineare Entwicklung. Dies Entwicklung bestätigt
sich mit der heutigen Prognose.

Der sich aus den Zahlen der letzten 5 Tage ergebende exponentielle Trend erreicht in einer
Woche einen Wert von mehr als 4000 Todesfällen. Dieser Trend ist in der folgenden Grafik
als rote gepunktete Kurve eingezeichnet. Bei einem linearen Verlauf würde sich die grün
gepunktete Kurve ergeben. Die blaue Kurve beschreibt den Verlauf, den unser
Prognosemodell liefert. Danach steigt die Zahl der Todesfälle bis zum 10.04.2020 auf einen
Wert von gut 2500. Dass der prognostizierte Anstieg der Todesfälle nunmehr nur noch einer
linearen Entwicklung folgt, erklärt sich maßgeblich mit der ebenfalls zuletzt nur noch linearen
Entwicklung bei der Zahl bestätigter Diagnosen.

Copyright 2020 QuoData GmbH - Quality and Statistics!
03.04.2020 7-Tages-Prognose der Todesfallzahlen für Deutschland

Das am 26.03.2020 vorgestellte Verfahren zur Prognose der Todesfallzahlen 7 Tage im
Voraus hat den weiteren Verlauf in Deutschland sehr genau prognostiziert. Die Prognose für
den 02.04.2020 lautete 1191 Todesfälle auf Basis der Zahlen vom 26.03.2020 bzw. 1168
Todesfälle auf Basis der Zahlen vom 27.03.2020. Tatsächlichen waren 1107 Todesfälle zu
verzeichnen. Der Prognosefehler lag somit bei nur 5-8%. Dies bedeutet nicht, dass das
Prognoseverfahren immer so genau arbeitet – aufgrund von Simulationsrechnungen hatten
wir maximale Abweichungen in der Größenordnung von 15% erwartet; dennoch zeigt die
Prognose die Leistungsfähigkeit geeigneter KI-basierter mathematisch-statistischer
Methoden. Ich möchte ausdrücklich darauf hinweisen, dass das verwendete Verfahren kein
reines KI-Verfahren ist, sondern dass es sich um einen modellbasierten mathematisch-
statistischen Ansatz handelt, dessen Parameter unter Verwendung von KI-Methoden
spezifiziert wurden. Die Ermittlung des Prognosefehlers ist kein Selbstzweck. Wichtig ist die
Kenntnis des Prognosefehlers bereits dann, wenn man die Prognosen für die
Ressourcenplanung der Krankenhäuser einsetzen möchte.

Die folgende Grafik zeigt nun die Prognose für die Todesfallzahlen bis zum 09.04.2020,
diesmal auf Basis der Daten bis zum 02.04.2020. Bis zum 09.04.2020 werden 2427
Todesfälle prognostiziert. Wie schon zuvor, basieren die Prognosen auf den Daten der Johns
Hopkins University.

Copyright 2020 QuoData GmbH - Quality and Statistics!
Copyright 2020 QuoData GmbH - Quality and Statistics!
02.04.2020 Weniger als 200 bestätigte tägliche Neuinfektionen in der zweiten
Aprilhälfte in Italien möglich

Wie es scheint, hat sich in Italien die Zahl der täglichen Diagnosen etwas reduziert, und es
besteht Hoffnung auf einen weiteren Rückgang. Wir haben nun unter der Annahme, dass die
aktuellen Bedingungen weiterhin gelten, eine Prognose der weiteren Entwicklung der
Fallzahlen berechnet. Diese Prognose ist in der folgenden Grafik durch einen schwarzen
Kurvenzug beschrieben. Es handelt sich um eine Trendkurve, die um die zufälligen
Tagesschwankungen bereinigt wurde. Zusätzlich ist in der Grafik der Vertrauensbereich
dieser Trendkurve bestimmt, der sich daraus ergibt, dass die Trendkurve aufgrund der
zufälligen Tagesschwankungen eine gewisse Unsicherheit aufweist.

Es ist zu erkennen, dass die Entwicklung in Italien nun endlich eine positive Richtung
eingeschlagen hat. Setzt sich die Entwicklung so fort, könnte zwischen dem 15.04. und dem
27.04. der Trendwert für die tägliche Zahl bestätigter Diagnosen den Wert 200
unterschreiten. Dafür gibt es jedoch keine Garantie, zumal die vermeintliche Verbesserung
der Situation möglicherweise dazu führt, dass in Teilen der Bevölkerung das Niveau der
sozialen Distanzierung nicht mehr im gleichen Maße aufrechterhalten wird. Das jedoch wird

Copyright 2020 QuoData GmbH - Quality and Statistics!
in den kommenden Tagen eine entscheidende Voraussetzung für die weitere Eindämmung
der Epidemie sein.

Anzumerken bleibt noch, dass der hier mit den roten und grünen Kurven dargestellte
Vertrauensbereich für die Fallzahlen nicht mit dem Vorhersagebereich für die Tageswerte
verwechselt werden darf. Dieser Vorhersagebereich ist aufgrund der starken Schwankungen
der Tageswerte deutlich breiter als der Vertrauensbereich. Mit anderen Worten: Die
Prognose wird nicht dadurch ungültig, dass einzelne Tageswerte deutlich außerhalb des
angegebenen Vertrauensbereichs liegen. Erst wenn systematische Abweichungen über
mehrere Tageswerte nacheinander festzustellen sind, ist davon auszugehen, dass die
Bedingungen, die der Prognose zugrunde lagen, keine Gültigkeit mehr haben.

Copyright 2020 QuoData GmbH - Quality and Statistics!
27.03.2020 Eine 7-Tages-Prognose für die Todesfälle der COVID-19 Welle

Das gestern vorgestellte Verfahren zur 7-Tages-Prognose der Todesfälle hatte für heute 350
Todesfälle vorhergesagt, tatsächlich berichtet werden 323 (Johns Hopkins University und
Morgenpost.de) bzw. 342 Todesfälle (Worldometers.info). Dass der Prognosefehler nach
einem Tag ähnlich groß ist wie die Abweichungen zwischen den Datenbanken, ist einerseits
ein gutes Zeichen im Hinblick auf die Leistungsfähigkeit des Prognoseverfahrens,
andererseits nach einem Tag eigentlich auch nicht anders zu erwarten. Nach 7 Tagen sind
naturgemäß deutlich größere Fehler zu erwarten.

Wir haben das Prognoseverfahren im Laufe des heutigen Tages mit den längeren Zeitreihen
aus China und Italien trainiert und dann anhand der inzwischen bereits etwas längeren
Zeitreihen aus Frankreich, Spanien und den USA verifiziert. Dabei hat sich gezeigt, dass das
modifizierte Verfahren für die Entwicklung der Todesfälle in Hubei und in China ohne Hubei
im Wesentlich eine brauchbare Prognose abzugeben scheint. Auch für Italien, Frankreich
und die USA scheint es gute Vorhersagen zu treffen. Für Spanien hingegen ist das System
jedenfalls derzeit nicht einsetzbar: die 7-Tagesprognose war für Spanien in den meisten
Fällen deutlich zu hoch.

Schauen wir uns die prognostizierten Todesfälle für Deutschland an. In der folgenden Grafik
findet sich neben den bereits gestern dargestellten Kurven für die Prognose am 26.03.2020,
für die loglineare Extrapolation sowie für den konstanten Mortalitätsfaktor MF nun auch eine
Prognosekurve für die Prognose am 27.03.2020. Es ist überraschend zu sehen, dass die
beiden Prognosen für den 02.04.2020 zu fast dem gleichen Ergebnis kommen.
Unterschiedlich sind die Prognosen allerdings auf dem Weg dahin. Auffällig ist der Umstand,
dass sich der Abstand zwischen den Prognosekurven und der loglinearen Extrapolation
zusehends vergrößert: dies bedeutet, dass der Anstieg der Todesfälle den ursprünglichen
exponentiellen Pfad zusehends verlässt und etwas langsamer vonstattengeht.

Copyright 2020 QuoData GmbH - Quality and Statistics!
Copyright 2020 QuoData GmbH - Quality and Statistics!
26.03.2020
Sind quantitative Prognosen für die COVID-19-Welle möglich?

In den Zeitungen ist in diesen Tagen zu lesen, dass sich die deutschen Kliniken derzeit für
die große COVID-19- Welle wappnen, indem zusätzlicher Platz geschaffen wird und übrige
Patienten in dafür geeignete Reha-Kliniken verlegt werden. Es ist jedoch noch unklar, wie
viele COVID-19-Patienten tatsächlich aufgenommen werden müssen, und wann die
Kapazitätsgrenze der Intensivstationen erreicht werden wird. Meines Wissens nach liegen
derzeit keine geeigneten Daten vor, mit denen man die Zahl der Intensivpatienten
hochrechnen könnte.

Was uns vorliegt, sind die Todesfälle der vergangenen Tage. Wenn man weiß, wie viele
Intensivpatienten auf einen Todesfall kommen, könnte man versuchen, eine Prognose der
Todesfälle vorzunehmen, um auf dieser Basis eine Abschätzung der benötigten Betten
erhalten.

Bekanntlich sind die derzeit verfügbaren Daten nicht sehr belastbar. Bestätigte Diagnosen
werden oft erst mehrere Tage später nachgemeldet, so dass Trendanalysen ebenfalls erst
Tage später, wenn die betreffende Fragestellung oft nicht mehr relevant ist, wirklich reliabel
sind. Ignorieren kann man den Effekt dieser nachgemeldeten Fälle leider nicht: die
Auswirkungen auf die statistischen Analysen waren am letzten Wochenende und an den
Tagen danach so beträchtlich, dass eine sinnvolle aktuelle Verwertung der Daten nicht mehr
möglich war. Wir haben uns aus diesem Grund entschieden, für Auswertungen nach
Möglichkeit andere Datenbanken zu verwenden, z.B. die Datenbank von Johns Hopkins
University, Worldometers.info und Morgenpost.de. Auch in diesen Datenbanken sind Fehler
z.B. aufgrund von Doppelmeldungen festzustellen, doch ist der Umfang dieser Fehler nach
unserer Erfahrung deutlich kleiner als die Fehler aufgrund später Nachmeldungen.

Was leider in keiner der genannten Datenbanken für Deutschland verfügbar ist, sind die
nach Alterskohorte sortierten Daten für jeden einzelnen Tag. Wenn es zutreffen sollte, dass
bei den 20 bis 29-Jährigen der Anteil der Infizierten zu Beginn der Epidemie deutlich höher
ist als bei älteren Kohorten, könnte sich im Verlaufe der Epidemie der Anteil der besonders
gefährdeten Personen langsam erhöhen, mit der Folge, dass der Bedarf an Intensivbetten
erheblich ansteigen könnte. Alle Prognosen hinsichtlich des Bedarfs von Intensivbetten
wären damit obsolet. Jegliche Prognose muss also unterstellen, dass sich die Epidemie in

Copyright 2020 QuoData GmbH - Quality and Statistics!
allen Kohorten gleichmäßig ausbreitet, und weiterhin, dass die in den oben genannten
Datenbanken enthaltenen Daten näherungsweise richtig sind. Dieses Risiko können wir nur
ausschließen durch Bereitstellung entsprechender Zeitreihen, in denen für jeden Tag auch
genannt wird, wie groß der prozentuale Anteil jeder Altersgruppe wird.

Wie kann man nun die Todesfälle prognostizieren?

Das einfachste Verfahren besteht sicherlich darin, anhand der Daten der vergangenen Tage
den prozentualen mittleren täglichen Zuwachs an Todesfällen zu ermitteln und dann
entsprechend die Zahl der Todesfälle hochzurechnen oder zu extrapolieren. Dieses
Verfahren ist zwar sehr einfach, hat aber den Nachteil, dass die Prognose oft sehr ungenau
ist.

Ein weiteres Verfahren basiert auf einem konstanten Mortalitätsfaktor. In früheren
Blogbeiträgen habe ich darauf hingewiesen, dass der Mortalitätsfaktor sich zu Beginn einer
Epidemie sich nur langsam verändert und daher gut verwendet werden kann, um die Zahl
der Todesfälle zu prognostizieren. Schreitet eine Epidemie nun weiter fort und reduziert sich
die Ausbreitungsgeschwindigkeit, trifft das nicht mehr unbedingt zu.

Ein erweiterter Ansatz ist also notwendig, der auch die aktuelle Ausbreitungsgeschwindigkeit
der Epidemie berücksichtigt, so wie es auch der in dem Blogeintrag vom 10.03.2020
beschriebene KI-basierte Ansatz macht. Wir haben diesen Ansatz so modifiziert, dass die
Kurven nicht mehr von chinesischen Daten abhängig sind, sondern nur noch von dem
bisherigen Verlauf der Todesfälle in dem betreffenden Land.

Jedes dieser drei Verfahren habe ich nun auf die für Deutschland verfügbaren Daten
angewandt und eine Prognose der Todesfälle für die kommenden 7 Tage erstellt. Das
Ergebnis finden Sie auf der folgenden Seite.

Offenbar liefert das Verfahren der loglinearen Extrapolation (blau gestrichelte Linie) die
höchsten Werte, während mit dem Verfahren, welches auf einem konstanten
Mortalitätsfaktor (grün) basiert, die niedrigsten Werte berechnet werden. Da die
Ausbreitungsrate bereits deutlich zurückgegangen ist, liegt die Vermutung nahe, dass sich
die verlangsamte Ausbreitung mit Verzögerung auch in einer verlangsamten Zunahme der
Todesfälle niederschlägt. Der oben erwähnte erweiterte Ansatz befindet sich zwischen den
beiden Kurven. Weil wir die vorhin angesprochenen Zahlen bestätigter Diagnosen nach
Alterskohorten in ihrer zeitlichen Entwicklung nicht kennen, können wir für die drei Kurven
leider keine belastbaren Unsicherheitsbereiche angeben. Die tatsächliche Entwicklung der

Copyright 2020 QuoData GmbH - Quality and Statistics!
Todesfälle wird ihren eigenen Weg gehen – die Prognose kann nur aufzeigen, was unter
bestimmten Annahmen passieren könnte.

Copyright 2020 QuoData GmbH - Quality and Statistics!
Copyright 2020 QuoData GmbH - Quality and Statistics!
25.03.2020
Wie lässt sich die Effektivität von Maßnahmen zur Eindämmung der Epidemie
beurteilen?

Eine Vielzahl von Maßnahmen zur Eindämmung bzw. Verlangsamung der Epidemie wurden
in den vergangenen Wochen ergriffen. Um sich ein Bild von der Wirkung dieser Maßnahmen
zu machen, kann man die Zahl der Todesfälle untersuchen oder aber die Zahl der
bestätigten Diagnosen. Illustrativ ist hierbei der Vergleich verschiedener Länder miteinander.
Vergleichen wir also Deutschland mit Italien, dem Land, welches in Europa bislang die
meisten Infektionen und die meisten Todesfälle zu verzeichnen hat.

In der folgenden Abbildung sind die Verlaufskurven der bestätigten Diagnosen für Italien und
Deutschland so gegeneinander verschoben, dass der erste Tag, an dem kumuliert 100 Fälle
überschritten wurden, für beide Länder der gleiche ist. Dieser Tag war in Italien der
22.02.2020 und in Deutschland der 01.03.2020.

                      Bestätigte Diagnosen in Italien und Deutschland
 80000
 70000
 60000
 50000
                           Allgemeine Schulschließungen
 40000
                                  Italien Deutschland
 30000
 20000
 10000
    0
                                                                  22.03.2020
         01.03.2020

                           08.03.2020

                                                                               29.03.2020
                                           15.03.2020

                                          Italy         Germany

Beim Vergleich der beiden Kurven geht es nun nicht um einen Vergleich der absoluten
Zahlen miteinander, denn diese Zahlen sind schon aufgrund der sehr unterschiedlichen
Dunkelziffer nicht vergleichbar. Vielmehr geht es um die Dynamik der Epidemie und

Copyright 2020 QuoData GmbH - Quality and Statistics!
insbesondere um die Frage, ob ein dämpfender Effekt der Schulschließungen erkennbar ist.
Die Schulschließungen wurden in Italien allgemein am 05.03.2020 verfügt und in
Deutschland in der Mehrzahl der Bundesländer am 16.03.2020. Wichtig dabei ist der
Umstand, dass die Zahl der bestätigten Diagnosen in Deutschland am Tag der
Schulschließungen nahezu doppelt so hoch war wie in Italien. Und daher erscheint es auch
plausibel, dass sich wenige Tage nach den Schulschließungen in Italien und noch bevor die
Schulschließungen in Deutschland für die bestätigten Diagnosen wirksam werden konnten,
eine Lücke zwischen den Kurven auftut; in Italien hat sich die Ausbreitungsgeschwindigkeit
in dieser Betrachtungsweise gegenüber Deutschland möglicherweise deutlich verlangsamt.

Ein klareres Bild der möglichen Effekte der Schulschließungen bekommt man, wenn man
den zeitlichen Trend der prozentualen Zunahme der kumulierten Fallzahlen betrachtet:

               Trend der täglichen Zunahme bei den bestätigten Diagnosen
  55%
                                in Italien und Deutschland
  50%                      Allgemeine Schulschließungen
  45%                                 Deutschland
  40%
  35%
  30%
  25%
  20%
  15%
  10%
   5%
   0%
                                           15.03.2020

                                                                  22.03.2020
        01.03.2020

                          08.03.2020

                                                                               29.03.2020

                                         Italy          Germany

Danach ist seit Beginn der Epidemie ein kontinuierlicher Rückgang der Zuwachsraten in
beiden Ländern zu verzeichnen, wobei sich Phasen mit geringerem Rückgang mit Phasen
mit beschleunigtem Rückgang abwechseln. Dass in beiden Ländern bereits ca. drei Tage

Copyright 2020 QuoData GmbH - Quality and Statistics!
nach den Schulschließungen bereits ein beschleunigter Rückgang zu beobachten ist, hat
vermutlich weniger mit den Schulschließungen selbst zu tun, sondern vielmehr damit, dass in
den Tagen davor die Gefahren der Epidemie in der Öffentlichkeit verstärkt diskutiert wurde
und viele kleinere Maßnahmen z.B. in den Unternehmen umgesetzt wurden. Wir können also
anhand dieser Daten nicht sagen, ob die allgemeinen Schulschließungen eindeutig
messbare Effekte haben, und damit können wir auch nicht die Wirksamkeit in Bezug auf die
effektive Reproduktionszahl beurteilen.

Genau diese Beurteilung ist jedoch notwendig, wenn man ein Strategie für die vor uns
liegenden Monate entwickeln will: Auch wenn es gelingen sollte, die Zahl der Neuinfektionen
in den kommenden Wochen auf Null zu bringen, muss damit gerechnet werden, dass nach
einer Pause die Zahlen wieder steigen werden. Wenn die Maßnahmen richtig gesetzt
werden, könnte der Prozess des Anstiegs so verlangsamt werden, dass weitere
ökonomische Schäden in Grenzen gehalten werden können.

Erforderlich dafür wäre u.a. die zeitnahe Bereitstellung der Zahl bestätigter Diagnosen, der
Zahl der Geheilten sowie der Zahl der Todesfälle getrennt für verschiedene Alterskohorten
und getrennt nach Landkreisen.

Abschließend sollte noch erwähnt werden, dass trotz des Rückgangs bei der
Ausbreitungsgeschwindigkeit kurzfristig mit einer deutlichen Zunahme der Todesfälle zu
rechnen ist. Ändert sich das aktuelle Niveau des Mortalitätsfaktors nicht, ist bis um den
01.04.2020 herum mit insgesamt ca. 520-780 Todesfällen in Deutschland zu rechnen.

Copyright 2020 QuoData GmbH - Quality and Statistics!
23.03.2020

Wie genau kann man eigentlich die aktuelle Entwicklung der gemeldeten bestätigten
Diagnosen einschätzen? In der vergangenen Woche stiegen die kumulierten bestätigten
Diagnosen in Deutschland täglich um 20-30%, wobei diese Rate zuletzt deutlich geringer
war. Andererseits gab es offensichtlich Verzögerungen bei der Übermittlung der Daten
einiger Gesundheitsämter, und nicht zuletzt scheinen auch in der für viele Auswertungen
genutzten Datenbank der Johns Hopkins University im Moment (24.03.2020, 6:00) Probleme
bei der Aktualisierung der Daten zu bestehen. Stellt man diese Unsicherheiten in Rechnung,
wird die weitere Prognose und selbst die Bestimmung des aktuellen Trends deutlich
unsicherer. Für die folgenden Analysen lege ich die Daten von Worldometers.info zugrunde.

Betrachten wir für das folgende die Entwicklung der Fallzahlen kumulierter bestätigter
Diagnosen in Deutschland, Italien und Indien:

                  Fallzahlen bestätigter Diagnosen

 20480
  5120
  1280
   320
    80
    20

                          Germany      Italy     India

Offenbar folgen die Fallzahlen in logarithmischer Skalierung in guter Näherung einem
linearen Trend. Schaut man jedoch genauer hin, sieht man, dass dieser lineare Trend für
Deutschland und Italien langsam abnimmt. Ein genaueres Bild dieses Trends erhält man,
wenn man anstelle der kumulativen Fallzahlen den jeweiligen prozentualen Anstieg von
einem Tag auf den nächsten betrachtet, d.h. die Zahl der jeweils neu gemeldeten Fälle als
Prozentwert der bis zum Vortag kumulativ registrierten Fälle ausweist:

Copyright 2020 QuoData GmbH - Quality and Statistics!
Prozentualer täglicher Anstieg der Fallzahlen
 45%
 40%
 35%
 30%
 25%
 20%
 15%
 10%
  5%
  0%

                          Germany       Italy     India

Offenbar schwanken die prozentualen täglichen Anstiege beträchtlich. Dies gilt naturgemäß
für Indien aufgrund der im Vergleich niedrigen absoluten Fallzahlen, es gilt aber auch für
Deutschland und Italien, bei denen sich Zufallseffekte aufgrund individueller Ereignisse
eigentlich weitgehend gegeneinander aufheben sollten. Dass dies nicht der Fall ist, könnte
eine Folge veränderter Teststrategien oder verspäteter Meldungen sein.

Die Entwicklung der Zahlen folgt offenbar nicht durchgängig den Gesetzen der
Normalverteilung. Es gibt zwar Phasen mit vergleichsweise stabiler Entwicklung der
Fallzahlen; diese werden aber unterbrochen durch einzelne „Ausreißer“, plötzlich eintretende
Veränderungen der Dynamik, und teilweise unterlegt durch langsame Veränderungen des
zugrundeliegenden Trends. Um die damit einhergehende Unsicherheit zu erfassen, liegt es
nahe, nicht ein einzelnes konventionelles statistisches Modell oder Zeitreihenmodell
heranzuziehen, sondern gleich mehrere, um dann mit einem KI-basierten Ansatz anhand der
Qualität der Anpassung an die beobachteten Daten zu ermitteln, wie wahrscheinlich es ist,
dass das betreffende Modell tatsächlich die Entwicklung adäquat erfasst. Um diese
Vorgehensweise zu beschreiben, betrachte ich zwei sehr einfache Modelle für den
prozentualen Anstieg der Fallzahlen (auf Basis der logarithmierten Werte). Im ersten Modell
unterstelle ich, dass es im Verlauf der letzten 7 Tage keinerlei Veränderung des
zugrundeliegenden (wahren) Trends gegeben hat, und im zweiten Modell unterstelle ich,
dass an den letzten sieben Tagen sich der Trend der Fallzahlen zeitlich linear verstärkt oder
abgeschwächt hat. Diese beiden Modelle werden dem tatsächlichen Verlauf der Fallzahlen
zwar nur ansatzweise gerecht. Sie sind jedoch sehr einfach interpretierbar.
Copyright 2020 QuoData GmbH - Quality and Statistics!
Beginnen wir mit den Fallzahlen für Deutschland. Während der Anstieg der prozentualen
Fallzahlen zwischen dem 14.03.2020 und dem 20.03.2020 nur geringfügig um 28% herum
pendelte, sind diese Werte an den drei nachfolgenden Tagen deutlich zurückgegangen. Man
könnte also entweder zu dem Schluss kommen, dass die Werte nunmehr im Bereich 10-17%
herum schwanken, oder, dass die beobachteten Rückgänge nur temporärer Natur sind und
der tatsächliche tägliche Anstieg der Fallzahlen eher bei 20-25% liegen könnte. Die folgende
Abbildung zeigt die berechneten Wahrscheinlichkeiten für den derzeit noch unbekannten
kurzfristigen Trend für die Zunahme der Fallzahlen am 23.03.2020.

         Wahrscheinlichkeitsmodell für den Trend der täglichen
              Fallzahlen in Deutschland am 23.03.2020

  0%         5%         10%        15%        20%        25%        30%

Die höchsten Wahrscheinlichkeiten ergeben sich für einen prozentualen Anstieg im Bereich
von 13%. Falls die für das Wochenende bislang gemeldeten Fallzahlen zutreffen sollten,
ergibt sich für diesen Berechnungsansatz weiterhin, dass auch ein deutlich höherer Anstieg
der Fallzahlen im Bereich des Möglichen liegt. Die Unsicherheit der Trendberechnung ist
sehr hoch. Der wahrscheinlichste Bereich liegt zwischen 8% und 25%. Dieses Intervall
entspricht einem Bereich, der 90% Wahrscheinlichkeit abdeckt. Es ist extrem breit, weil die
zuletzt gemeldeten Fallzahlen sehr starke unerwartete Schwankungen aufwiesen.

Nun habe ich für diese Betrachtung außer Acht gelassen, dass wir bereits wissen, dass
dieser deutliche Rückgang für den 21.03.2020 und den 22.03.2020 zumindest zum Teil
durch ausbleibende Meldungen lokaler Gesundheitsbehörden verursacht wurde. Es ist also
nicht davon auszugehen, dass die Zuwachsraten tatsächlich kurzfristig einstellig werden.

Copyright 2020 QuoData GmbH - Quality and Statistics!
Interessant sind die Ergebnisse im Vergleich zu Italien. Hier sind die Schwankungen der
Zuwachsraten derzeit deutlich weniger ausgeprägt, so dass bessere Prognosen möglich
sind:

               Wahrscheinlichkeitsmodell für die Zunahme der
          Fallzahlen in Italien vom 23.03.2020 auf den 24.03.2020

  6,00%        8,00%        10,00%       12,00%       14,00%        16,00%

Für die aktuelle kurzfristige Prognose der Zuwächse der Fallzahlen in Italien erhalte ich
derzeit einen wahrscheinlichsten Wert von gut 12% mit einer Untergrenze von 9% und einer
Obergrenze von 14% (basierend auf approximativen Fehlerwahrscheinlichkeiten von jeweils
nicht mehr als 5%). Hier sieht die kurzfristige Entwicklung also tatsächlich langsam etwas
besser aus.

Für Indien hingegen besteht die Sorge, dass die zuletzt noch moderaten Zuwächse deutlich
zunehmen könnten. Hier das Ergebnis der kurzfristigen Analyse:

Copyright 2020 QuoData GmbH - Quality and Statistics!
Wahrscheinlichkeitsmodell für den Trend der täglichen
                 Fallzahlen in Indien am 23.03.2020

 10%      15%     20%      25%      30%     35%      40%     45%      50%

Für die aktuelle kurzfristige Prognose der Zuwächse der Fallzahlen in Indien berechne ich
mit der gleichen Methode einen wahrscheinlichsten Wert von knapp 22%, mit einer
Untergrenze von 17% und einer Obergrenze von 35%, wobei beiden Grenzen mit einer
Wahrscheinlichkeit von 5% überschritten werden können. Die hohe Obergrenze verdeutlicht,
dass in Indien derzeit ein erhebliches Risiko für rasch ansteigende Fallzahlen besteht. Die in
Indien glücklicherweise bereits jetzt gestarteten sehr weitreichenden Maßnahmen zur
Eindämmung der Epidemie werden voraussichtlich jedoch sehr bald dazu führen, dass der
weitere Anstieg auslaufen wird.

Fazit: Wie bereits an anderer Stelle angemerkt, ist eine hohe Qualität der Daten sowie eine
transparente Darlegung der Teststrategien unverzichtbar, um aus den gemeldeten Zahlen
kurzfristig ableiten zu können, in welche Richtung der aktuelle Trend geht. Je schlechter die
Qualität der Daten, desto später kann man mit entsprechenden Maßnahmen gegensteuern.
Zum gegenwärtigen Zeitpunkt ist festzuhalten, dass tragfähige Aussagen zum jeweiligen
aktuellen Trend auf Basis der nationalen (deutschen) Daten tatsächlich erst im Verlauf von
mindestens einer Woche möglich sind.

Copyright 2020 QuoData GmbH - Quality and Statistics!
21.03.2020

Für Deutschland wurde heute gemäß den Angaben der Johns Hopkins University ein Anstieg
von nur noch 12 % registriert, während es gestern noch 30% waren. Was ist die Ursache für
diesen Rückgang?

Schauen wir auf die Zahlen von Baden-Württemberg und Bayern. Weil die Angaben des RKI
noch nicht auf dem aktuellen Stand sind, beziehe ich mich im Folgenden bei den Zahlen für
Baden-Württemberg auf die Angaben des SWR, der sich seinerseits wiederum auf Angaben
des zuständigen Ministeriums in Stuttgart bezieht. Die Angaben aus Bayern habe ich der
Website des LGL entnommen:

                       Gemeldete Fälle          Gemeldete Fälle       Gemeldete Fälle am
                       (kumulativ) bis          am Freitag, 20.03.    Samstag, 21.03.
                       Donnerstag, 19.03.,
                       (abends)
Baden-Württemberg      2748                     917                   153
Bayern                 3182                     590                   685

Wie dieser Zusammenstellung entnommen werden kann, sind die gemeldeten Fälle in
Baden-Württemberg von Freitag auf Samstag regelrecht auf ein Sechstel des tags zuvor
genannten Wertes eingebrochen, während sie in Bayern leicht gestiegen sind.

Nach Angaben des RKI wurden die neu registrierten Fälle von einigen Gesundheitsämtern
noch nicht berichtet, was aber am Montag nachgeholt werden soll, so dass die korrigierten
Daten ab Dienstag vorhanden sind. Nun ist eine Trendanalyse auf Basis eines lückenhaften
Datensatzes äußerst problematisch, insbesondere dann, wenn nicht bekannt ist, ob bzw. in
welchem Umfang Daten fehlen. Sofern die betreffenden Daten nachgemeldet werden, stellt
sich die Frage, bis wann die Nachmeldung erfolgt, und im vorliegenden Fall erzwingt die
verzögerte Bereitstellung der Daten eine Verzögerung bei der Trendanalyse um immerhin
zwei Tage. In zwei Tagen erhöht sich bei dem derzeitigen Tempo der Ausbreitung von
COVID-19 die Zahl der Infizierten und die Belegung der Intensivbetten um ca. 60-70%.
Damit wird deutlich, dass das derzeit verwendete Verfahren für die Beurteilung der in Kraft
gesetzten Maßnahmen ungeeignet ist. Das Problem beheben ließe sich, wenn alle
Gesundheitsämter auch am Wochenende die bestätigten Fälle melden. Sofern dies personell

Copyright 2020 QuoData GmbH - Quality and Statistics!
aufgrund der enormen Arbeitsbelastung nicht leistbar ist, müsste für die Trendanalyse der
vollständige Datensatz zur Verfügung gestellt werden, in dem alle Fallzahlen aller
Gesundheitsämter aufgelistet sind, samt der fehlenden Daten, die entsprechend
gekennzeichnet werden müssten.

Es ist vermutlich sinnvoller, die Trendanalysen generell getrennt nach Bundesland
vorzunehmen. Dies gilt insbesondere, wenn das Problem verspäteter Meldungen häufiger
auftreten sollte. Dann nämlich bietet es sich für besonders betroffene Bundesländer an, eine
Trendanalyse primär auf Basis von Wochendaten vorzunehmen, um weitere Verzerrungen
weitgehend zu vermeiden. Naturgemäß ist eine Auswertung auf Basis von Tagesdaten in
jedem Falle statistisch reliabler, d.h. bei rechtzeitiger Meldung wird man eher sehen, ob eine
Maßnahme zur Eindämmung von COVID-19 den gewünschten Erfolg gebracht hat.

Copyright 2020 QuoData GmbH - Quality and Statistics!
20.03.2020

Vergleichen wir nochmals die Verlaufskurven für Deutschland mit denen aus China ohne
Hubei. Wie bereits beschrieben, habe ich die Kurven auf der x-Achse so verschoben, dass
der Tag, an dem 1000 bestätigte Diagnosen erreicht wurden, jeweils der gleiche ist. Dieser
Bezugspunkt erscheint auf den ersten Blick willkürlich gewählt, da die Bevölkerung Chinas
so sehr viel größer ist als die Bevölkerung Deutschlands. Doch befindet sich die Epidemie
noch ganz im Anfangsstadium, so dass ein solcher Vergleich erlaubt ist. Mit 1000 bestätigten
Diagnosen hat man außerdem die Gewähr, dass statistische Fehlerschwankungen nur noch
eine untergeordnete Rolle spielen.

                      Fallzahlen bestätigter Diagnosen Deutschland 04.03.-20.03.2020
                                 versus China ohne Hubei 22.01.-19.02.2020
 20000
 18000
 16000
 14000
 12000
 10000
  8000
  6000
  4000
  2000
     0
         04.03.2020

                                                                  18.03.2020
                                  11.03.2020

                                               China ohne Hubei                Germany

Es ist gut zu erkennen, dass die Fallzahlen in Deutschland kontinuierlich ansteigen, während
in China eine deutliche Beruhigung eintritt. Um nun erkennen zu können, wie schnell der
Anstieg der Fallzahlen erfolgt, verwende ich ein statistisches Schätzverfahren für den
prozentualen aktuellen Anstieg. Es ist so konstruiert, dass es auf eine plötzliche und
signifikante Veränderung der Trendentwicklung bzw. des prozentualen Anstiegs unmittelbar
reagiert, bei nichtsignifikanten langsamen Veränderungen hingegen etwas langsamer.

Copyright 2020 QuoData GmbH - Quality and Statistics!
Schätzwert für den Tagestrend für Fallzahlen bestätigter Diagnosen
                                  Deutschland 04.03.-20.03.2020 versus
                                   China ohne Hubei 22.01.-19.02.2020
 70%
 60%
 50%
 40%
 30%
 20%
 10%
  0%

                                                                23.03.2020
       09.03.2020

                                         16.03.2020

                                         China ohne Hubei     Germany

Offenbar nimmt in China ohne Hubei der beobachtete Trend und damit die effektive
Reproduktionszahl täglich und kontinuierlich ab. Für Deutschland hingegen ist festzustellen,
dass der tägliche Anstieg mit knapp 30% über nahezu 2 Wochen praktisch unverändert
geblieben ist. Es sieht nicht so aus, als ob die ergriffenen Maßnahmen bisher großen Erfolg
gezeitigt hätten.

Werfen wir nun aber einen Blick auf den zugehörigen Mortalitätsfaktor, den ich in diesem
Blog bereits mehrfach erprobt und genutzt habe. Dieser Faktor beschreibt im Wesentlichen
das Verhältnis der kumulierten Todesfälle zu den kumulierten Fällen bestätigter Diagnosen,
die 7 Tage zuvor ermittelt wurden. Haben sich die Bedingungen nicht grundlegend geändert,
sollte in der Frühphase einer Epidemie bei gleichbleibendem Trend der Mortalitätsfaktor in
dem betreffenden Zeitraum nahezu konstant bleiben.

Hier also nun der Verlauf des Mortalitätsfaktors für Deutschland, und im Vergleich dazu der
Mortalitätsfaktor für China:

Copyright 2020 QuoData GmbH - Quality and Statistics!
Mortalitätsfaktor Deutschland 11.03.-20.03.2020
                    versus China ohne Hubei 29.01.-19.02.2020
 5

 4

 3

 2

 1

 0
                               18.03.2020

                                                          25.03.2020
     11.03.2020

                               China ohne Hubei     Germany

Offenbar ist der Mortalitätsfaktor für Deutschland keineswegs konstant. Vielmehr ist – nach
einer Phase mit praktisch unveränderten Werten im Bereich zwischen 1 und 1,2 zwischen
dem 11.03.2020 und dem 15.03.2020 - ein kontinuierlicher, nahezu linearer Anstieg auf ein
Niveau von ca. 1,8 festzustellen. Wenn sich also die Bedingungen nicht geändert haben,
wäre heute eher ein Niveau von 1,1 als von 1,8 zu erwarten gewesen. Weil jedoch der
Mortalitätsfaktor bei 1,8 liegt, könnte sich die Gesamtzahl infizierter Personen, inklusive der
nichtdiagnostizierten Personen, in der Vorwoche über die berichteten Zahlen hinaus noch
einmal um den Faktor 1,6-1,7 erhöht haben. Damit dürfte es heute mindestens 34000
infizierte Personen in Deutschland geben. Die Dunkelziffer nicht diagnostizierter, aber
infizierter Personen hat sich möglicherweise erhöht, weil nicht mehr systematisch im Umfeld
von Personen mit bestätigter Diagnose getestet wurde. Hinweise darauf liefert die
Tagespresse, wonach z.B. das Gesundheitsamt des Bodenseekreis seit dem 17.03.2020 nur
noch in sehr gut begründeten Verdachtsfällen einen Test auf CORVID-19 durchführen lässt
(https://www.faz.net/aktuell/politik/inland/coronavirus-krise-wer-darf-sich-noch-testen-lassen-
16688735.html) Ähnliche Pressemeldungen gab es vor einigen Wochen aus der Lombardei.

Vergleicht man den Mortalitätsfaktor nun mit dem entsprechenden Wert für China ohne
Hubei, zeigt sich dort ein ganz anderes Verhalten. Aufgrund der stark abnehmenden
Dynamik in China hätte ich erwartet, dass der Mortalitätsfaktor eher steigt als fällt, weil bei
abnehmender Ausbreitungsgeschwindigkeit Todesfälle nach längerem Krankheitsverlauf
stärker ins Gewicht fallen. Tatsächlich jedoch ist er zunächst weiter gefallen bis auf Werte

Copyright 2020 QuoData GmbH - Quality and Statistics!
unter 0,45, um dann wieder langsam anzusteigen. Während heute der Mortalitätsfaktor in
Deutschland bei 1,8 liegt, liegt der betreffende Wert für den 07.02.2020 in China bei 0,45.
Wenn davon ausgegangen werden kann, dass die Bedingungen vergleichbar sind, sollte der
Mortalitätsfaktor in Deutschland eher kleiner sein als in China (wegen der dort abnehmenden
Dynamik). Da dies nicht der Fall ist, ist zu vermuten, dass die Gesamtzahl infizierter
Personen in Deutschland mindestens 1,8/0,45 = 4 mal größer ist als die Gesamtzahl
bekannter Fälle. Demnach müssten wir heute in Deutschland von mindestens 80000
infizierten Personen ausgehen – sofern die unrealistische Annahme zutrifft, dass in China die
Dunkelziffer bei Null lag. Falls diese Annahme jedoch nicht zutrifft, wäre die Dunkelziffer
noch höher. Der deutliche Anstieg des Mortalitätsfaktors in Deutschland könnte jedenfalls
bedeuten, dass die tatsächliche Wachstumsrate für die Epidemie derzeit nicht bei 28%
täglich liegt, sondern eher etwas höher. Wenn man davon ausgeht, dass sich ab dem
11.03.2020 in vielen Gesundheitsämtern die Vorgehensweisen bei der Testung geändert
haben, könnte der tatsächliche tägliche Anstieg im Verlauf der letzten 5 Tage eher bei 41%
anstelle von 28% gelegen haben. Dies entspricht näherungsweise auch den zuletzt
beobachteten Trendzahlen beim Anstieg der Todesfälle, die an den letzten 5 Tagen im
Tagesdurchschnitt jeweils um 44% zugenommen haben. Ein täglicher Anstieg um 41%
bedeutet, dass die Patientenzahlen binnen 7 Tagen jeweils um den Faktor 11 steigen bzw.
gestiegen sein könnten.

Die hier vorgenommene Betrachtung basiert auf dem Anstieg der Todesfälle zwischen dem
15.03.2020 und dem 20.03.2020, betrifft also den Verlauf der Infektionszahlen der ersten
Märzhälfte. Rechnet man eine typische Inkubationszeit von ca. 4-5 Tagen hinzu, wird klar,
dass die hier diskutierten Trends noch nicht durch die in der letzten Woche umgesetzten
Maßnahmen zur Verlangsamung der Epidemie beeinflusst wurden. Es ist davon
auszugehen, dass diese Maßnahmen in der kommenden Woche deutliche Wirkung zeigen
werden. Dabei muss dann aber neben dem Bundestrend, wie im Blog vom 18.02. dargelegt,
ein stärkerer Bezug auf den jeweiligen Landestrend gelegt werden, weil die von den
einzelnen Bundesländern ergriffenen Maßnahmen unterschiedlich und in unterschiedlicher
zeitlicher Taktung umgesetzt werden. Die hier angestellten Betrachtungen sollen primär dazu
dienen, eine Vergleichsbasis bereitzustellen, um die Wirksamkeit der jetzt umgesetzten
Maßnahmen ab Ende März bzw. Anfang April beurteilen zu können.

Diese Überlegungen basieren auf einigen nicht explizit ausgesprochenen Annahmen, von
denen ich nur die wichtigste hier nachtragen möchte: Es wird unterstellt, dass sich im
Verlaufe der Epidemie die Altersverteilung der Infizierten nicht wesentlich ändert; es wird

Copyright 2020 QuoData GmbH - Quality and Statistics!
also ausgeschlossen, dass sich im Verlaufe der Epidemie aufgrund einer zunehmend älteren
Population infizierter Personen die Mortalitätsrate erhöht. Ob diese Annahme so zutrifft,
sollte schnellstmöglich empirisch überprüft werden. Hierzu müssen die entsprechenden
Daten bereitgestellt werden.

Copyright 2020 QuoData GmbH - Quality and Statistics!
19.03.2020

Zur Beurteilung der aktuellen Lage in acht Ländern haben wir wieder die aktuellen Zahlen für
acht Länder zusammengestellt. (Quellen der Einzeldaten: John Hopkins University und
Worldometers.info, für 19.03.2020, kurz nach 24:00 CET):

                Bestätigte Diagnosen         Todesfälle

                Anzahl bis                   Anzahl bis    7-Tage Trend
                19.03.2020 7-Tage Trend      19.03.2020    / pro Tag       Mortalitätsfaktor

Japan           943          34%             33            82%             4,7

South Korea     8565         8%              91            33%             1,2

France          10995        256%            372           490%            12,9

Germany         15320        438%            44            685%            1,6

Italy           41035        160%            3405          227%            22,5

Spain           18077        326%            831           731%            26,3

US              13383        737%            186           404%            11,0

India           194          168%            4                             4,5

Die entsprechenden Diagramme der aktuellen kumulierten Fallzahlen bestätigter Diagnosen
und Todesfälle sowie den Verlauf der Mortalitätsfaktoren entnehmen Sie bitte den „Trends“
auf der Webseite corona.quodata.de. Durch Klicken auf die Legende können Sie die jeweils
interessierenden Zeitreihen auswählen. Die Werte werden jede Nacht um 3:00 upgedated
(Quelle: Johns Hopkins University).

Copyright 2020 QuoData GmbH - Quality and Statistics!
Vergleichen wir diese statistischen Kennwerte mit den am 17.03.2020 zusammengestellten
Daten, so lässt sich festhalten, dass sich für die ostasiatischen Staaten die ohnehin bereits
stark abgeschwächten Trendwerte noch etwas weiter reduziert haben. Die zuletzt sehr
hohen Steigerungsraten in Europa haben sich ebenfalls zumindest leicht reduziert. Eine
Ausnahme bilden die Todesfälle in Frankreich, für die erhöhte Trendwerte zu konstatieren
sind. Stark angestiegen sind die Trendwerte sowohl für die bestätigten Diagnosen als auch
für die Todesfälle in den USA.

In dem gestrigen Blog habe ich ausgeführt, dass die Schwankungen bei den beobachteten
Trends bei stark aggregierten Daten über verschiedene Regionen, in denen sich die
Ausbreitung des Virus mit unterschiedlicher Geschwindigkeit oder in unterschiedlichen
Zeitfenstern abspielt, oft nur schwer interpretierbar sind. Es ist deshalb hilfreich, dem 7-
Tages-Trend den aktuellen Trend gegenüberzustellen. Hierfür habe ich das gestern
beschriebene Verfahren verwendet. Hier die Resultate für die 8 untersuchten Nationen. Alle
Angaben beziehen jeweils auf das Wachstum pro Tag, um den Vergleich der Zahlen zu
erleichtern.

                         Bestätigte Diagnose                Todesfälle

                         Aktueller         7-Tage Trend / Aktueller           7-Tage Trend /
                         Trend             pro Tag          Trend             pro Tag

   Japan                 3%                4%               8%                9%

   South Korea           1%                1%               6%                4%

   France                19%               20%              35%               29%

   Germany               27%               27%              39%               34%

   Italy                 14%               15%              17%               18%

   Spain                 23%               23%              31%               35%

   US                    41%               35%              28%               26%

   India                 15%               15%

Copyright 2020 QuoData GmbH - Quality and Statistics!
Der Vergleich zwischen aktuellem Trend und 7-Tagestrend bestätigt die weiter oben
gemachten Beobachtungen beim Vergleich der Resultate mit dem 17.03.2020 im
Wesentlichen.

Auffällig ist allerdings, dass – bis auf die Werte für die USA – aktuelle Trends und 7-
Tagestrend für die Fälle mit bestätigter Diagnose sehr gut übereinstimmen: die mittlere
betragsmäßige Abweichung liegt bei ca. 1,1%, bei den Todesfällen hingegen sind die
Abweichungen offenbar deutlich größer. Hier liegt die mittlere betragsmäßige Abweichung
bei ca. 2,6%. Es ist also davon auszugehen, dass der Trend bei den Todesfällen erheblich
größeren Schwankungen unterliegt als bei der Zahl der Fälle mit bestätigter Diagnose.

Möglicherweise sind die stärkeren Schwankungen auch eine Folge des Umstands, dass die
Mortalität von COVID-19 in hohem Maße vom Alter der Betroffenen abhängig ist. Weil sich
das Virus in unterschiedlichen Alterskohorten unterschiedlich schnell ausbreitet, kann dies zu
den beobachteten Schwankungen beitragen. Weil auf der anderen Seite die bestätigten
Diagnosen aufgrund der vermuteten Dunkelziffer sehr unsicher sind und auch jegliche
Trendaussage von der Annahme abhängt, dass sich diese Dunkelziffer nicht ändert, wäre
die Untersuchung der genannten Trends in unterschiedlichen Alterskohorten notwendig, um
bessere Prognosen abgeben zu können.

Copyright 2020 QuoData GmbH - Quality and Statistics!
Sie können auch lesen