Prognose für die USA 14.04.2020 Prognosen bestätigter Neuinfektionen
←
→
Transkription von Seiteninhalten
Wenn Ihr Browser die Seite nicht korrekt rendert, bitte, lesen Sie den Inhalt der Seite unten
Der biostatistische Corona-Blog Von Dr. habil. Steffen Uhlig, Berlin 14.04.2020 Prognosen bestätigter Neuinfektionen Prognose für die USA Die Trendindikatoren deuten seit Anfang April auf einen recht stabilen Trend hin, so dass eine Prognose für die USA möglich geworden ist. Der auf der folgenden Seite prognostizierte Kurvenverlauf deutet darauf hin, dass der Peak der (ersten) Welle in der letzten Woche erreicht wurde; seitdem ist mit einem kontinuierlichen Rückgang neuer Infektionen zu rechnen, bis zu einem Unterschreiten der Schwelle von 5000 bestätigten Infektionen vermutlich in der ersten Maihälfte. Naturgemäß sind weit in die Zukunft gerichtete Prognosen fast immer falsch bzw. sie gelten nur bis zu einem bestimmten Zeitpunkt – den man aber zu Beginn nicht kennt. Dieser Zeitpunkt ergibt sich daraus, dass sich erfahrungsgemäß die Bedingungen und Voraussetzungen der Prognose früher oder später mehr oder weniger abrupt ändern und damit auch die Prognose – meist – in einem scheinbaren Desaster endet. Zunächst einmal ist klar, dass die Kurve nur so lange Bestand haben kann, solange die aktuellen Eindämmungsmaßnahmen wirksam sind. Sobald diese Maßnahmen schrittweise aufgehoben werden, und sei es auch nur, dass dies in einzelnen Bundesstaaten erfolgt, könnte die Aufhebung einzelner Maßnahmen in der Bevölkerung als Signal verstanden werden, dass individuelle Bemühungen um physische Distanzierung nicht mehr so wichtig sind. Angesichts der stark ausgeprägten Heterogenität der Bevölkerung in den USA kann auch nicht ausgeschlossen werden, dass bestimmte Bevölkerungsgruppen noch gar nicht erreicht wurden, in denen das Virus aber möglicherweise – zum Beispiel aus religiösen Gründen - ein leichtes Spiel hat. Copyright 2020 QuoData GmbH - Quality and Statistics!
Wenn wir eine Prognose erstellen, so schauen wir uns jeweils an, ob der beobachtete Verlauf dem prognostizierten Verlauf entspricht. Treten systematische Abweichungen auf, ist davon auszugehen, dass der für die Prognose unterstellte Mechanismus nicht mehr zutrifft. Umso wichtiger ist es dann, die Effekte zu identifizieren, welche zu dem veränderten Kurvenverlauf führen. Aus diesem Grund schauen wir uns nun die am 06.40.2020 prognostizierten Kurvenverläufe für Deutschland, Spanien, Italien und Großbritannien im Vergleich zu den bislang berichteten Infektionen an. Copyright 2020 QuoData GmbH - Quality and Statistics!
Überprüfung der Prognosen vom 06.04.2020 In den folgenden Grafiken sind für Deutschland, Spanien und Großbritannien die gemeldeten Neuinfektionen zusammen mit den Prognosen vom 06.04.2020 zusammengestellt. Die aktuellen Zahlen liegen im prognostizierten Bereich. Copyright 2020 QuoData GmbH - Quality and Statistics!
Copyright 2020 QuoData GmbH - Quality and Statistics!
Einzig für Italien entspricht der Verlauf nicht dem prognostizierten Trend. So hat sich die Zahl der bestätigten Neuinfektionen in Italien in der letzten Woche nicht weiter reduziert. Vielmehr ist für den 08.04.2020 ein deutlicher Sprung von ca. 3000 auf nahezu 4000 Neuinfektionen zu verzeichnen, und unsere Warnung vom 06.04.2020, dass der Trend früher oder später mehr oder weniger abrupt enden könnte, hat sich früher als erwartet bewahrheitet. Seit dem 08.04.2020 pendeln die täglichen Neuinfektionen im Bereich um 3800-4700. Gibt es hierfür eine Erklärung? Werfen wir einen Blick auf die Zahl der täglich durchgeführten Tests sowie auf den prozentualen Anteil positiver Tests (Grafik auf der folgenden Seite). Für die Zahl der täglich durchgeführten Tests (rote Linie, rechte Skala) ist ein deutlicher Aufwärtstrend zu erkennen, wobei jeweils am Montag ein besonders niedriger Wert zu verzeichnen ist. Gleichzeitig geht der prozentuale Anteil bestätigter Fälle kontinuierlich zurück. Lag dieser Anteil Mitte März bei 25-30%, so waren es zwischen dem 02.04.2020 und dem 06.04.2020 im Mittel 12,2%, und zwischen dem 07.04.2020 und dem 11.04.2020 im Mittel nur noch 8,2%. Copyright 2020 QuoData GmbH - Quality and Statistics!
Die folgende Tabelle gibt einen Überblick über diese beiden Perioden: Period Time Average Average number Average rate Min – Max of daily daily number of confirmed of confirmed rate of confirmed of tests cases cases cases 1 02.04. – 06.04. 36062 4395 12,2% 11,7% - 12,9% 2 07.04. – 11.04. 48348 3945 8,2% 7,4% - 8,2% Gegenüber Periode 1 hat sich die Zahl der täglichen Tests in Periode 2 um 34% erhöht. Diese Zunahme kann nur bedeuten, dass die Auswahlkriterien für die Testung einer Person gelockert wurden, denn gleichzeitig hat sich ja die Zahl bestätigter Fälle reduziert. Weil in Italien – ebenso wie in Spanien – der Mortalitätsfaktor auf Basis der Zahl der Infektionen vor 7 Tagen immer noch sehr hoch ist, spricht vieles dafür, dass die Dunkelziffer unentdeckter Infektionen derzeit im Bereich von ca. 10-20 liegt, d.h. auf eine bestätigte Diagnose kommen ca. 10-20 nicht diagnostizierte Infizierte. Eine Ausweitung der Tests führt daher sehr wahrscheinlich zu einer Erhöhung der Zahl der bestätigten Diagnosen. Vieles spricht deshalb dafür, dass bei Beibehaltung der bisherigen Auswahlkriterien die Zahl bestätigter Neuinfektionen in Periode 2 im Einklang mit unserer Prognose deutlich zurückgegangen wäre. Die Ausweitung der Testung kann zwar dazu führen, dass sich die Zahl der bestätigten Neuinfektionen zunächst auf ein Mehrfaches des zunächst prognostizierten Wertes erhöht. Jedoch gehen wir nicht davon aus, dass sich dadurch der von uns prognostizierte Trendverlauf um mehr als 10 Tage verzögert. Eine deutliche Ausweitung der Testung ist seit wenigen Tagen auch in Spanien zu beobachten, so dass sich auch dort der prognostizierte Trendverlauf um einige Tage verzögern könnte. Ähnliche Effekte sind ggf. auch für die USA zu erwarten. Copyright 2020 QuoData GmbH - Quality and Statistics!
07.04.2020 14-Tages-Prognosen bestätigter Neuinfektionen Italien Werfen wir zunächst einen Blick auf die aktuellen bestätigten Neuinfektionen der letzten 4 Tage und vergleichen sie mit unserer Prognose vom 02.04.2020. Hierzu haben wir in der folgenden Grafik aus dem Blog vom 03.04.2020 zusätzlich die für Italien berichteten Neuinfektionen vom 03.04.2020 bis zum 06.04.2020 eingetragen: Es ist zunächst festzuhalten, dass die in den letzten 4 Tagen bekannt gegebenen Zahlen bislang nicht signifikant von dem prognostizierten Verlauf abweichen. Dennoch fällt auf, dass alle Zahlen der letzten 4 Tage oberhalb der bislang prognostizierten Kurve liegen. Damit stellt sich die Frage, wie sich der prognostizierte Verlauf ändert, wenn alle Daten bis zum 06.04.2020 einbezogen werden. Das von uns verwendete Prognoseverfahren liefert hierfür das folgende Ergebnis: Copyright 2020 QuoData GmbH - Quality and Statistics!
Die Abbildung zeigt, dass im Vergleich zur Prognose vom 02.04.2020 (blau gepunktete Kurve) die Trendkurve der aktuellen Prognose etwas höhere Fallzahlen ausweist, dass aber die aktuelle Trendkurve nahezu parallel zur Trendkurve vom 02.04.2020 verläuft. Der Unterschied der beiden Kurven liegt im Unsicherheitsbereich der neuen Kurve. Wir können also nach wie vor davon ausgehen, dass bei Fortsetzung des aktuellen Trends in der zweiten Aprilhälfte ein Rückgang auf 200 Fälle pro Tag möglich sein sollte. Ich möchte aber auch darauf hinweisen, dass dieser Trend früher oder später vermutlich mehr oder weniger abrupt stoppen könnte. Dies jedenfalls legen die bisherigen Erfahrungen in China und in Südkorea nahe. Copyright 2020 QuoData GmbH - Quality and Statistics!
Spanien Mittlerweile zeichnet sich auch in Spanien ein leichter Rückgang der Neuinfektionen ab. Gleichzeitig weisen die gemeldeten Zahlen inzwischen deutlich geringere erratische Schwankungen auf, was eine Prognose deutlich vereinfacht. Hier also nun die Prognose auf Basis der Zahlen vom gestrigen Abend: Diese Prognose spricht also für einen weiteren deutlichen Rückgang der Neuinfektionen in den kommenden zwei Wochen und eine Unterschreitung der Marke von 1000 Neuinfektionen bis Ende April. Copyright 2020 QuoData GmbH - Quality and Statistics!
Deutschland Auch in Deutschland nahmen der gemeldeten Zahlen zuletzt sehr stark ab. Dabei ist aber zu beachten, dass auch in den letzten Wochen bei den gemeldeten Neuinfektionen beträchtliche Schwankungen von Tag zu Tag zu verzeichnen waren. Es ist daher davon auszugehen, dass der Trend bei den Neuinfektionen schwächer sein wird, als es die aktuell berichteten nackten Zahlen der letzten 4 oder 5 Tage suggerieren: Für die zweite Aprilhälfte erwarten wir ebenso wie für Spanien eine Unterschreitung der Zahl von 1000 bestätigten Neuinfektionen. Copyright 2020 QuoData GmbH - Quality and Statistics!
Großbritannien In Großbritannien sehen wir nach wie vor deutlich ansteigende Neuinfektionen. Gleichwohl sind auch hier die Zeichen unverkennbar, dass der Trendverlauf in Kürze sein Maximum erreicht haben wird oder bereits erreicht hat. Hier der prognostizierte Verlauf: Der Konfidenzbereich, der durch die rote und grüne Kurve markiert wird, ist offenkundig weit größer als bei Italien, Spanien oder Deutschland. Dies hängt damit zusammen, dass die bisher zu beobachtende Verlangsamung des Wachstums der Neuinfektionen noch nicht sehr ausgeprägt ist. Dennoch erwarten wir auch für Großbritannien spätestens im Mai einen Rückgang auf unter 1000 Neuinfektionen pro Tag. Copyright 2020 QuoData GmbH - Quality and Statistics!
04.04.2020 7-Tages-Prognosen der Todesfallzahlen USA Die Zahl der bestätigten Diagnosen in den USA ist in den letzten Tagen sehr stark gestiegen, so dass Ähnliches nun auch für die Todesfallzahlen zu befürchten ist. Tatsächlich sind diese Zahlen in den letzten Tagen stark angestiegen. Der sich aus den Zahlen der letzten 5 Tage ergebende exponentielle Trend erreicht in einer Woche einen Wert von mehr als 32000 Todesfällen. Dieser Trend ist in der folgenden Grafik als rot gepunktete Kurve eingezeichnet. Bei einem linearen Verlauf würde sich die grün gepunktete Kurve ergeben. Die blaue Kurve beschreibt den Verlauf, den unser Prognosemodell liefert. Danach steigt die Zahl der Todesfälle binnen einer Woche auf einen Wert von gut 18000. Dieser gegenüber einer exponentiellen Entwicklung deutlich reduzierte Wert erklärt sich aus dem Umstand, dass zuletzt die Sterblichkeitsrate in der Gruppe der Fälle mit bestätigten Diagnosen kontinuierlich gesunken ist. Der Mortalitätsfaktor für die Zahl der Todesfälle bezogen auf die Zahl bestätigter Diagnosen eine Woche zuvor lag am 8. März 2020 noch bei 22.5, nun aber nur noch bei 7, bei weiter fallender Tendenz. Dies deutet darauf hin, dass möglicherweise ein erheblicher Anteil des zuletzt beobachteten Anstiegs bei den bestätigten Diagnosen auf eine starke Ausweitung der Testungen zurückzuführen ist. Copyright 2020 QuoData GmbH - Quality and Statistics!
Italien Wie es sich bei den italienischen Zahlen der täglich neu bestätigten Diagnosen bereits seit einigen Tagen andeutet, ist in Kürze mit einem weniger starken Zuwachs bei den Todesfällen zu rechnen. Dabei legen unsere Prognosen nahe, dass der Rückgang sogar noch etwas stärker ausfallen könnte, als es die Kurven für die bestätigten Diagnosen erwarten lassen würden: Nachdem an den letzten 7 Tagen durchschnittlich knapp 800 Todesfälle hinzugekommen sind, könnte dieser Wert in den kommenden Tagen auf gut 570 Todesfälle sinken. Verantwortlich für den stärkeren Rückgang des Prognosewertes ist der Umstand, dass sich die Sterblichkeit in der Gruppe jener Personen, bei denen eine Diagnose bestätigt wurde, zuletzt leicht reduziert hat: Der Mortalitätsfaktor für die Zahl der Todesfälle bezogen auf die Zahl bestätigter Diagnosen eine Woche zuvor pendelte im Zeitraum zwischen dem 08.03.2020 und dem 25.03.2020 im Bereich zwischen 21 und 27, ist aber seitdem weiter gesunken und lag zuletzt nur noch bei 17, bei weiter fallender Tendenz. Dies könnte ein Hinweis darauf sein, dass zunehmend auch Personen getestet wurden, bei denen die Krankheit einen weniger schweren Verlauf genommen hat. Es könnte aber auch bedeuten, dass sich die Situation in den italienischen Kliniken zuletzt gebessert hat. Die 7-Tages-Prognose ist in der folgenden Abbildung als blaue durchgezogene Linie wiedergegeben. Zusätzlich dargestellt ist der exponentielle Trend als rot gepunktete Kurve sowie der lineare Trend als grün gepunktete Linie. Copyright 2020 QuoData GmbH - Quality and Statistics!
Für die Zahl der Todesfälle am 10.04.2020 prognostiziert das Modell einen Wert von ca. 18000 Personen. Das ist deutlich weniger, als auf Basis einer simplen linearen oder exponentiellen Trendfortschreibung zu erwarten wäre. Copyright 2020 QuoData GmbH - Quality and Statistics!
Deutschland Bei der Entwicklung der Todesfallziffern in Deutschland war zuletzt ein exponentieller Anstieg mit abnehmenden Wachstumsraten festzustellen. Bereits die gestrige Prognose lieferte für den weiteren Verlauf eine nahezu lineare Entwicklung. Dies Entwicklung bestätigt sich mit der heutigen Prognose. Der sich aus den Zahlen der letzten 5 Tage ergebende exponentielle Trend erreicht in einer Woche einen Wert von mehr als 4000 Todesfällen. Dieser Trend ist in der folgenden Grafik als rote gepunktete Kurve eingezeichnet. Bei einem linearen Verlauf würde sich die grün gepunktete Kurve ergeben. Die blaue Kurve beschreibt den Verlauf, den unser Prognosemodell liefert. Danach steigt die Zahl der Todesfälle bis zum 10.04.2020 auf einen Wert von gut 2500. Dass der prognostizierte Anstieg der Todesfälle nunmehr nur noch einer linearen Entwicklung folgt, erklärt sich maßgeblich mit der ebenfalls zuletzt nur noch linearen Entwicklung bei der Zahl bestätigter Diagnosen. Copyright 2020 QuoData GmbH - Quality and Statistics!
03.04.2020 7-Tages-Prognose der Todesfallzahlen für Deutschland Das am 26.03.2020 vorgestellte Verfahren zur Prognose der Todesfallzahlen 7 Tage im Voraus hat den weiteren Verlauf in Deutschland sehr genau prognostiziert. Die Prognose für den 02.04.2020 lautete 1191 Todesfälle auf Basis der Zahlen vom 26.03.2020 bzw. 1168 Todesfälle auf Basis der Zahlen vom 27.03.2020. Tatsächlichen waren 1107 Todesfälle zu verzeichnen. Der Prognosefehler lag somit bei nur 5-8%. Dies bedeutet nicht, dass das Prognoseverfahren immer so genau arbeitet – aufgrund von Simulationsrechnungen hatten wir maximale Abweichungen in der Größenordnung von 15% erwartet; dennoch zeigt die Prognose die Leistungsfähigkeit geeigneter KI-basierter mathematisch-statistischer Methoden. Ich möchte ausdrücklich darauf hinweisen, dass das verwendete Verfahren kein reines KI-Verfahren ist, sondern dass es sich um einen modellbasierten mathematisch- statistischen Ansatz handelt, dessen Parameter unter Verwendung von KI-Methoden spezifiziert wurden. Die Ermittlung des Prognosefehlers ist kein Selbstzweck. Wichtig ist die Kenntnis des Prognosefehlers bereits dann, wenn man die Prognosen für die Ressourcenplanung der Krankenhäuser einsetzen möchte. Die folgende Grafik zeigt nun die Prognose für die Todesfallzahlen bis zum 09.04.2020, diesmal auf Basis der Daten bis zum 02.04.2020. Bis zum 09.04.2020 werden 2427 Todesfälle prognostiziert. Wie schon zuvor, basieren die Prognosen auf den Daten der Johns Hopkins University. Copyright 2020 QuoData GmbH - Quality and Statistics!
Copyright 2020 QuoData GmbH - Quality and Statistics!
02.04.2020 Weniger als 200 bestätigte tägliche Neuinfektionen in der zweiten Aprilhälfte in Italien möglich Wie es scheint, hat sich in Italien die Zahl der täglichen Diagnosen etwas reduziert, und es besteht Hoffnung auf einen weiteren Rückgang. Wir haben nun unter der Annahme, dass die aktuellen Bedingungen weiterhin gelten, eine Prognose der weiteren Entwicklung der Fallzahlen berechnet. Diese Prognose ist in der folgenden Grafik durch einen schwarzen Kurvenzug beschrieben. Es handelt sich um eine Trendkurve, die um die zufälligen Tagesschwankungen bereinigt wurde. Zusätzlich ist in der Grafik der Vertrauensbereich dieser Trendkurve bestimmt, der sich daraus ergibt, dass die Trendkurve aufgrund der zufälligen Tagesschwankungen eine gewisse Unsicherheit aufweist. Es ist zu erkennen, dass die Entwicklung in Italien nun endlich eine positive Richtung eingeschlagen hat. Setzt sich die Entwicklung so fort, könnte zwischen dem 15.04. und dem 27.04. der Trendwert für die tägliche Zahl bestätigter Diagnosen den Wert 200 unterschreiten. Dafür gibt es jedoch keine Garantie, zumal die vermeintliche Verbesserung der Situation möglicherweise dazu führt, dass in Teilen der Bevölkerung das Niveau der sozialen Distanzierung nicht mehr im gleichen Maße aufrechterhalten wird. Das jedoch wird Copyright 2020 QuoData GmbH - Quality and Statistics!
in den kommenden Tagen eine entscheidende Voraussetzung für die weitere Eindämmung der Epidemie sein. Anzumerken bleibt noch, dass der hier mit den roten und grünen Kurven dargestellte Vertrauensbereich für die Fallzahlen nicht mit dem Vorhersagebereich für die Tageswerte verwechselt werden darf. Dieser Vorhersagebereich ist aufgrund der starken Schwankungen der Tageswerte deutlich breiter als der Vertrauensbereich. Mit anderen Worten: Die Prognose wird nicht dadurch ungültig, dass einzelne Tageswerte deutlich außerhalb des angegebenen Vertrauensbereichs liegen. Erst wenn systematische Abweichungen über mehrere Tageswerte nacheinander festzustellen sind, ist davon auszugehen, dass die Bedingungen, die der Prognose zugrunde lagen, keine Gültigkeit mehr haben. Copyright 2020 QuoData GmbH - Quality and Statistics!
27.03.2020 Eine 7-Tages-Prognose für die Todesfälle der COVID-19 Welle Das gestern vorgestellte Verfahren zur 7-Tages-Prognose der Todesfälle hatte für heute 350 Todesfälle vorhergesagt, tatsächlich berichtet werden 323 (Johns Hopkins University und Morgenpost.de) bzw. 342 Todesfälle (Worldometers.info). Dass der Prognosefehler nach einem Tag ähnlich groß ist wie die Abweichungen zwischen den Datenbanken, ist einerseits ein gutes Zeichen im Hinblick auf die Leistungsfähigkeit des Prognoseverfahrens, andererseits nach einem Tag eigentlich auch nicht anders zu erwarten. Nach 7 Tagen sind naturgemäß deutlich größere Fehler zu erwarten. Wir haben das Prognoseverfahren im Laufe des heutigen Tages mit den längeren Zeitreihen aus China und Italien trainiert und dann anhand der inzwischen bereits etwas längeren Zeitreihen aus Frankreich, Spanien und den USA verifiziert. Dabei hat sich gezeigt, dass das modifizierte Verfahren für die Entwicklung der Todesfälle in Hubei und in China ohne Hubei im Wesentlich eine brauchbare Prognose abzugeben scheint. Auch für Italien, Frankreich und die USA scheint es gute Vorhersagen zu treffen. Für Spanien hingegen ist das System jedenfalls derzeit nicht einsetzbar: die 7-Tagesprognose war für Spanien in den meisten Fällen deutlich zu hoch. Schauen wir uns die prognostizierten Todesfälle für Deutschland an. In der folgenden Grafik findet sich neben den bereits gestern dargestellten Kurven für die Prognose am 26.03.2020, für die loglineare Extrapolation sowie für den konstanten Mortalitätsfaktor MF nun auch eine Prognosekurve für die Prognose am 27.03.2020. Es ist überraschend zu sehen, dass die beiden Prognosen für den 02.04.2020 zu fast dem gleichen Ergebnis kommen. Unterschiedlich sind die Prognosen allerdings auf dem Weg dahin. Auffällig ist der Umstand, dass sich der Abstand zwischen den Prognosekurven und der loglinearen Extrapolation zusehends vergrößert: dies bedeutet, dass der Anstieg der Todesfälle den ursprünglichen exponentiellen Pfad zusehends verlässt und etwas langsamer vonstattengeht. Copyright 2020 QuoData GmbH - Quality and Statistics!
Copyright 2020 QuoData GmbH - Quality and Statistics!
26.03.2020 Sind quantitative Prognosen für die COVID-19-Welle möglich? In den Zeitungen ist in diesen Tagen zu lesen, dass sich die deutschen Kliniken derzeit für die große COVID-19- Welle wappnen, indem zusätzlicher Platz geschaffen wird und übrige Patienten in dafür geeignete Reha-Kliniken verlegt werden. Es ist jedoch noch unklar, wie viele COVID-19-Patienten tatsächlich aufgenommen werden müssen, und wann die Kapazitätsgrenze der Intensivstationen erreicht werden wird. Meines Wissens nach liegen derzeit keine geeigneten Daten vor, mit denen man die Zahl der Intensivpatienten hochrechnen könnte. Was uns vorliegt, sind die Todesfälle der vergangenen Tage. Wenn man weiß, wie viele Intensivpatienten auf einen Todesfall kommen, könnte man versuchen, eine Prognose der Todesfälle vorzunehmen, um auf dieser Basis eine Abschätzung der benötigten Betten erhalten. Bekanntlich sind die derzeit verfügbaren Daten nicht sehr belastbar. Bestätigte Diagnosen werden oft erst mehrere Tage später nachgemeldet, so dass Trendanalysen ebenfalls erst Tage später, wenn die betreffende Fragestellung oft nicht mehr relevant ist, wirklich reliabel sind. Ignorieren kann man den Effekt dieser nachgemeldeten Fälle leider nicht: die Auswirkungen auf die statistischen Analysen waren am letzten Wochenende und an den Tagen danach so beträchtlich, dass eine sinnvolle aktuelle Verwertung der Daten nicht mehr möglich war. Wir haben uns aus diesem Grund entschieden, für Auswertungen nach Möglichkeit andere Datenbanken zu verwenden, z.B. die Datenbank von Johns Hopkins University, Worldometers.info und Morgenpost.de. Auch in diesen Datenbanken sind Fehler z.B. aufgrund von Doppelmeldungen festzustellen, doch ist der Umfang dieser Fehler nach unserer Erfahrung deutlich kleiner als die Fehler aufgrund später Nachmeldungen. Was leider in keiner der genannten Datenbanken für Deutschland verfügbar ist, sind die nach Alterskohorte sortierten Daten für jeden einzelnen Tag. Wenn es zutreffen sollte, dass bei den 20 bis 29-Jährigen der Anteil der Infizierten zu Beginn der Epidemie deutlich höher ist als bei älteren Kohorten, könnte sich im Verlaufe der Epidemie der Anteil der besonders gefährdeten Personen langsam erhöhen, mit der Folge, dass der Bedarf an Intensivbetten erheblich ansteigen könnte. Alle Prognosen hinsichtlich des Bedarfs von Intensivbetten wären damit obsolet. Jegliche Prognose muss also unterstellen, dass sich die Epidemie in Copyright 2020 QuoData GmbH - Quality and Statistics!
allen Kohorten gleichmäßig ausbreitet, und weiterhin, dass die in den oben genannten Datenbanken enthaltenen Daten näherungsweise richtig sind. Dieses Risiko können wir nur ausschließen durch Bereitstellung entsprechender Zeitreihen, in denen für jeden Tag auch genannt wird, wie groß der prozentuale Anteil jeder Altersgruppe wird. Wie kann man nun die Todesfälle prognostizieren? Das einfachste Verfahren besteht sicherlich darin, anhand der Daten der vergangenen Tage den prozentualen mittleren täglichen Zuwachs an Todesfällen zu ermitteln und dann entsprechend die Zahl der Todesfälle hochzurechnen oder zu extrapolieren. Dieses Verfahren ist zwar sehr einfach, hat aber den Nachteil, dass die Prognose oft sehr ungenau ist. Ein weiteres Verfahren basiert auf einem konstanten Mortalitätsfaktor. In früheren Blogbeiträgen habe ich darauf hingewiesen, dass der Mortalitätsfaktor sich zu Beginn einer Epidemie sich nur langsam verändert und daher gut verwendet werden kann, um die Zahl der Todesfälle zu prognostizieren. Schreitet eine Epidemie nun weiter fort und reduziert sich die Ausbreitungsgeschwindigkeit, trifft das nicht mehr unbedingt zu. Ein erweiterter Ansatz ist also notwendig, der auch die aktuelle Ausbreitungsgeschwindigkeit der Epidemie berücksichtigt, so wie es auch der in dem Blogeintrag vom 10.03.2020 beschriebene KI-basierte Ansatz macht. Wir haben diesen Ansatz so modifiziert, dass die Kurven nicht mehr von chinesischen Daten abhängig sind, sondern nur noch von dem bisherigen Verlauf der Todesfälle in dem betreffenden Land. Jedes dieser drei Verfahren habe ich nun auf die für Deutschland verfügbaren Daten angewandt und eine Prognose der Todesfälle für die kommenden 7 Tage erstellt. Das Ergebnis finden Sie auf der folgenden Seite. Offenbar liefert das Verfahren der loglinearen Extrapolation (blau gestrichelte Linie) die höchsten Werte, während mit dem Verfahren, welches auf einem konstanten Mortalitätsfaktor (grün) basiert, die niedrigsten Werte berechnet werden. Da die Ausbreitungsrate bereits deutlich zurückgegangen ist, liegt die Vermutung nahe, dass sich die verlangsamte Ausbreitung mit Verzögerung auch in einer verlangsamten Zunahme der Todesfälle niederschlägt. Der oben erwähnte erweiterte Ansatz befindet sich zwischen den beiden Kurven. Weil wir die vorhin angesprochenen Zahlen bestätigter Diagnosen nach Alterskohorten in ihrer zeitlichen Entwicklung nicht kennen, können wir für die drei Kurven leider keine belastbaren Unsicherheitsbereiche angeben. Die tatsächliche Entwicklung der Copyright 2020 QuoData GmbH - Quality and Statistics!
Todesfälle wird ihren eigenen Weg gehen – die Prognose kann nur aufzeigen, was unter bestimmten Annahmen passieren könnte. Copyright 2020 QuoData GmbH - Quality and Statistics!
Copyright 2020 QuoData GmbH - Quality and Statistics!
25.03.2020 Wie lässt sich die Effektivität von Maßnahmen zur Eindämmung der Epidemie beurteilen? Eine Vielzahl von Maßnahmen zur Eindämmung bzw. Verlangsamung der Epidemie wurden in den vergangenen Wochen ergriffen. Um sich ein Bild von der Wirkung dieser Maßnahmen zu machen, kann man die Zahl der Todesfälle untersuchen oder aber die Zahl der bestätigten Diagnosen. Illustrativ ist hierbei der Vergleich verschiedener Länder miteinander. Vergleichen wir also Deutschland mit Italien, dem Land, welches in Europa bislang die meisten Infektionen und die meisten Todesfälle zu verzeichnen hat. In der folgenden Abbildung sind die Verlaufskurven der bestätigten Diagnosen für Italien und Deutschland so gegeneinander verschoben, dass der erste Tag, an dem kumuliert 100 Fälle überschritten wurden, für beide Länder der gleiche ist. Dieser Tag war in Italien der 22.02.2020 und in Deutschland der 01.03.2020. Bestätigte Diagnosen in Italien und Deutschland 80000 70000 60000 50000 Allgemeine Schulschließungen 40000 Italien Deutschland 30000 20000 10000 0 22.03.2020 01.03.2020 08.03.2020 29.03.2020 15.03.2020 Italy Germany Beim Vergleich der beiden Kurven geht es nun nicht um einen Vergleich der absoluten Zahlen miteinander, denn diese Zahlen sind schon aufgrund der sehr unterschiedlichen Dunkelziffer nicht vergleichbar. Vielmehr geht es um die Dynamik der Epidemie und Copyright 2020 QuoData GmbH - Quality and Statistics!
insbesondere um die Frage, ob ein dämpfender Effekt der Schulschließungen erkennbar ist. Die Schulschließungen wurden in Italien allgemein am 05.03.2020 verfügt und in Deutschland in der Mehrzahl der Bundesländer am 16.03.2020. Wichtig dabei ist der Umstand, dass die Zahl der bestätigten Diagnosen in Deutschland am Tag der Schulschließungen nahezu doppelt so hoch war wie in Italien. Und daher erscheint es auch plausibel, dass sich wenige Tage nach den Schulschließungen in Italien und noch bevor die Schulschließungen in Deutschland für die bestätigten Diagnosen wirksam werden konnten, eine Lücke zwischen den Kurven auftut; in Italien hat sich die Ausbreitungsgeschwindigkeit in dieser Betrachtungsweise gegenüber Deutschland möglicherweise deutlich verlangsamt. Ein klareres Bild der möglichen Effekte der Schulschließungen bekommt man, wenn man den zeitlichen Trend der prozentualen Zunahme der kumulierten Fallzahlen betrachtet: Trend der täglichen Zunahme bei den bestätigten Diagnosen 55% in Italien und Deutschland 50% Allgemeine Schulschließungen 45% Deutschland 40% 35% 30% 25% 20% 15% 10% 5% 0% 15.03.2020 22.03.2020 01.03.2020 08.03.2020 29.03.2020 Italy Germany Danach ist seit Beginn der Epidemie ein kontinuierlicher Rückgang der Zuwachsraten in beiden Ländern zu verzeichnen, wobei sich Phasen mit geringerem Rückgang mit Phasen mit beschleunigtem Rückgang abwechseln. Dass in beiden Ländern bereits ca. drei Tage Copyright 2020 QuoData GmbH - Quality and Statistics!
nach den Schulschließungen bereits ein beschleunigter Rückgang zu beobachten ist, hat vermutlich weniger mit den Schulschließungen selbst zu tun, sondern vielmehr damit, dass in den Tagen davor die Gefahren der Epidemie in der Öffentlichkeit verstärkt diskutiert wurde und viele kleinere Maßnahmen z.B. in den Unternehmen umgesetzt wurden. Wir können also anhand dieser Daten nicht sagen, ob die allgemeinen Schulschließungen eindeutig messbare Effekte haben, und damit können wir auch nicht die Wirksamkeit in Bezug auf die effektive Reproduktionszahl beurteilen. Genau diese Beurteilung ist jedoch notwendig, wenn man ein Strategie für die vor uns liegenden Monate entwickeln will: Auch wenn es gelingen sollte, die Zahl der Neuinfektionen in den kommenden Wochen auf Null zu bringen, muss damit gerechnet werden, dass nach einer Pause die Zahlen wieder steigen werden. Wenn die Maßnahmen richtig gesetzt werden, könnte der Prozess des Anstiegs so verlangsamt werden, dass weitere ökonomische Schäden in Grenzen gehalten werden können. Erforderlich dafür wäre u.a. die zeitnahe Bereitstellung der Zahl bestätigter Diagnosen, der Zahl der Geheilten sowie der Zahl der Todesfälle getrennt für verschiedene Alterskohorten und getrennt nach Landkreisen. Abschließend sollte noch erwähnt werden, dass trotz des Rückgangs bei der Ausbreitungsgeschwindigkeit kurzfristig mit einer deutlichen Zunahme der Todesfälle zu rechnen ist. Ändert sich das aktuelle Niveau des Mortalitätsfaktors nicht, ist bis um den 01.04.2020 herum mit insgesamt ca. 520-780 Todesfällen in Deutschland zu rechnen. Copyright 2020 QuoData GmbH - Quality and Statistics!
23.03.2020 Wie genau kann man eigentlich die aktuelle Entwicklung der gemeldeten bestätigten Diagnosen einschätzen? In der vergangenen Woche stiegen die kumulierten bestätigten Diagnosen in Deutschland täglich um 20-30%, wobei diese Rate zuletzt deutlich geringer war. Andererseits gab es offensichtlich Verzögerungen bei der Übermittlung der Daten einiger Gesundheitsämter, und nicht zuletzt scheinen auch in der für viele Auswertungen genutzten Datenbank der Johns Hopkins University im Moment (24.03.2020, 6:00) Probleme bei der Aktualisierung der Daten zu bestehen. Stellt man diese Unsicherheiten in Rechnung, wird die weitere Prognose und selbst die Bestimmung des aktuellen Trends deutlich unsicherer. Für die folgenden Analysen lege ich die Daten von Worldometers.info zugrunde. Betrachten wir für das folgende die Entwicklung der Fallzahlen kumulierter bestätigter Diagnosen in Deutschland, Italien und Indien: Fallzahlen bestätigter Diagnosen 20480 5120 1280 320 80 20 Germany Italy India Offenbar folgen die Fallzahlen in logarithmischer Skalierung in guter Näherung einem linearen Trend. Schaut man jedoch genauer hin, sieht man, dass dieser lineare Trend für Deutschland und Italien langsam abnimmt. Ein genaueres Bild dieses Trends erhält man, wenn man anstelle der kumulativen Fallzahlen den jeweiligen prozentualen Anstieg von einem Tag auf den nächsten betrachtet, d.h. die Zahl der jeweils neu gemeldeten Fälle als Prozentwert der bis zum Vortag kumulativ registrierten Fälle ausweist: Copyright 2020 QuoData GmbH - Quality and Statistics!
Prozentualer täglicher Anstieg der Fallzahlen 45% 40% 35% 30% 25% 20% 15% 10% 5% 0% Germany Italy India Offenbar schwanken die prozentualen täglichen Anstiege beträchtlich. Dies gilt naturgemäß für Indien aufgrund der im Vergleich niedrigen absoluten Fallzahlen, es gilt aber auch für Deutschland und Italien, bei denen sich Zufallseffekte aufgrund individueller Ereignisse eigentlich weitgehend gegeneinander aufheben sollten. Dass dies nicht der Fall ist, könnte eine Folge veränderter Teststrategien oder verspäteter Meldungen sein. Die Entwicklung der Zahlen folgt offenbar nicht durchgängig den Gesetzen der Normalverteilung. Es gibt zwar Phasen mit vergleichsweise stabiler Entwicklung der Fallzahlen; diese werden aber unterbrochen durch einzelne „Ausreißer“, plötzlich eintretende Veränderungen der Dynamik, und teilweise unterlegt durch langsame Veränderungen des zugrundeliegenden Trends. Um die damit einhergehende Unsicherheit zu erfassen, liegt es nahe, nicht ein einzelnes konventionelles statistisches Modell oder Zeitreihenmodell heranzuziehen, sondern gleich mehrere, um dann mit einem KI-basierten Ansatz anhand der Qualität der Anpassung an die beobachteten Daten zu ermitteln, wie wahrscheinlich es ist, dass das betreffende Modell tatsächlich die Entwicklung adäquat erfasst. Um diese Vorgehensweise zu beschreiben, betrachte ich zwei sehr einfache Modelle für den prozentualen Anstieg der Fallzahlen (auf Basis der logarithmierten Werte). Im ersten Modell unterstelle ich, dass es im Verlauf der letzten 7 Tage keinerlei Veränderung des zugrundeliegenden (wahren) Trends gegeben hat, und im zweiten Modell unterstelle ich, dass an den letzten sieben Tagen sich der Trend der Fallzahlen zeitlich linear verstärkt oder abgeschwächt hat. Diese beiden Modelle werden dem tatsächlichen Verlauf der Fallzahlen zwar nur ansatzweise gerecht. Sie sind jedoch sehr einfach interpretierbar. Copyright 2020 QuoData GmbH - Quality and Statistics!
Beginnen wir mit den Fallzahlen für Deutschland. Während der Anstieg der prozentualen Fallzahlen zwischen dem 14.03.2020 und dem 20.03.2020 nur geringfügig um 28% herum pendelte, sind diese Werte an den drei nachfolgenden Tagen deutlich zurückgegangen. Man könnte also entweder zu dem Schluss kommen, dass die Werte nunmehr im Bereich 10-17% herum schwanken, oder, dass die beobachteten Rückgänge nur temporärer Natur sind und der tatsächliche tägliche Anstieg der Fallzahlen eher bei 20-25% liegen könnte. Die folgende Abbildung zeigt die berechneten Wahrscheinlichkeiten für den derzeit noch unbekannten kurzfristigen Trend für die Zunahme der Fallzahlen am 23.03.2020. Wahrscheinlichkeitsmodell für den Trend der täglichen Fallzahlen in Deutschland am 23.03.2020 0% 5% 10% 15% 20% 25% 30% Die höchsten Wahrscheinlichkeiten ergeben sich für einen prozentualen Anstieg im Bereich von 13%. Falls die für das Wochenende bislang gemeldeten Fallzahlen zutreffen sollten, ergibt sich für diesen Berechnungsansatz weiterhin, dass auch ein deutlich höherer Anstieg der Fallzahlen im Bereich des Möglichen liegt. Die Unsicherheit der Trendberechnung ist sehr hoch. Der wahrscheinlichste Bereich liegt zwischen 8% und 25%. Dieses Intervall entspricht einem Bereich, der 90% Wahrscheinlichkeit abdeckt. Es ist extrem breit, weil die zuletzt gemeldeten Fallzahlen sehr starke unerwartete Schwankungen aufwiesen. Nun habe ich für diese Betrachtung außer Acht gelassen, dass wir bereits wissen, dass dieser deutliche Rückgang für den 21.03.2020 und den 22.03.2020 zumindest zum Teil durch ausbleibende Meldungen lokaler Gesundheitsbehörden verursacht wurde. Es ist also nicht davon auszugehen, dass die Zuwachsraten tatsächlich kurzfristig einstellig werden. Copyright 2020 QuoData GmbH - Quality and Statistics!
Interessant sind die Ergebnisse im Vergleich zu Italien. Hier sind die Schwankungen der Zuwachsraten derzeit deutlich weniger ausgeprägt, so dass bessere Prognosen möglich sind: Wahrscheinlichkeitsmodell für die Zunahme der Fallzahlen in Italien vom 23.03.2020 auf den 24.03.2020 6,00% 8,00% 10,00% 12,00% 14,00% 16,00% Für die aktuelle kurzfristige Prognose der Zuwächse der Fallzahlen in Italien erhalte ich derzeit einen wahrscheinlichsten Wert von gut 12% mit einer Untergrenze von 9% und einer Obergrenze von 14% (basierend auf approximativen Fehlerwahrscheinlichkeiten von jeweils nicht mehr als 5%). Hier sieht die kurzfristige Entwicklung also tatsächlich langsam etwas besser aus. Für Indien hingegen besteht die Sorge, dass die zuletzt noch moderaten Zuwächse deutlich zunehmen könnten. Hier das Ergebnis der kurzfristigen Analyse: Copyright 2020 QuoData GmbH - Quality and Statistics!
Wahrscheinlichkeitsmodell für den Trend der täglichen Fallzahlen in Indien am 23.03.2020 10% 15% 20% 25% 30% 35% 40% 45% 50% Für die aktuelle kurzfristige Prognose der Zuwächse der Fallzahlen in Indien berechne ich mit der gleichen Methode einen wahrscheinlichsten Wert von knapp 22%, mit einer Untergrenze von 17% und einer Obergrenze von 35%, wobei beiden Grenzen mit einer Wahrscheinlichkeit von 5% überschritten werden können. Die hohe Obergrenze verdeutlicht, dass in Indien derzeit ein erhebliches Risiko für rasch ansteigende Fallzahlen besteht. Die in Indien glücklicherweise bereits jetzt gestarteten sehr weitreichenden Maßnahmen zur Eindämmung der Epidemie werden voraussichtlich jedoch sehr bald dazu führen, dass der weitere Anstieg auslaufen wird. Fazit: Wie bereits an anderer Stelle angemerkt, ist eine hohe Qualität der Daten sowie eine transparente Darlegung der Teststrategien unverzichtbar, um aus den gemeldeten Zahlen kurzfristig ableiten zu können, in welche Richtung der aktuelle Trend geht. Je schlechter die Qualität der Daten, desto später kann man mit entsprechenden Maßnahmen gegensteuern. Zum gegenwärtigen Zeitpunkt ist festzuhalten, dass tragfähige Aussagen zum jeweiligen aktuellen Trend auf Basis der nationalen (deutschen) Daten tatsächlich erst im Verlauf von mindestens einer Woche möglich sind. Copyright 2020 QuoData GmbH - Quality and Statistics!
21.03.2020 Für Deutschland wurde heute gemäß den Angaben der Johns Hopkins University ein Anstieg von nur noch 12 % registriert, während es gestern noch 30% waren. Was ist die Ursache für diesen Rückgang? Schauen wir auf die Zahlen von Baden-Württemberg und Bayern. Weil die Angaben des RKI noch nicht auf dem aktuellen Stand sind, beziehe ich mich im Folgenden bei den Zahlen für Baden-Württemberg auf die Angaben des SWR, der sich seinerseits wiederum auf Angaben des zuständigen Ministeriums in Stuttgart bezieht. Die Angaben aus Bayern habe ich der Website des LGL entnommen: Gemeldete Fälle Gemeldete Fälle Gemeldete Fälle am (kumulativ) bis am Freitag, 20.03. Samstag, 21.03. Donnerstag, 19.03., (abends) Baden-Württemberg 2748 917 153 Bayern 3182 590 685 Wie dieser Zusammenstellung entnommen werden kann, sind die gemeldeten Fälle in Baden-Württemberg von Freitag auf Samstag regelrecht auf ein Sechstel des tags zuvor genannten Wertes eingebrochen, während sie in Bayern leicht gestiegen sind. Nach Angaben des RKI wurden die neu registrierten Fälle von einigen Gesundheitsämtern noch nicht berichtet, was aber am Montag nachgeholt werden soll, so dass die korrigierten Daten ab Dienstag vorhanden sind. Nun ist eine Trendanalyse auf Basis eines lückenhaften Datensatzes äußerst problematisch, insbesondere dann, wenn nicht bekannt ist, ob bzw. in welchem Umfang Daten fehlen. Sofern die betreffenden Daten nachgemeldet werden, stellt sich die Frage, bis wann die Nachmeldung erfolgt, und im vorliegenden Fall erzwingt die verzögerte Bereitstellung der Daten eine Verzögerung bei der Trendanalyse um immerhin zwei Tage. In zwei Tagen erhöht sich bei dem derzeitigen Tempo der Ausbreitung von COVID-19 die Zahl der Infizierten und die Belegung der Intensivbetten um ca. 60-70%. Damit wird deutlich, dass das derzeit verwendete Verfahren für die Beurteilung der in Kraft gesetzten Maßnahmen ungeeignet ist. Das Problem beheben ließe sich, wenn alle Gesundheitsämter auch am Wochenende die bestätigten Fälle melden. Sofern dies personell Copyright 2020 QuoData GmbH - Quality and Statistics!
aufgrund der enormen Arbeitsbelastung nicht leistbar ist, müsste für die Trendanalyse der vollständige Datensatz zur Verfügung gestellt werden, in dem alle Fallzahlen aller Gesundheitsämter aufgelistet sind, samt der fehlenden Daten, die entsprechend gekennzeichnet werden müssten. Es ist vermutlich sinnvoller, die Trendanalysen generell getrennt nach Bundesland vorzunehmen. Dies gilt insbesondere, wenn das Problem verspäteter Meldungen häufiger auftreten sollte. Dann nämlich bietet es sich für besonders betroffene Bundesländer an, eine Trendanalyse primär auf Basis von Wochendaten vorzunehmen, um weitere Verzerrungen weitgehend zu vermeiden. Naturgemäß ist eine Auswertung auf Basis von Tagesdaten in jedem Falle statistisch reliabler, d.h. bei rechtzeitiger Meldung wird man eher sehen, ob eine Maßnahme zur Eindämmung von COVID-19 den gewünschten Erfolg gebracht hat. Copyright 2020 QuoData GmbH - Quality and Statistics!
20.03.2020 Vergleichen wir nochmals die Verlaufskurven für Deutschland mit denen aus China ohne Hubei. Wie bereits beschrieben, habe ich die Kurven auf der x-Achse so verschoben, dass der Tag, an dem 1000 bestätigte Diagnosen erreicht wurden, jeweils der gleiche ist. Dieser Bezugspunkt erscheint auf den ersten Blick willkürlich gewählt, da die Bevölkerung Chinas so sehr viel größer ist als die Bevölkerung Deutschlands. Doch befindet sich die Epidemie noch ganz im Anfangsstadium, so dass ein solcher Vergleich erlaubt ist. Mit 1000 bestätigten Diagnosen hat man außerdem die Gewähr, dass statistische Fehlerschwankungen nur noch eine untergeordnete Rolle spielen. Fallzahlen bestätigter Diagnosen Deutschland 04.03.-20.03.2020 versus China ohne Hubei 22.01.-19.02.2020 20000 18000 16000 14000 12000 10000 8000 6000 4000 2000 0 04.03.2020 18.03.2020 11.03.2020 China ohne Hubei Germany Es ist gut zu erkennen, dass die Fallzahlen in Deutschland kontinuierlich ansteigen, während in China eine deutliche Beruhigung eintritt. Um nun erkennen zu können, wie schnell der Anstieg der Fallzahlen erfolgt, verwende ich ein statistisches Schätzverfahren für den prozentualen aktuellen Anstieg. Es ist so konstruiert, dass es auf eine plötzliche und signifikante Veränderung der Trendentwicklung bzw. des prozentualen Anstiegs unmittelbar reagiert, bei nichtsignifikanten langsamen Veränderungen hingegen etwas langsamer. Copyright 2020 QuoData GmbH - Quality and Statistics!
Schätzwert für den Tagestrend für Fallzahlen bestätigter Diagnosen Deutschland 04.03.-20.03.2020 versus China ohne Hubei 22.01.-19.02.2020 70% 60% 50% 40% 30% 20% 10% 0% 23.03.2020 09.03.2020 16.03.2020 China ohne Hubei Germany Offenbar nimmt in China ohne Hubei der beobachtete Trend und damit die effektive Reproduktionszahl täglich und kontinuierlich ab. Für Deutschland hingegen ist festzustellen, dass der tägliche Anstieg mit knapp 30% über nahezu 2 Wochen praktisch unverändert geblieben ist. Es sieht nicht so aus, als ob die ergriffenen Maßnahmen bisher großen Erfolg gezeitigt hätten. Werfen wir nun aber einen Blick auf den zugehörigen Mortalitätsfaktor, den ich in diesem Blog bereits mehrfach erprobt und genutzt habe. Dieser Faktor beschreibt im Wesentlichen das Verhältnis der kumulierten Todesfälle zu den kumulierten Fällen bestätigter Diagnosen, die 7 Tage zuvor ermittelt wurden. Haben sich die Bedingungen nicht grundlegend geändert, sollte in der Frühphase einer Epidemie bei gleichbleibendem Trend der Mortalitätsfaktor in dem betreffenden Zeitraum nahezu konstant bleiben. Hier also nun der Verlauf des Mortalitätsfaktors für Deutschland, und im Vergleich dazu der Mortalitätsfaktor für China: Copyright 2020 QuoData GmbH - Quality and Statistics!
Mortalitätsfaktor Deutschland 11.03.-20.03.2020 versus China ohne Hubei 29.01.-19.02.2020 5 4 3 2 1 0 18.03.2020 25.03.2020 11.03.2020 China ohne Hubei Germany Offenbar ist der Mortalitätsfaktor für Deutschland keineswegs konstant. Vielmehr ist – nach einer Phase mit praktisch unveränderten Werten im Bereich zwischen 1 und 1,2 zwischen dem 11.03.2020 und dem 15.03.2020 - ein kontinuierlicher, nahezu linearer Anstieg auf ein Niveau von ca. 1,8 festzustellen. Wenn sich also die Bedingungen nicht geändert haben, wäre heute eher ein Niveau von 1,1 als von 1,8 zu erwarten gewesen. Weil jedoch der Mortalitätsfaktor bei 1,8 liegt, könnte sich die Gesamtzahl infizierter Personen, inklusive der nichtdiagnostizierten Personen, in der Vorwoche über die berichteten Zahlen hinaus noch einmal um den Faktor 1,6-1,7 erhöht haben. Damit dürfte es heute mindestens 34000 infizierte Personen in Deutschland geben. Die Dunkelziffer nicht diagnostizierter, aber infizierter Personen hat sich möglicherweise erhöht, weil nicht mehr systematisch im Umfeld von Personen mit bestätigter Diagnose getestet wurde. Hinweise darauf liefert die Tagespresse, wonach z.B. das Gesundheitsamt des Bodenseekreis seit dem 17.03.2020 nur noch in sehr gut begründeten Verdachtsfällen einen Test auf CORVID-19 durchführen lässt (https://www.faz.net/aktuell/politik/inland/coronavirus-krise-wer-darf-sich-noch-testen-lassen- 16688735.html) Ähnliche Pressemeldungen gab es vor einigen Wochen aus der Lombardei. Vergleicht man den Mortalitätsfaktor nun mit dem entsprechenden Wert für China ohne Hubei, zeigt sich dort ein ganz anderes Verhalten. Aufgrund der stark abnehmenden Dynamik in China hätte ich erwartet, dass der Mortalitätsfaktor eher steigt als fällt, weil bei abnehmender Ausbreitungsgeschwindigkeit Todesfälle nach längerem Krankheitsverlauf stärker ins Gewicht fallen. Tatsächlich jedoch ist er zunächst weiter gefallen bis auf Werte Copyright 2020 QuoData GmbH - Quality and Statistics!
unter 0,45, um dann wieder langsam anzusteigen. Während heute der Mortalitätsfaktor in Deutschland bei 1,8 liegt, liegt der betreffende Wert für den 07.02.2020 in China bei 0,45. Wenn davon ausgegangen werden kann, dass die Bedingungen vergleichbar sind, sollte der Mortalitätsfaktor in Deutschland eher kleiner sein als in China (wegen der dort abnehmenden Dynamik). Da dies nicht der Fall ist, ist zu vermuten, dass die Gesamtzahl infizierter Personen in Deutschland mindestens 1,8/0,45 = 4 mal größer ist als die Gesamtzahl bekannter Fälle. Demnach müssten wir heute in Deutschland von mindestens 80000 infizierten Personen ausgehen – sofern die unrealistische Annahme zutrifft, dass in China die Dunkelziffer bei Null lag. Falls diese Annahme jedoch nicht zutrifft, wäre die Dunkelziffer noch höher. Der deutliche Anstieg des Mortalitätsfaktors in Deutschland könnte jedenfalls bedeuten, dass die tatsächliche Wachstumsrate für die Epidemie derzeit nicht bei 28% täglich liegt, sondern eher etwas höher. Wenn man davon ausgeht, dass sich ab dem 11.03.2020 in vielen Gesundheitsämtern die Vorgehensweisen bei der Testung geändert haben, könnte der tatsächliche tägliche Anstieg im Verlauf der letzten 5 Tage eher bei 41% anstelle von 28% gelegen haben. Dies entspricht näherungsweise auch den zuletzt beobachteten Trendzahlen beim Anstieg der Todesfälle, die an den letzten 5 Tagen im Tagesdurchschnitt jeweils um 44% zugenommen haben. Ein täglicher Anstieg um 41% bedeutet, dass die Patientenzahlen binnen 7 Tagen jeweils um den Faktor 11 steigen bzw. gestiegen sein könnten. Die hier vorgenommene Betrachtung basiert auf dem Anstieg der Todesfälle zwischen dem 15.03.2020 und dem 20.03.2020, betrifft also den Verlauf der Infektionszahlen der ersten Märzhälfte. Rechnet man eine typische Inkubationszeit von ca. 4-5 Tagen hinzu, wird klar, dass die hier diskutierten Trends noch nicht durch die in der letzten Woche umgesetzten Maßnahmen zur Verlangsamung der Epidemie beeinflusst wurden. Es ist davon auszugehen, dass diese Maßnahmen in der kommenden Woche deutliche Wirkung zeigen werden. Dabei muss dann aber neben dem Bundestrend, wie im Blog vom 18.02. dargelegt, ein stärkerer Bezug auf den jeweiligen Landestrend gelegt werden, weil die von den einzelnen Bundesländern ergriffenen Maßnahmen unterschiedlich und in unterschiedlicher zeitlicher Taktung umgesetzt werden. Die hier angestellten Betrachtungen sollen primär dazu dienen, eine Vergleichsbasis bereitzustellen, um die Wirksamkeit der jetzt umgesetzten Maßnahmen ab Ende März bzw. Anfang April beurteilen zu können. Diese Überlegungen basieren auf einigen nicht explizit ausgesprochenen Annahmen, von denen ich nur die wichtigste hier nachtragen möchte: Es wird unterstellt, dass sich im Verlaufe der Epidemie die Altersverteilung der Infizierten nicht wesentlich ändert; es wird Copyright 2020 QuoData GmbH - Quality and Statistics!
also ausgeschlossen, dass sich im Verlaufe der Epidemie aufgrund einer zunehmend älteren Population infizierter Personen die Mortalitätsrate erhöht. Ob diese Annahme so zutrifft, sollte schnellstmöglich empirisch überprüft werden. Hierzu müssen die entsprechenden Daten bereitgestellt werden. Copyright 2020 QuoData GmbH - Quality and Statistics!
19.03.2020 Zur Beurteilung der aktuellen Lage in acht Ländern haben wir wieder die aktuellen Zahlen für acht Länder zusammengestellt. (Quellen der Einzeldaten: John Hopkins University und Worldometers.info, für 19.03.2020, kurz nach 24:00 CET): Bestätigte Diagnosen Todesfälle Anzahl bis Anzahl bis 7-Tage Trend 19.03.2020 7-Tage Trend 19.03.2020 / pro Tag Mortalitätsfaktor Japan 943 34% 33 82% 4,7 South Korea 8565 8% 91 33% 1,2 France 10995 256% 372 490% 12,9 Germany 15320 438% 44 685% 1,6 Italy 41035 160% 3405 227% 22,5 Spain 18077 326% 831 731% 26,3 US 13383 737% 186 404% 11,0 India 194 168% 4 4,5 Die entsprechenden Diagramme der aktuellen kumulierten Fallzahlen bestätigter Diagnosen und Todesfälle sowie den Verlauf der Mortalitätsfaktoren entnehmen Sie bitte den „Trends“ auf der Webseite corona.quodata.de. Durch Klicken auf die Legende können Sie die jeweils interessierenden Zeitreihen auswählen. Die Werte werden jede Nacht um 3:00 upgedated (Quelle: Johns Hopkins University). Copyright 2020 QuoData GmbH - Quality and Statistics!
Vergleichen wir diese statistischen Kennwerte mit den am 17.03.2020 zusammengestellten Daten, so lässt sich festhalten, dass sich für die ostasiatischen Staaten die ohnehin bereits stark abgeschwächten Trendwerte noch etwas weiter reduziert haben. Die zuletzt sehr hohen Steigerungsraten in Europa haben sich ebenfalls zumindest leicht reduziert. Eine Ausnahme bilden die Todesfälle in Frankreich, für die erhöhte Trendwerte zu konstatieren sind. Stark angestiegen sind die Trendwerte sowohl für die bestätigten Diagnosen als auch für die Todesfälle in den USA. In dem gestrigen Blog habe ich ausgeführt, dass die Schwankungen bei den beobachteten Trends bei stark aggregierten Daten über verschiedene Regionen, in denen sich die Ausbreitung des Virus mit unterschiedlicher Geschwindigkeit oder in unterschiedlichen Zeitfenstern abspielt, oft nur schwer interpretierbar sind. Es ist deshalb hilfreich, dem 7- Tages-Trend den aktuellen Trend gegenüberzustellen. Hierfür habe ich das gestern beschriebene Verfahren verwendet. Hier die Resultate für die 8 untersuchten Nationen. Alle Angaben beziehen jeweils auf das Wachstum pro Tag, um den Vergleich der Zahlen zu erleichtern. Bestätigte Diagnose Todesfälle Aktueller 7-Tage Trend / Aktueller 7-Tage Trend / Trend pro Tag Trend pro Tag Japan 3% 4% 8% 9% South Korea 1% 1% 6% 4% France 19% 20% 35% 29% Germany 27% 27% 39% 34% Italy 14% 15% 17% 18% Spain 23% 23% 31% 35% US 41% 35% 28% 26% India 15% 15% Copyright 2020 QuoData GmbH - Quality and Statistics!
Der Vergleich zwischen aktuellem Trend und 7-Tagestrend bestätigt die weiter oben gemachten Beobachtungen beim Vergleich der Resultate mit dem 17.03.2020 im Wesentlichen. Auffällig ist allerdings, dass – bis auf die Werte für die USA – aktuelle Trends und 7- Tagestrend für die Fälle mit bestätigter Diagnose sehr gut übereinstimmen: die mittlere betragsmäßige Abweichung liegt bei ca. 1,1%, bei den Todesfällen hingegen sind die Abweichungen offenbar deutlich größer. Hier liegt die mittlere betragsmäßige Abweichung bei ca. 2,6%. Es ist also davon auszugehen, dass der Trend bei den Todesfällen erheblich größeren Schwankungen unterliegt als bei der Zahl der Fälle mit bestätigter Diagnose. Möglicherweise sind die stärkeren Schwankungen auch eine Folge des Umstands, dass die Mortalität von COVID-19 in hohem Maße vom Alter der Betroffenen abhängig ist. Weil sich das Virus in unterschiedlichen Alterskohorten unterschiedlich schnell ausbreitet, kann dies zu den beobachteten Schwankungen beitragen. Weil auf der anderen Seite die bestätigten Diagnosen aufgrund der vermuteten Dunkelziffer sehr unsicher sind und auch jegliche Trendaussage von der Annahme abhängt, dass sich diese Dunkelziffer nicht ändert, wäre die Untersuchung der genannten Trends in unterschiedlichen Alterskohorten notwendig, um bessere Prognosen abgeben zu können. Copyright 2020 QuoData GmbH - Quality and Statistics!
Sie können auch lesen