Massenbewegungsdaten in Kombination mit Gesundheitsdaten für Maßnahmen in pandemischen Situationen Deutsche Telekom, Tino Bliesener, 17.11.2022
←
→
Transkription von Seiteninhalten
Wenn Ihr Browser die Seite nicht korrekt rendert, bitte, lesen Sie den Inhalt der Seite unten
Massenbewegungsdaten in Kombination mit Gesundheitsdaten für Maßnahmen in pandemischen Situationen Deutsche Telekom, Tino Bliesener, 17.11.2022
Massenbewegungsdaten • Statistische Auswertung anonymisierter Signalisierungsdaten aus dem Mobilfunknetz der Deutschen Telekom • Auswertung der Daten für Deutschland • Anreicherung mit weiteren Datensätzen möglich
Mehr als 60 Individuelle und Stichprobe: über Hochrechnung Anonymisierungs- Milliarden standardisierte 30% der Gesamt- auf die Gesamt- verfahren nach Signale pro Tag Geometrie bevölkerung bevölkerung BfDI und DSGVO
Geo-Informationen Soziodemografie Anonymisierung Informationen aus anonymisierten Anonymisierte Informationen aus Datenverarbeitungs- und Mobilfunksignalen: der Datenbank: Anonymisierungsprozess freigegeben durch ▪ Anzahl Personen, Verweildauer ▪ Alter (Altersgruppe), Geschlecht ▪ Start- und Zielort von Trips ▪ Wohnort - Postleitzahl ▪ Herkunftsbestimmung durch das ▪ Anreicherung mit statistischen erste Signal des Tages Daten (Kaufkraft, Milieu etc.)
Analyse Potentialanalyse OOH Echtzeit- Retail Analytics Tagestouristen aussteuerung Shopping Center Bahnhöfe Analyse Analyse Internationale OOH Reduzierung Whitespot Analyse Fachmarktzentrum Fußgängerzone Touristen Streuverluste Standortanalyse Optimierung „Straßenlage“ Werbegebiet
Aktualisierung Optimierung ÖPNV Potentialanalyse Auswertung Fahrgastzählung Verkehrsmodelle ländlicher Raum Fernbusnetz Großereignisse U-Bahn Querschnittszählung Geschäftsgebiets- Netzplanung Potentialanalyse Pendleranalyse Autobahn planung Ridesharing Ladesäulen Flughäfen Einnahmeverteilung Gesundheits- Fahrgastzählung Klimazielerfüllung ÖPNV forschung Zug
Massenbewegungsdaten und Gesundheitsdaten Ausbreitungsmodelle 2018/19 Das RKI hat mit den Mobilitätsdaten der Deutschen Telekom in Verbindung mit Gesundheitsdaten bereits im Jahr 2018 Vorhersagemodelle entwickelt, um pandemischen Situationen vorzubeugen. Im Projekt wurde ein Modell entwickelt, welches Mobilitätsdaten für das Land Berlin genutzt hat.
Massenbewegungsdaten Pandemie 2020/2021 Pandemieforschung: • Bewegungsmodelle • Datenbank für den „Lockdown Monitor“ Daten: • Untersuchung der Auswirkungen der Eindämmungsstrategie T-Systems liefert Massenmobilitätsdatensätze auf Basis anonymisierter Signaldaten aus dem deutschen Mobilfunknetz der Datensatz: Deutschen Telekom. • Origin-Destination-Matrix in Stunden- und Tagesauflösung und auf Fortlaufende tägliche Lieferung von Datensätzen an das Robert- kleinstmöglicher Geometrie und AGS8. Koch-Institut (RKI), einschließlich historischer Daten seit 01.2019 Christmas BEISPIEL SACHSEN: Bewegungen pro Tag Ausgangspunkt der Bewegung in Sachsen Aggregiert auf Stadt- und Kreisebene Beobachtungszeitraum 07.12.2020 - 10.01.2021
Massenbewegungsdaten Pandemie 2020/2021 Pandemieforschung: • Bewegungsmodelle • Datenbank für den „Lockdown Monitor“ Daten: • Untersuchung der Auswirkungen der Eindämmungsstrategie T-Systems liefert Massenmobilitätsdatensätze auf Basis anonymisierter Signaldaten aus dem deutschen Mobilfunknetz der Datensatz: Deutschen Telekom. • Origin-Destination-Matrix in Stunden- und Tagesauflösung und auf Fortlaufende tägliche Lieferung von Datensätzen an das Robert- kleinstmöglicher Geometrie und AGS8. Koch-Institut (RKI), einschließlich historischer Daten seit 01.2019 ORIGIN: DESTINATION TOP 10: DESTINATION ALL: MotionData Traffic Cells with a These are the top 10 destinations in a specific timeframe starting All Destinations in a specific timeframe starting from spatial resolution from 500x500m up to 8x8 km. from ORIGIN, the bigger the circles, the higher the number of trips. ORIGIN, the bigger the circles, the higher the number of trips.
Massenbewegungsdaten Mobilität in Großstädten im Vergleich2020/2021 Analysierte Städte Anzahl der binnen Bewegungen pro Einwohner
Massenbewegungsdaten Mobilität nach Einwohnerstärke - Gezeigt werden alle Trips, die nur innerhalb der Stadtgrenzen statt finden - Normiert auf die Population in den Städten (laut Destatis) - Sa/So entfernt (am Wochenende bricht die Mobilität ein und verzerrt das Bild) - Zeitraum: 4 Wochen ab 16.11.2020 - Platz 1: Thüringen, Platz 2: Sachsen, Platz 3: Niedersachsen, Platz 4: Sachsen-Anhalt - Alle anderen Bundesländer liegen darunter Buß- und Bettag (nur Sachsen) 14
Massenbewegungsdaten und Gesundheitsdaten Kombination aus Mobilitätsdaten und Datenspende
Massenbewegungsdaten und Gesundheitsdaten Kombination aus Mobilitätsdaten und Datenspende < <
Massenbewegungsdaten und Gesundheitsdaten Forschungsprojekt PANDA Pandemie Analyse mittels Advanced Analytics Methoden (PANDA) Zeitraum: 09/2021 – 06/2023
Massenbewegungsdaten und Gesundheitsdaten Forschungsprojekt PANDA - Idee Eine Eindämmung der ortsbezogenen Infektionsbewegung funktioniert nur im Kontext der Betrachtung des Gesamtsystems. Daher analysieren wir Bewegungsdaten, indem wir diese als Eigenschaften (KPIs) den Orten zuweisen. Um Auswirkungen von Infektionen vorherzusagen, wird die Ausbreitungsgeschwindigkeit als in Relation zur Mobilität der jeweiligen Orte und der relativen zeitlichen Entfernung dieser betrachtet. (Welleneffekte) Unter Berücksichtigung der Mobilität und Infektionsentwicklung innerhalb eines Ortes können mit Hilfe von Machine Learning Methoden ortsübergreifende Wirkeffekte und Abhängigkeiten der Ausbreitung einer Pandemie vorhergesagt werden.
Maßnahmen in pandemischen Situationen Forschungsprojekt PANDA - Idee Projektziele: • Zusammenhänge von Mobilität und Infektionsgeschehen erforschen • Wirkungseffekten von Mobilität auf das Infektionsgeschehen in Landkreisen messbar und vorhersagbar machen • Auf Basis von mobilen Bewegungsdaten sollen kritische geographische Epizentren identifiziert werden, welche direkt oder indirekt zur Ausbreitung des Virus beitragen. • Es sollen die Orte erkannt werden, welche anhand ihrer lokalen Eigenschaften wie Demographie oder anderer Risiken besonders gefährdet sind für hereingetragene Infektionen. • Ortsbezogene Eigenschaften sollen für Entscheidungsvalidierung für Maßnahmen simulierbar sein, um potentielle Effekte von Corona-Maßnahmen besser abschätzbar zu machen
Massenbewegungsdaten und Gesundheitsdaten Forschungsprojekt PANDA - Perspektivwechsel Welleneffekte des Ausbreitungsgeschehens: Beschreibt auf Basis der zeitlichen Entfernung und des Mobilitätsaufkommens von Orten, wie schnell ein Problem von A nach B eskalieren kann: ▪ Werden die Orts-Distanzen anhand der Mobilität und der Ausbreitungseffekte der Infektionswellen zwischen den Orten bestimmt, kann die potentielle Infektiosität zueinander unter der Annahme einer konstanten maximalen Geschwindigkeit der Ausbreitung modelliert werden. (Welle) ▪ Indem wir ermitteln, in welchen zeitlichen Abständen Infektionswellen über Landkreise hinweg expandieren, können wir vorhersagen, ob und wie schnell ein Problem oder eine Zustandsänderung des Systems von A nach B expandieren kann. Daraus können wir Wirk-Zustände & Zusammenhänge von A auf B (und umgekehrt) zu unterschiedlichen Zeitpunkten ableiten.
Massenbewegungsdaten und Gesundheitsdaten Forschungsprojekt PANDA 1. Datengrundlage definieren 3. Vorverarbeitung Mobile Infektio Daten nsdaten Bewegungsdaten (Knoten; Topologie; Richtungen; 5. GUI / Interface Orte; Zeit etc.) 2. Daten Integration Orts/Infektions-logik Input Output Panda (Gesundheitsmaße; KPI / Zielgrößen, Ausbreitung) DB - 4. Cases für Berechnung/ Wirkanalysen Simulation Go… Algorithmik
Bisherige Ergebnisse
Massenbewegungsdaten und Gesundheitsdaten Data Aggregation & Data Fusion Welche Zusammenhänge bestehen im Datenraum? Herausforderung: Verbindung von unterschiedlichen Datentypen und Kopplung der Daten für ganzheitliche Analysen.
Massenbewegungsdaten und Gesundheitsdaten Probleme bei der Datenanalyse - Fusion • Meldeverzug bei Infektionsdaten schwankt bis zu 1 Woche • Daten haben künstlichen Wochenzyklus (Wochenenden ohne klaren Meldezeitpunkt) • Stark variable Dunkelziffer bei Infektionsdaten (verändert sich je nach Ort und Zeitraum); kein Konsens zur Handhabe • Infektionsdatum vs. Meldedatum (meist gleiches Datum) • Unterschiedliche Richtlinien, Dokumentationspraxis bei Infektionsdaten • Inkonsistente Infektionsorte: mal Gemeinde, mal PLZ, mal Screeninglabor • Kein deutschlandweit einheitliches Datenformat / hohe Fragmentierung • Maßnahmen-Flickenteppich und „Always-On“-Maßnahmen erlauben keine zeitlich abgrenzbare Analyse von Effekten
Wie unterscheiden sich Landkreise im Kontext von Mobilität und Infektionsgeschehen?
Massenbewegungsdaten und Gesundheitsdaten Wie unterscheiden sich Landkreise, in denen bestimmte Varianten gefunden wurden, hinsichtlich ihrer Mobilität ? Clustering mithilfe von soziodemografischen Faktoren: • Wahlergebnisse • Besiedlungsdichte • Altersstruktur • Betreuungsschlüssel • Einkommen Das Cluster zeigt klare Gruppierungen für die Unterscheidung von Ost-West & Groß/Klein-Landkreise (obwohl keine geographischen Eigenschaften mitgegeben wurden)
Massenbewegungsdaten und Gesundheitsdaten Wie können Landkreise geclustert werden (Mobilität – Inzidenz)? Wo finden wir kausale Zusammenhänge zwischen Mobilität, Infektion, Maßnahmen und Wetter-Faktoren. Findings: Zusammenhänge nur teilweise vorhanden aber keine konsistente Ergebnislage, wenn Gesamtzeitraum und geogr. Gesamtraum betrachtet wird. Ergebnisse werden besser, wenn zeitliche und räumliche Differenzierung gemacht wird.
Maßnahmen in pandemischen Situationen Können Landkreise anhand der Daten geclustert werden? Welche Landkreise sind hinsichtlich Kausalitäten zwischen ihren Eigenschaften ähnlich? Findings: Ergebnisse bestätigen teilweise, dass moderate Zusammenhänge in bestimmten Landkreisen bestehen.
Massenbewegungsdaten und Gesundheitsdaten Welche Ortsbezogenen Eigenschaften beeinflussen sich gegenseitig? Landkreise verhalten sich im Infektionsgeschehen Je nach Zeit und Situation sind Landkreise teilweise ähnlich unterschiedlich – jeder Landkreis muss individuell oder unähnlicher hinsichtlich ihrer dynamischen Eigenschaften betrachtet werden. und deren Wirkung im zeitlichen Abstand aufeinander. Momentual conditional independence (MCI) Auto> Autokorrelation Cross > Kreuz-Kausalitiät
Massenbewegungsdaten und Gesundheitsdaten Wie unterscheiden sich Landkreise, in denen bestimmte Varianten gefunden wurden, hinsichtlich ihrer (in/outbound) Mobilität? • Wie unterscheidet sich die Mobilität in Virusmutations-Clustern? • Grün: Mobilität innerhalb des Mutations-Clusters (in-cluster) • Orange: Mobilität aus dem Cluster raus (out-bound) • Im Zeitverlauf wächst das Cluster, damit auch die „infektiöse (out- bound-) Mobilität“ Mobilität out-bound in-cluster Mobilität Anzahl Landkreise im Infektionscluster Datum
Massenbewegungsdaten und Gesundheitsdaten Wie unterscheiden sich Landkreise, in denen bestimmte Varianten gefunden wurden, hinsichtlich ihrer (in/outbound) Mobilität? • Mit jedem neuen Landkreis im • Es kommen Landkreise hinzu, • Nur Landkreis 3 und 7 führen • Während Cluster wächst, • Mit Zunahme infizierter Landkreise Cluster steigt in-cluster-mob. die wenig an der in-cluster- zu starkem Anstieg der out- verändert sich in-cluster- wächst das Cluster; • Out-bound Mob. steigt nicht, sinkt mob verändern bound- Mobilität des Mobilität • Cluster Mobilität steigt kontinuierlich sogar relativ zur Cluster-Größe • Out-bound Mobilität steigt Clusters • Outbound Mobilität nicht (in-cluster & outbound) erst mit dem 4. Landkreis • >> Es kommen Landkreise • Landkreis 3 & 5 besonderen Einfluss mit schwacher outbound- • DEFAULT-Case (Das Verhalten der mobilität hinzu Cluster wäre naiv zu erwarten) Findings: • Es gibt Cluster, die zusammenhängen und es gibt Infektionscluster, die verstreut sind in TH. • Bei zusammenhängenden Clustern überholt grün die orange Linie mit stetigem Wachstum. • Wenn Cluster über TH verstreut, dann bleibt orange weiter über grüner Linie, obwohl das Cluster wächst. • Obwohl die Anzahl d. Landkreise in Infektionsclustern von Sub-Typen von COVID-19 steigt, ändert sich die Outbound-Mobilität nur bei Hinzukommen bestimmter Landkreise, bei anderen nicht. Diese sind potentiell besonders gefährlich für die weitere Ausbreitung der Variante, da sie eine hohe Out-bound-Mobilität ins Infektionscluster bringen.
Massenbewegungsdaten und Gesundheitsdaten Bisheriger Ergebnisse: Untersuchung von potentieller Ausbreitung von COVID-Varianten Wo wurde die neue Variante gefunden? Welche Orte haben hohen mobilen Austausch mit Landkreisen, wo die Variante gefunden / noch nicht gefunden wurde (mit Variante „infiziert“), so dass die neue Variante dort zu erwarten ist?
Maßnahmen in pandemischen Situationen Bisheriger Ergebnisse: Untersuchung von potentieller Ausbreitung von COVID-Varianten Lagebild 4 Wochen später… Begrenzte Ressourcen zur Proben-Sequenzierung können effektiver eingesetzt werden für ein besseres Lagebild. Anwendungsfall: Die potentielle Ausbreitung von Varianten wird anhand der mobilen „Interaktion“ von Landkreisen strukturiert auswertbar. Mit der Information, welche Landkreise einen potentiell hohen Infektionsaustausch mit infizierten Orten haben, kann das UKJ gezielt in Landkreise gehen um Proben auf neue Varianten zu untersuchen.
Massenbewegungsdaten und Gesundheitsdaten Wirkanalyse Thüringen Wirkungsanalyse: Welchen Einfluss hat die Mobilität von bestimmten Landkreisen auf ein Bundesland bzw. einen bestimmten Ziellandkreis? Im Beispiel wird gezeigt, welche Landkreise über ihre Mobilität eine hohe potentielle Wirkung auf das Infektionsgeschehen im gesamten Bundesland Thüringen hatten. (work in progress)
HABEN SIE FRAGEN?
Ihre Ansprechpartner Tino Bliesener +49 160 11 58 316 tino.bliesener@telekom.de
Sie können auch lesen