Massenbewegungsdaten in Kombination mit Gesundheitsdaten für Maßnahmen in pandemischen Situationen Deutsche Telekom, Tino Bliesener, 17.11.2022

 
WEITER LESEN
Massenbewegungsdaten in Kombination mit Gesundheitsdaten für Maßnahmen in pandemischen Situationen Deutsche Telekom, Tino Bliesener, 17.11.2022
Massenbewegungsdaten
in Kombination mit Gesundheitsdaten für
Maßnahmen in pandemischen Situationen

Deutsche Telekom, Tino Bliesener, 17.11.2022
Massenbewegungsdaten in Kombination mit Gesundheitsdaten für Maßnahmen in pandemischen Situationen Deutsche Telekom, Tino Bliesener, 17.11.2022
Massenbewegungsdaten
• Statistische Auswertung anonymisierter
  Signalisierungsdaten aus dem
  Mobilfunknetz der Deutschen Telekom

• Auswertung der Daten für Deutschland

• Anreicherung mit weiteren Datensätzen
  möglich
Massenbewegungsdaten in Kombination mit Gesundheitsdaten für Maßnahmen in pandemischen Situationen Deutsche Telekom, Tino Bliesener, 17.11.2022
Mehr als 60       Individuelle und   Stichprobe: über   Hochrechnung      Anonymisierungs-
Milliarden        standardisierte    30% der Gesamt-    auf die Gesamt-   verfahren nach
Signale pro Tag   Geometrie          bevölkerung        bevölkerung       BfDI und DSGVO
Massenbewegungsdaten in Kombination mit Gesundheitsdaten für Maßnahmen in pandemischen Situationen Deutsche Telekom, Tino Bliesener, 17.11.2022
Geo-Informationen                  Soziodemografie                      Anonymisierung
Informationen aus anonymisierten   Anonymisierte Informationen aus      Datenverarbeitungs- und
Mobilfunksignalen:                 der Datenbank:                       Anonymisierungsprozess
                                                                        freigegeben durch
▪ Anzahl Personen, Verweildauer    ▪ Alter (Altersgruppe), Geschlecht
▪ Start- und Zielort von Trips     ▪ Wohnort - Postleitzahl
▪ Herkunftsbestimmung durch das    ▪ Anreicherung mit statistischen
  erste Signal des Tages             Daten (Kaufkraft, Milieu etc.)
Massenbewegungsdaten in Kombination mit Gesundheitsdaten für Maßnahmen in pandemischen Situationen Deutsche Telekom, Tino Bliesener, 17.11.2022
Analyse       Potentialanalyse                      OOH Echtzeit-
 Retail Analytics                                         Tagestouristen    aussteuerung
                    Shopping Center      Bahnhöfe

    Analyse            Analyse                            Internationale   OOH Reduzierung
                                      Whitespot Analyse
Fachmarktzentrum    Fußgängerzone                            Touristen       Streuverluste

                    Standortanalyse                                          Optimierung
                     „Straßenlage“                                           Werbegebiet
Massenbewegungsdaten in Kombination mit Gesundheitsdaten für Maßnahmen in pandemischen Situationen Deutsche Telekom, Tino Bliesener, 17.11.2022
Aktualisierung      Optimierung ÖPNV      Potentialanalyse     Auswertung         Fahrgastzählung
 Verkehrsmodelle       ländlicher Raum        Fernbusnetz       Großereignisse          U-Bahn

Querschnittszählung    Geschäftsgebiets-                         Netzplanung        Potentialanalyse
                                            Pendleranalyse
     Autobahn         planung Ridesharing                        Ladesäulen            Flughäfen

Einnahmeverteilung       Gesundheits-       Fahrgastzählung
                                                               Klimazielerfüllung
      ÖPNV                forschung               Zug
Massenbewegungsdaten in Kombination mit Gesundheitsdaten für Maßnahmen in pandemischen Situationen Deutsche Telekom, Tino Bliesener, 17.11.2022
Massenbewegungsdaten in Kombination mit Gesundheitsdaten für Maßnahmen in pandemischen Situationen Deutsche Telekom, Tino Bliesener, 17.11.2022
Massenbewegungsdaten in Kombination mit Gesundheitsdaten für Maßnahmen in pandemischen Situationen Deutsche Telekom, Tino Bliesener, 17.11.2022
Massenbewegungsdaten und Gesundheitsdaten
für Maßnahmen in pandemischen Situationen
Massenbewegungsdaten in Kombination mit Gesundheitsdaten für Maßnahmen in pandemischen Situationen Deutsche Telekom, Tino Bliesener, 17.11.2022
Massenbewegungsdaten und Gesundheitsdaten
Ausbreitungsmodelle 2018/19
Das RKI hat mit den Mobilitätsdaten der Deutschen Telekom in Verbindung
mit Gesundheitsdaten bereits im Jahr 2018 Vorhersagemodelle entwickelt,
um pandemischen Situationen vorzubeugen.
Im Projekt wurde ein Modell entwickelt, welches Mobilitätsdaten für das
Land Berlin genutzt hat.
Massenbewegungsdaten
Pandemie 2020/2021
Pandemieforschung:
• Bewegungsmodelle
• Datenbank für den „Lockdown Monitor“                               Daten:
• Untersuchung der Auswirkungen der Eindämmungsstrategie             T-Systems liefert Massenmobilitätsdatensätze auf Basis
                                                                     anonymisierter Signaldaten aus dem deutschen Mobilfunknetz der
Datensatz:                                                           Deutschen Telekom.
• Origin-Destination-Matrix in Stunden- und Tagesauflösung und auf   Fortlaufende tägliche Lieferung von Datensätzen an das Robert-
   kleinstmöglicher Geometrie und AGS8.                              Koch-Institut (RKI), einschließlich historischer Daten seit 01.2019

                                                  Christmas
                                                                                                  BEISPIEL SACHSEN:
                                                                                                  Bewegungen pro Tag
                                                                                                  Ausgangspunkt der Bewegung in Sachsen
                                                                                                  Aggregiert auf Stadt- und Kreisebene
                                                                                                  Beobachtungszeitraum 07.12.2020 - 10.01.2021
Massenbewegungsdaten
Pandemie 2020/2021
Pandemieforschung:
• Bewegungsmodelle
• Datenbank für den „Lockdown Monitor“                                                                     Daten:
• Untersuchung der Auswirkungen der Eindämmungsstrategie                                                   T-Systems liefert Massenmobilitätsdatensätze auf Basis
                                                                                                           anonymisierter Signaldaten aus dem deutschen Mobilfunknetz der
Datensatz:                                                                                                 Deutschen Telekom.
• Origin-Destination-Matrix in Stunden- und Tagesauflösung und auf                                         Fortlaufende tägliche Lieferung von Datensätzen an das Robert-
   kleinstmöglicher Geometrie und AGS8.                                                                    Koch-Institut (RKI), einschließlich historischer Daten seit 01.2019

ORIGIN:                                          DESTINATION TOP 10:                                                    DESTINATION ALL:
MotionData Traffic Cells with a                  These are the top 10 destinations in a specific timeframe starting     All Destinations in a specific timeframe starting from
spatial resolution from 500x500m up to 8x8 km.   from ORIGIN, the bigger the circles, the higher the number of trips.   ORIGIN, the bigger the circles, the higher the number of trips.
Massenbewegungsdaten
Mobilität in Großstädten im Vergleich2020/2021
   Analysierte Städte         Anzahl der binnen Bewegungen pro Einwohner
Massenbewegungsdaten
Mobilität nach Einwohnerstärke

- Gezeigt werden alle Trips, die nur innerhalb der
  Stadtgrenzen statt finden
- Normiert auf die Population in den Städten (laut
  Destatis)
- Sa/So entfernt (am Wochenende bricht die Mobilität
  ein und verzerrt das Bild)
- Zeitraum: 4 Wochen ab 16.11.2020
- Platz 1: Thüringen, Platz 2: Sachsen, Platz 3:
  Niedersachsen, Platz 4: Sachsen-Anhalt
- Alle anderen Bundesländer liegen darunter

                                                       Buß- und Bettag (nur Sachsen)   14
Massenbewegungsdaten und Gesundheitsdaten
Kombination aus Mobilitätsdaten und Datenspende
Massenbewegungsdaten und Gesundheitsdaten
Kombination aus Mobilitätsdaten und Datenspende

       <                                          <
Massenbewegungsdaten und Gesundheitsdaten
Forschungsprojekt PANDA
Pandemie Analyse mittels Advanced Analytics Methoden (PANDA)

Zeitraum: 09/2021 – 06/2023
Massenbewegungsdaten und Gesundheitsdaten
Forschungsprojekt PANDA - Idee
Eine Eindämmung der ortsbezogenen Infektionsbewegung funktioniert nur im
Kontext der Betrachtung des Gesamtsystems. Daher analysieren wir
Bewegungsdaten, indem wir diese als Eigenschaften (KPIs) den Orten zuweisen.

Um Auswirkungen von Infektionen vorherzusagen, wird die
Ausbreitungsgeschwindigkeit als in Relation zur Mobilität der jeweiligen Orte und
der relativen zeitlichen Entfernung dieser betrachtet. (Welleneffekte)

Unter Berücksichtigung der Mobilität und Infektionsentwicklung innerhalb eines
Ortes können mit Hilfe von Machine Learning Methoden ortsübergreifende
Wirkeffekte und Abhängigkeiten der Ausbreitung einer Pandemie vorhergesagt
werden.
Maßnahmen in pandemischen Situationen
Forschungsprojekt PANDA - Idee
Projektziele:

•   Zusammenhänge von Mobilität und Infektionsgeschehen erforschen

•   Wirkungseffekten von Mobilität auf das Infektionsgeschehen in Landkreisen messbar und
    vorhersagbar machen

•   Auf Basis von mobilen Bewegungsdaten sollen kritische geographische Epizentren
    identifiziert werden, welche direkt oder indirekt zur Ausbreitung des Virus beitragen.

•   Es sollen die Orte erkannt werden, welche anhand ihrer lokalen Eigenschaften wie
    Demographie oder anderer Risiken besonders gefährdet sind für hereingetragene
    Infektionen.

•   Ortsbezogene Eigenschaften sollen für Entscheidungsvalidierung für Maßnahmen
    simulierbar sein, um potentielle Effekte von Corona-Maßnahmen besser abschätzbar zu
    machen
Massenbewegungsdaten und Gesundheitsdaten
Forschungsprojekt PANDA - Perspektivwechsel

                       Welleneffekte des Ausbreitungsgeschehens:
                       Beschreibt auf Basis der zeitlichen Entfernung und des Mobilitätsaufkommens von Orten, wie
                       schnell ein Problem von A nach B eskalieren kann:
                         ▪ Werden die Orts-Distanzen anhand der Mobilität und der Ausbreitungseffekte der
                             Infektionswellen zwischen den Orten bestimmt, kann die potentielle Infektiosität
                             zueinander unter der Annahme einer konstanten maximalen Geschwindigkeit der
                             Ausbreitung modelliert werden. (Welle)

                         ▪ Indem wir ermitteln, in welchen zeitlichen Abständen Infektionswellen über Landkreise
                             hinweg expandieren, können wir vorhersagen, ob und wie schnell ein Problem oder eine
                             Zustandsänderung des Systems von A nach B expandieren kann. Daraus können wir
                             Wirk-Zustände & Zusammenhänge von A auf B (und umgekehrt) zu unterschiedlichen
                             Zeitpunkten ableiten.
Massenbewegungsdaten und Gesundheitsdaten
Forschungsprojekt PANDA
1. Datengrundlage definieren
                                       3. Vorverarbeitung
      Mobile      Infektio
      Daten       nsdaten              Bewegungsdaten
                                       (Knoten; Topologie; Richtungen;
                                                                                 5. GUI / Interface
                                               Orte; Zeit etc.)
2. Daten
Integration

                                       Orts/Infektions-logik             Input                        Output
               Panda                      (Gesundheitsmaße; KPI /
                                          Zielgrößen, Ausbreitung)
                DB

                                                                          -
 4. Cases für
 Berechnung/            Wirkanalysen          Simulation                 Go…
 Algorithmik
Bisherige Ergebnisse
Massenbewegungsdaten und Gesundheitsdaten
Data Aggregation & Data Fusion
                                 Welche Zusammenhänge bestehen im Datenraum?
                                 Herausforderung: Verbindung von unterschiedlichen
                                 Datentypen und Kopplung der Daten für ganzheitliche
                                 Analysen.
Massenbewegungsdaten und Gesundheitsdaten
Probleme bei der Datenanalyse - Fusion

• Meldeverzug bei Infektionsdaten schwankt bis zu 1 Woche
 • Daten haben künstlichen Wochenzyklus (Wochenenden ohne klaren Meldezeitpunkt)
• Stark variable Dunkelziffer bei Infektionsdaten (verändert sich je nach Ort und Zeitraum);
  kein Konsens zur Handhabe
• Infektionsdatum vs. Meldedatum (meist gleiches Datum)
• Unterschiedliche Richtlinien, Dokumentationspraxis bei Infektionsdaten
 • Inkonsistente Infektionsorte: mal Gemeinde, mal PLZ, mal Screeninglabor
 • Kein deutschlandweit einheitliches Datenformat / hohe Fragmentierung
 • Maßnahmen-Flickenteppich und „Always-On“-Maßnahmen erlauben keine zeitlich
   abgrenzbare Analyse von Effekten
Wie unterscheiden sich Landkreise im
     Kontext von Mobilität und
       Infektionsgeschehen?
Massenbewegungsdaten und Gesundheitsdaten
Wie unterscheiden sich Landkreise, in denen bestimmte Varianten
gefunden wurden, hinsichtlich ihrer Mobilität ?
                                     Clustering mithilfe von soziodemografischen
                                     Faktoren:

                                     •   Wahlergebnisse
                                     •   Besiedlungsdichte
                                     •   Altersstruktur
                                     •   Betreuungsschlüssel
                                     •   Einkommen

                                     Das Cluster zeigt klare Gruppierungen für
                                     die Unterscheidung von Ost-West &
                                     Groß/Klein-Landkreise (obwohl keine
                                     geographischen Eigenschaften mitgegeben
                                     wurden)
Massenbewegungsdaten und Gesundheitsdaten
Wie können Landkreise geclustert werden (Mobilität – Inzidenz)?
 Wo finden wir kausale Zusammenhänge zwischen Mobilität, Infektion, Maßnahmen und
 Wetter-Faktoren.
 Findings: Zusammenhänge nur teilweise vorhanden aber keine konsistente Ergebnislage, wenn Gesamtzeitraum
 und geogr. Gesamtraum betrachtet wird.
 Ergebnisse werden besser, wenn zeitliche und räumliche Differenzierung gemacht wird.
Maßnahmen in pandemischen Situationen
Können Landkreise anhand der Daten geclustert werden?
Welche Landkreise sind hinsichtlich Kausalitäten zwischen ihren Eigenschaften ähnlich?

Findings: Ergebnisse bestätigen teilweise, dass moderate Zusammenhänge in bestimmten Landkreisen
bestehen.
Massenbewegungsdaten und Gesundheitsdaten
Welche Ortsbezogenen Eigenschaften beeinflussen sich gegenseitig?
Landkreise verhalten sich im Infektionsgeschehen     Je nach Zeit und Situation sind Landkreise teilweise ähnlich
unterschiedlich – jeder Landkreis muss individuell   oder unähnlicher hinsichtlich ihrer dynamischen Eigenschaften
betrachtet werden.                                   und deren Wirkung im zeitlichen Abstand aufeinander.

  Momentual conditional independence (MCI)
  Auto> Autokorrelation
  Cross > Kreuz-Kausalitiät
Massenbewegungsdaten und Gesundheitsdaten
Wie unterscheiden sich Landkreise, in denen bestimmte Varianten
gefunden wurden, hinsichtlich ihrer (in/outbound) Mobilität?
                                                     • Wie unterscheidet sich die Mobilität in
                                                       Virusmutations-Clustern?

                                                     • Grün: Mobilität innerhalb des
                                                       Mutations-Clusters (in-cluster)
                                                     • Orange: Mobilität aus dem Cluster
                                                       raus (out-bound)

                                                     • Im Zeitverlauf wächst das Cluster,
                                                       damit auch die „infektiöse (out-
                                                       bound-) Mobilität“

                                                              Mobilität out-bound
                                                              in-cluster Mobilität

                                                              Anzahl Landkreise im Infektionscluster
                                                              Datum
Massenbewegungsdaten und Gesundheitsdaten
Wie unterscheiden sich Landkreise, in denen bestimmte Varianten
gefunden wurden, hinsichtlich ihrer (in/outbound) Mobilität?

   • Mit jedem neuen Landkreis im         • Es kommen Landkreise hinzu,    • Nur Landkreis 3 und 7 führen • Während Cluster wächst,      • Mit Zunahme infizierter Landkreise
     Cluster steigt in-cluster-mob.         die wenig an der in-cluster-     zu starkem Anstieg der out-    verändert sich in-cluster-     wächst das Cluster;
   • Out-bound Mob. steigt nicht, sinkt     mob verändern                    bound- Mobilität des           Mobilität                    • Cluster Mobilität steigt kontinuierlich
     sogar relativ zur Cluster-Größe      • Out-bound Mobilität steigt       Clusters                     • Outbound Mobilität nicht       (in-cluster & outbound)
                                            erst mit dem 4. Landkreis                                     • >> Es kommen Landkreise      • Landkreis 3 & 5 besonderen Einfluss
                                                                                                            mit schwacher outbound-      • DEFAULT-Case (Das Verhalten der
                                                                                                            mobilität hinzu                Cluster wäre naiv zu erwarten)

   Findings:
   • Es gibt Cluster, die zusammenhängen und es gibt Infektionscluster, die verstreut sind in TH.
   • Bei zusammenhängenden Clustern überholt grün die orange Linie mit stetigem Wachstum.
   • Wenn Cluster über TH verstreut, dann bleibt orange weiter über grüner Linie, obwohl das Cluster wächst.
   • Obwohl die Anzahl d. Landkreise in Infektionsclustern von Sub-Typen von COVID-19 steigt, ändert sich die Outbound-Mobilität nur
       bei Hinzukommen bestimmter Landkreise, bei anderen nicht. Diese sind potentiell besonders gefährlich für die weitere
       Ausbreitung der Variante, da sie eine hohe Out-bound-Mobilität ins Infektionscluster bringen.
Massenbewegungsdaten und Gesundheitsdaten
Bisheriger Ergebnisse: Untersuchung von potentieller Ausbreitung von
COVID-Varianten

                                                                                   Wo wurde die neue
                                                                                   Variante gefunden?

                                 Welche Orte haben hohen mobilen Austausch mit
                                 Landkreisen, wo die Variante gefunden / noch nicht
                                 gefunden wurde (mit Variante „infiziert“), so dass die
                                 neue Variante dort zu erwarten ist?
Maßnahmen in pandemischen Situationen
Bisheriger Ergebnisse: Untersuchung von potentieller Ausbreitung von
COVID-Varianten

                                                                                                                                           Lagebild 4 Wochen
                                                                                                                                           später…

                                                                        Begrenzte Ressourcen zur Proben-Sequenzierung können effektiver
                                                                        eingesetzt werden für ein besseres Lagebild.
Anwendungsfall: Die potentielle Ausbreitung von Varianten wird anhand der mobilen „Interaktion“ von Landkreisen strukturiert auswertbar.
Mit der Information, welche Landkreise einen potentiell hohen Infektionsaustausch mit infizierten Orten haben, kann das UKJ gezielt in Landkreise gehen um Proben
auf neue Varianten zu untersuchen.
Massenbewegungsdaten und Gesundheitsdaten
Wirkanalyse Thüringen
                                     Wirkungsanalyse:
                                     Welchen Einfluss hat die
                                     Mobilität von
                                     bestimmten Landkreisen
                                     auf ein Bundesland bzw.
                                     einen bestimmten
                                     Ziellandkreis?

                                     Im Beispiel wird gezeigt,
                                     welche Landkreise über
                                     ihre Mobilität eine hohe
                                     potentielle Wirkung auf
                                     das Infektionsgeschehen
                                     im gesamten
                                     Bundesland Thüringen
                                     hatten. (work in
                                     progress)
HABEN SIE
FRAGEN?
Ihre Ansprechpartner
Tino Bliesener
+49 160 11 58 316
tino.bliesener@telekom.de
Sie können auch lesen