Ansätze zu konsistenter Pseudonymfindung für klinische Dokumente - 80% Unstrukturierte Daten

Die Seite wird erstellt Jannis Rose
 
WEITER LESEN
Ansätze zu konsistenter Pseudonymfindung für klinische Dokumente - 80% Unstrukturierte Daten
20% Strukturierte Daten

Ansätze zu konsistenter Pseudonymfindung
         für klinische Dokumente
                                          80% Unstrukturierte Daten

            Stefan Schulz, Averbis GmbH
                     9.4.2021
WAS HEISST KONSISTENTE PSEUDONYMISIERUNG?

•     Zum Begriff "Pseudonymisierung"
                                                               HIPPAA PHI (Protected Health Information)
           Ersatz von Identifikatoren
                                                               Names (Full or last name and initial)
           Hier Ersatz aller PHI                               All geographical identifiers smaller than a state (…)
•     Sicherheit: keine Re-identifizierung möglich             Phone Numbers
                                                               Fax numbers
•     Plausibilität: das Ergebnis soll von einem               Email addresses
      Originaldokument in der Struktur nicht                   Social Security numbers
                                                               Medical record numbers
      unterscheidbar sein
                                                               Health insurance beneficiary numbers
•     Konsistenz: Durch Pseudonymisierung dürfen               Account numbers
      innerhalb von Dokumenten eines Patienten                 Certificate/license numbers
                                                               Vehicle identifiers
      keine Zusammenhänge (Personen,                           Device identifiers and serial numbers;
      Zeitangaben) verloren gehen                              Web Uniform Resource Locators (URLs)
                                                               Internet Protocol (IP) address numbers
                                                               Biometric identifiers, including finger, retinal and voice prints
    Disclaimer: die hier geäußerten Überlegungen sind          Full face photographic images and any comparable images
    Diskussionsbeiträge. Sie sind nicht in Averbis-Produkten   Any other unique identifying number, characteristic, or code (…)
    implementiert
Original                                                    Getaggt

Krankenhaus der Samariter Holzhausen                           Krankenhaus der Samariter
                                                               Holzhausen
Röntgenabteilung, Vorstand Prim. Univ. Prof. Dr.Dr. Gotthard
Vogler                                                         Röntgenabteilung, Vorstand Prim. Univ. Prof. Dr.Dr.
                                                               Gotthard Vogler

CT Abdomen und kl. Becken
                                                               CT Abdomen und kl. Becken

Name: Mustafa Üstün, * 21.06.67
                                                               Name: Mustafa Üstün, *
Aufnahmezahl: 1933309807                                       21.06.67
Abteilung: Chirurgie                                           Aufnahmezahl: 1933309807
Station: A31. OG. Viszeralchirurgie B /                        Abteilung: Chirurgie
Zi: 119                                                        Station: A31. OG. Viszeralchirurgie B /
                                                               Zi: 119
dikt. Arzt: OA Dr. Huber Karina
WinA. 06/07/2011                                               dikt. Arzt: OA Dr. Huber Karina
                                                               WinA. 06/01/2011
Getaggt                                                        Anonymisiert

Krankenhaus der Samariter                 XXXXXXXXXX XXXXXXXXXX
Holzhausen
                                                               Röntgenabteilung, Vorstand Prim. Univ. Prof. Dr.Dr. XXXXXXXX
Röntgenabteilung, Vorstand Prim. Univ. Prof. Dr.Dr.      XXXXXXXXXXXXXX
Gotthard Vogler

                                                               CT Abdomen und kl. Becken
CT Abdomen und kl. Becken

                                                               Name: XXXXXXX XXXXXXXXXX, * X.X.X
Name: Mustafa Üstün, *
21.06.67                                          Aufnahmezahl: XXXXXXXXXXXX

Aufnahmezahl: 1933309807                              Abteilung: Chirurgie

Abteilung: Chirurgie                                           Station: XXXXXXXXX XXXXXXXXXXX

Station: A31. OG. Viszeralchirurgie B /   Zi: 119

Zi: 119
                                                               dikt. Arzt: OA Dr. XXXXXXXXX XXXXXXXXX

dikt. Arzt: OA Dr. Huber Karina                   WinA. XX/XX/XXXX

WinA. 06/01/2011
Getaggt                                           Pseudonymisiert (separater Prozess)

Krankenhaus der Samariter                 Kantonsspital Friedrichshafen
Holzhausen
                                                               Röntgenabteilung, Vorstand Prim. Univ. Prof. Dr.Dr.
Röntgenabteilung, Vorstand Prim. Univ. Prof. Dr.Dr.      Gerhard Voigtländer
Gotthard Vogler

                                                               CT Abdomen und kl. Becken
CT Abdomen und kl. Becken

                                                               Name: Manuel Überreuter, * 1.07.69
Name: Mustafa Üstün, *
21.06.67                                          Aufnahmezahl: 9983209971

Aufnahmezahl: 1933309807                              Abteilung: Chirurgie

Abteilung: Chirurgie                                           Station: Station Sauerbruch

Station: A31. OG. Viszeralchirurgie B /   Zi: 119

Zi: 119
                                                               dikt. Arzt: OA Dr. Heilmann Kristina

dikt. Arzt: OA Dr. Huber Karina                   WinA. 16/07/2013

WinA. 06/01/2011
VERSCHIEBEN VON ZEITANGABEN
UNTERSCHIEDLICHER GRANULARITÄT

  Einheit      Algorithmus                                   Beispiel (offset = 300)
  Tag          dpseudo = dorig + offset                      11.03.2021 –> 05.01.2022
  Monat        dmedian = floor ( median ( days ( morig )))   3/2021 –> 16.03.2021
               mpseudo = month ( dorig + offset )            16.03.2021 –> 10.01.2022 –> 1/2022
  Jahr         dmedian = floor ( median(days(yorig )))       2021 –> 01.07.2021
               ypseudo = year ( dorig + offset )             01.07.2021 –> 27.04.2022 –> 2022
  Nominale Zeitangaben
  Feiertage    Ersatz durch unspezifische Angaben oder       "am Karfreitag, den 4. April operiert" -> "am
               Weglassen                                     Karfreitag, den 3. Januar" operiert -> "am 3.
                                                             Januar operiert"
                                                             "nach Pfingsten" -> "nach dem Feiertag"
  Quartale,    Analoges Vorgehen zu Monaten                  Sommer 2021 –> 07.08.2021
  Jahreszeit                                                 07.08.2021 –> 03.06.2022 –> Frühjahr 2022
PERSONENNAMEN:
NORMALISIERUNG / KATEGORISIERUNG

Namensbestandteile                                          Beispiel
Trennzeichen                Leerzeichen                     Anna Osler-> ('Anna', 'Osler')
Bindestrich                 Kein Trennzeichen               Eva-Maria Rau ->('Eva-Maria','Rau')
1. Buchstabe klein          Ignoriert                       'van Beethoven' -> 'Beethoven'
Token bis ceil(median(n))   Vornamen (V), dann              'Kim Yong Il Park Un'
                            Nachnamen (N)                   V: 'Kim Yon Il', N: 'Park Un'
Namenszusätze
Mit Punkt                   Ignoriert                       'Dr.', 'Prof.', 'Dipl.-Ing','Jr.'
Ohne Punkt                  Ignoriert (aus Lexikon)         'OA', 'PD', 'PhD', 'MBA'
Repetitionen                Ignoriert                       'Dr. Dr. Dr.' -> 'Dr'

PD Dr. med. Eva-Maria Gräfin von und zu Eulenhoven-Katzenfels PhD MBA

  Namenszusatz       Vorname      Vorname       Ignoriere              Nachname        Namenszusatz
NAMEN:
PSEUDONYMISIERUNG
Namen                                      Beispiel
Vornamen      Vornamenlexikon, indexiert   Zufallszahl r
              nach Initiale und            W = (…,'Andrea', 'Agnes', …)
              Geschlecht                   'Anna' -> wr , z.B. 'Anna' -> 'Agnes'
Nachnamen     Nachnamenlexikon,            Zufallszahl r
              indexiert nach Initiale      N = (…,'Emmerich', 'Emmersdorfer', 'Eils', …)
                                           'Eberhard' -> nr , z.B. 'Eberhard' -> 'Emmerich'
Kombina-      Ausnahmen für seltene        'Yvonne Quervain' -> 'Annabel Müller'
tionen        Initialien
Institutionen Lexikon Pseudo-              'LKH Salzburg' -> 'Scheuermann-Klinik'
              Lokalisationen               'in HNO verlegt' -> 'in HNO verlegt'
              Abgleich mit Terminologie

PD Dr. med. Eva-Maria Gräfin von und zu Eulenhoven-Katzenfels PhD MBA

PD Dr. med. Elisabeth Gundula                         Emmersdorfer             PhD MBA
Sie können auch lesen