Ansätze zu konsistenter Pseudonymfindung für klinische Dokumente - 80% Unstrukturierte Daten
←
→
Transkription von Seiteninhalten
Wenn Ihr Browser die Seite nicht korrekt rendert, bitte, lesen Sie den Inhalt der Seite unten
20% Strukturierte Daten Ansätze zu konsistenter Pseudonymfindung für klinische Dokumente 80% Unstrukturierte Daten Stefan Schulz, Averbis GmbH 9.4.2021
WAS HEISST KONSISTENTE PSEUDONYMISIERUNG? • Zum Begriff "Pseudonymisierung" HIPPAA PHI (Protected Health Information) Ersatz von Identifikatoren Names (Full or last name and initial) Hier Ersatz aller PHI All geographical identifiers smaller than a state (…) • Sicherheit: keine Re-identifizierung möglich Phone Numbers Fax numbers • Plausibilität: das Ergebnis soll von einem Email addresses Originaldokument in der Struktur nicht Social Security numbers Medical record numbers unterscheidbar sein Health insurance beneficiary numbers • Konsistenz: Durch Pseudonymisierung dürfen Account numbers innerhalb von Dokumenten eines Patienten Certificate/license numbers Vehicle identifiers keine Zusammenhänge (Personen, Device identifiers and serial numbers; Zeitangaben) verloren gehen Web Uniform Resource Locators (URLs) Internet Protocol (IP) address numbers Biometric identifiers, including finger, retinal and voice prints Disclaimer: die hier geäußerten Überlegungen sind Full face photographic images and any comparable images Diskussionsbeiträge. Sie sind nicht in Averbis-Produkten Any other unique identifying number, characteristic, or code (…) implementiert
Original Getaggt Krankenhaus der Samariter Holzhausen Krankenhaus der Samariter Holzhausen Röntgenabteilung, Vorstand Prim. Univ. Prof. Dr.Dr. Gotthard Vogler Röntgenabteilung, Vorstand Prim. Univ. Prof. Dr.Dr. Gotthard Vogler CT Abdomen und kl. Becken CT Abdomen und kl. Becken Name: Mustafa Üstün, * 21.06.67 Name: Mustafa Üstün, * Aufnahmezahl: 1933309807 21.06.67 Abteilung: Chirurgie Aufnahmezahl: 1933309807 Station: A31. OG. Viszeralchirurgie B / Abteilung: Chirurgie Zi: 119 Station: A31. OG. Viszeralchirurgie B / Zi: 119 dikt. Arzt: OA Dr. Huber Karina WinA. 06/07/2011 dikt. Arzt: OA Dr. Huber Karina WinA. 06/01/2011
Getaggt Anonymisiert Krankenhaus der Samariter XXXXXXXXXX XXXXXXXXXX Holzhausen Röntgenabteilung, Vorstand Prim. Univ. Prof. Dr.Dr. XXXXXXXX Röntgenabteilung, Vorstand Prim. Univ. Prof. Dr.Dr. XXXXXXXXXXXXXX Gotthard Vogler CT Abdomen und kl. Becken CT Abdomen und kl. Becken Name: XXXXXXX XXXXXXXXXX, * X.X.X Name: Mustafa Üstün, * 21.06.67 Aufnahmezahl: XXXXXXXXXXXX Aufnahmezahl: 1933309807 Abteilung: Chirurgie Abteilung: Chirurgie Station: XXXXXXXXX XXXXXXXXXXX Station: A31. OG. Viszeralchirurgie B / Zi: 119 Zi: 119 dikt. Arzt: OA Dr. XXXXXXXXX XXXXXXXXX dikt. Arzt: OA Dr. Huber Karina WinA. XX/XX/XXXX WinA. 06/01/2011
Getaggt Pseudonymisiert (separater Prozess) Krankenhaus der Samariter Kantonsspital Friedrichshafen Holzhausen Röntgenabteilung, Vorstand Prim. Univ. Prof. Dr.Dr. Röntgenabteilung, Vorstand Prim. Univ. Prof. Dr.Dr. Gerhard Voigtländer Gotthard Vogler CT Abdomen und kl. Becken CT Abdomen und kl. Becken Name: Manuel Überreuter, * 1.07.69 Name: Mustafa Üstün, * 21.06.67 Aufnahmezahl: 9983209971 Aufnahmezahl: 1933309807 Abteilung: Chirurgie Abteilung: Chirurgie Station: Station Sauerbruch Station: A31. OG. Viszeralchirurgie B / Zi: 119 Zi: 119 dikt. Arzt: OA Dr. Heilmann Kristina dikt. Arzt: OA Dr. Huber Karina WinA. 16/07/2013 WinA. 06/01/2011
VERSCHIEBEN VON ZEITANGABEN UNTERSCHIEDLICHER GRANULARITÄT Einheit Algorithmus Beispiel (offset = 300) Tag dpseudo = dorig + offset 11.03.2021 –> 05.01.2022 Monat dmedian = floor ( median ( days ( morig ))) 3/2021 –> 16.03.2021 mpseudo = month ( dorig + offset ) 16.03.2021 –> 10.01.2022 –> 1/2022 Jahr dmedian = floor ( median(days(yorig ))) 2021 –> 01.07.2021 ypseudo = year ( dorig + offset ) 01.07.2021 –> 27.04.2022 –> 2022 Nominale Zeitangaben Feiertage Ersatz durch unspezifische Angaben oder "am Karfreitag, den 4. April operiert" -> "am Weglassen Karfreitag, den 3. Januar" operiert -> "am 3. Januar operiert" "nach Pfingsten" -> "nach dem Feiertag" Quartale, Analoges Vorgehen zu Monaten Sommer 2021 –> 07.08.2021 Jahreszeit 07.08.2021 –> 03.06.2022 –> Frühjahr 2022
PERSONENNAMEN: NORMALISIERUNG / KATEGORISIERUNG Namensbestandteile Beispiel Trennzeichen Leerzeichen Anna Osler-> ('Anna', 'Osler') Bindestrich Kein Trennzeichen Eva-Maria Rau ->('Eva-Maria','Rau') 1. Buchstabe klein Ignoriert 'van Beethoven' -> 'Beethoven' Token bis ceil(median(n)) Vornamen (V), dann 'Kim Yong Il Park Un' Nachnamen (N) V: 'Kim Yon Il', N: 'Park Un' Namenszusätze Mit Punkt Ignoriert 'Dr.', 'Prof.', 'Dipl.-Ing','Jr.' Ohne Punkt Ignoriert (aus Lexikon) 'OA', 'PD', 'PhD', 'MBA' Repetitionen Ignoriert 'Dr. Dr. Dr.' -> 'Dr' PD Dr. med. Eva-Maria Gräfin von und zu Eulenhoven-Katzenfels PhD MBA Namenszusatz Vorname Vorname Ignoriere Nachname Namenszusatz
NAMEN: PSEUDONYMISIERUNG Namen Beispiel Vornamen Vornamenlexikon, indexiert Zufallszahl r nach Initiale und W = (…,'Andrea', 'Agnes', …) Geschlecht 'Anna' -> wr , z.B. 'Anna' -> 'Agnes' Nachnamen Nachnamenlexikon, Zufallszahl r indexiert nach Initiale N = (…,'Emmerich', 'Emmersdorfer', 'Eils', …) 'Eberhard' -> nr , z.B. 'Eberhard' -> 'Emmerich' Kombina- Ausnahmen für seltene 'Yvonne Quervain' -> 'Annabel Müller' tionen Initialien Institutionen Lexikon Pseudo- 'LKH Salzburg' -> 'Scheuermann-Klinik' Lokalisationen 'in HNO verlegt' -> 'in HNO verlegt' Abgleich mit Terminologie PD Dr. med. Eva-Maria Gräfin von und zu Eulenhoven-Katzenfels PhD MBA PD Dr. med. Elisabeth Gundula Emmersdorfer PhD MBA
Sie können auch lesen