Datenschätze und wie leicht man sich davon blenden läßt - Datenschätze - International Program in Survey ...
←
→
Transkription von Seiteninhalten
Wenn Ihr Browser die Seite nicht korrekt rendert, bitte, lesen Sie den Inhalt der Seite unten
6/11/2020 Datenschätze und wie leicht man sich davon blenden läßt Prof. Dr. Frauke Kreuter Universität Mannheim – University of Maryland ‐ IAB 1 Datenschätze und wie leicht man sich davon blenden läßt 2 1
6/11/2020 Begeisterung 3 Nutzung von Online Preisen US Aggregated Inflation Series, Monthly Rate, PriceStats Index vs. Official CPI. Quelle: Accessed January 18, 2015 from the PriceStats website. 4 2
6/11/2020 Nutzung von “Smart Meter” Quelle: Berliner Wasserwerke 5 Nutzung von Suchbegriffen Google Flu Trend 2004 ‐ 2015 6 3
6/11/2020 Nutzung von Twitter Nachrichten Social media sentiment (daily, weekly and monthly) in the Netherlands, June 2010 ‐ November 2013. The development of consumer confidence for the same period is shown in the insert (Daas and Puts 2014). 7 Traffic Loop Data Used by Statistics Netherlands Pendlerbewegung (Mobiltelefone): Annahme: alle nehmen ein Auto Source: https://www.cbs.nl/en-gb/our-services/innovation/project/towards-motives-behind-mobility 8 4
6/11/2020 Vollzeit Erwerbstätig Email VApps nach 17Uhr Full time Job seekers Teilzeiterwerbstätig Apps am Mittag Entertainment Job suchende Kontinuierliche Nutzung Schlickman et.al. (DataDiggers) App Nutzerverläufe statt Surveys? Eine Machbarkeitsstudie. DataFest Germany, Mannheim 2015, 9 Innovation 10 5
6/11/2020 Experimente Geplant Umfragen Administrative Daten Prozesse Selbst‐ darstellung Gefunden Transaktionen Inspired by: Roberto Rigobon & Robert Groves 11 VINCENT VAN GOGH Café Terrace At Night Credit: Ralph Klüber, umlaut Realität 12 6
6/11/2020 VINCENT VAN GOGH Café Terrace At Night Credit: Ralph Klüber, umlaut Digitale Datenspuren Reality 13 VINCENT VAN GOGH Café Terrace At Night Credit: Ralph Klüber, umlaut Surveys Reality 14 7
6/11/2020 VINCENT VAN GOGH Café Terrace At Night Credit: Ralph Klüber, umlaut Kombinierte Produkte Reality Survey 15 Experiment Geplant Survey Prozessdaten Daten Selbst‐ darstellung Gefunden Transaktionen Inspired by: Roberto Rigobon & Robert Groves 16 8
6/11/2020 Fehler im Daten generierenden Prozess Wer? Was? Wann? Warum? Wer fehlt? Wer ist mehrfach drin? Was wurde nicht gesagt / gemessen? Warum? 19 survey‐data‐science.net 20 10
6/11/2020 Verantwortungsvoller Umgang II Schmeiße nicht mit Dreck! 21 Maschine Learning – auf 2 Folien x f(x) y x y 22 11
6/11/2020 Model Evaluation Strategy: Split Sample BIG Trainings‐ Data used to estimate the model parameters and daten tuning/complexity parameters DATA SET Testdaten Data used to get an independent (internal validity) assessment of model predictive performance 23 Google Image Search: June 12, 2018; July 15, 2019 Search Term: “University Professor” 24 12
6/11/2020 Google Image Search: Sept 16, 2019 Search Term: “University Professor” 25 26 13
6/11/2020 Personalisierte … Medizin Strafmaße Versicherungsverträge Kredite Werbung … Copyright ‐ Theirry Gregorious available under an Attribution 2.0 Generic licence 27 Transparenz – Grenzen 28 14
6/11/2020 Verantwortungsvoller Umgang III Sei Teil der informierten Debatte! 29 Ich mache einfach nicht mit …. 30 15
6/11/2020 Differential Privacy 31 Your first born child In using this service, you agree to relinquish your first born child to F-Secure, as and when the company requires it. In the event that no children are produced, your most beloved pet will be taken instead. The terms of this agreement stand for eternity. March, 2025 32 16
6/11/2020 Zustimmungsraten lassen sich leicht verändern Die Informationen, die Sie uns im Phone Front Back Total n Laufe des Interviews geben werden, sind nützlicher, wenn Sie dem Gain 90.8 78.7 598 Zusammenspielen mit den Daten der Bundesagentur zustimmen.Sind Sie mit der Zuspielung der Informationen einverstanden? Sample N Web Front Back Total Leider sind die Informationen, die Sie uns im Laufe des Interviewsfor CATI Gain 82.6 62.4 520 geben werden, weniger nützlich, Loss 86.3 75.4 489 wenn Sie dem Zusammenspielen mit den Daten der Bundesagentur Total 511 498 1009 nicht zustimmen. Background: F Kreuter, JW Sakshaug, R Tourangeau - International journal of public opinion research, 2015 33 Informierte Zustimmung – oft uninformiert Consenters Non-consenters Phone % richtig % richtig Antworten ans IAB? 88.3 57.8 Zusammenspielen der Daten? 93.3 36.7 Name/Adresse gespeichert? 68.3 38.8 Sample N Rückschlüsse auf Person möglich? 63.4 --for CATI Zugriff von Extern? 85.6 -- Zugriff auf personalisierte Daten? 87.5 -- Study Design - JW Sakshaug, A Schmucker, F Kreuter, MP Couper… - Journal of Survey Statistics and Methodology, 2016 34 17
6/11/2020 coleridgeinitiative.org http://www.applieddataanalytics.org/ Digdeep.de survey‐data‐science.net 35 DANKE frauke.kreuter@uni‐mannheim.de Podcast: digdeep.de @fraukolos 36 18
Sie können auch lesen