Datenschätze und wie leicht man sich davon blenden läßt - Datenschätze - International Program in Survey ...

Die Seite wird erstellt Gunnar Lauer
 
WEITER LESEN
Datenschätze und wie leicht man sich davon blenden läßt - Datenschätze - International Program in Survey ...
6/11/2020

    Datenschätze
    und wie leicht man sich davon blenden läßt

    Prof. Dr. Frauke Kreuter
    Universität Mannheim – University of Maryland ‐ IAB

1

    Datenschätze
    und wie leicht man sich davon blenden läßt

2

                                                                 1
Datenschätze und wie leicht man sich davon blenden läßt - Datenschätze - International Program in Survey ...
6/11/2020

    Begeisterung

3

                                                                                       Nutzung von
                                                                                       Online Preisen

    US Aggregated Inflation Series, Monthly Rate, PriceStats Index vs. Official CPI.
    Quelle: Accessed January 18, 2015 from the PriceStats website.

4

                                                                                                               2
Datenschätze und wie leicht man sich davon blenden läßt - Datenschätze - International Program in Survey ...
6/11/2020

                                       Nutzung von
                                       “Smart Meter”

    Quelle: Berliner Wasserwerke

5

                                    Nutzung von
                                    Suchbegriffen

     Google Flu Trend 2004 ‐ 2015

6

                                                              3
Datenschätze und wie leicht man sich davon blenden läßt - Datenschätze - International Program in Survey ...
6/11/2020

                                                                                                          Nutzung von
                                                                                                          Twitter Nachrichten

    Social media sentiment (daily, weekly and monthly) in the Netherlands, June 2010 ‐ November 2013.
    The development of consumer confidence for the same period is shown in the insert (Daas and Puts 2014).

7

       Traffic Loop Data Used by Statistics Netherlands
               Pendlerbewegung (Mobiltelefone):

               Annahme: alle nehmen ein Auto

       Source: https://www.cbs.nl/en-gb/our-services/innovation/project/towards-motives-behind-mobility

8

                                                                                                                                       4
Datenschätze und wie leicht man sich davon blenden läßt - Datenschätze - International Program in Survey ...
6/11/2020

                  Vollzeit Erwerbstätig           Email
                   VApps nach 17Uhr

                                                       Full time

                                                                   Job seekers

                  Teilzeiterwerbstätig
                    Apps am Mittag

                                                 Entertainment

                        Job suchende
                      Kontinuierliche
                             Nutzung

                          Schlickman et.al. (DataDiggers) App Nutzerverläufe statt Surveys? Eine
                          Machbarkeitsstudie. DataFest Germany, Mannheim 2015,

9

     Innovation

10

                                                                                                          5
Datenschätze und wie leicht man sich davon blenden läßt - Datenschätze - International Program in Survey ...
6/11/2020

                                                               Experimente

                                                    Geplant      Umfragen

                                                               Administrative
                            Daten                                Prozesse

                                                                  Selbst‐
                                                                darstellung
                                                    Gefunden
                                                               Transaktionen

     Inspired by: Roberto Rigobon & Robert Groves

11

                                                                   VINCENT VAN GOGH
                                                                     Café Terrace At Night
                                                                    Credit: Ralph Klüber, umlaut

                                                                                Realität

12

                                                                                                          6
Datenschätze und wie leicht man sich davon blenden läßt - Datenschätze - International Program in Survey ...
6/11/2020

          VINCENT VAN GOGH
           Café Terrace At Night
           Credit: Ralph Klüber, umlaut

     Digitale Datenspuren
                  Reality

13

          VINCENT VAN GOGH
           Café Terrace At Night
           Credit: Ralph Klüber, umlaut

                      Surveys
                       Reality

14

                                                 7
Datenschätze und wie leicht man sich davon blenden läßt - Datenschätze - International Program in Survey ...
6/11/2020

                                                                       VINCENT VAN GOGH
                                                                         Café Terrace At Night
                                                                        Credit: Ralph Klüber, umlaut

                                                               Kombinierte Produkte
                                                                             Reality
                                                                             Survey

15

                                                                     Experiment

                                                    Geplant            Survey

                                                                    Prozessdaten
                             Daten

                                                                       Selbst‐
                                                                     darstellung
                                                    Gefunden
                                                                    Transaktionen
     Inspired by: Roberto Rigobon & Robert Groves

16

                                                                                                              8
Datenschätze und wie leicht man sich davon blenden läßt - Datenschätze - International Program in Survey ...
6/11/2020

 Verantwortungsvoller Umgang I
 Kenne deine Daten!
17

     Boston Street Bumps

18

                                        9
Datenschätze und wie leicht man sich davon blenden läßt - Datenschätze - International Program in Survey ...
6/11/2020

                   Fehler im Daten generierenden Prozess
                               Wer? Was? Wann? Warum?
                               Wer fehlt? Wer ist mehrfach drin?
                               Was wurde nicht gesagt / gemessen? Warum?

19
     survey‐data‐science.net

20

                                                                                 10
6/11/2020

 Verantwortungsvoller Umgang II
 Schmeiße nicht mit Dreck!
21

     Maschine Learning – auf 2 Folien

       x            f(x)          y   x   y

22

                                                    11
6/11/2020

     Model Evaluation Strategy: Split Sample

       BIG                                       Trainings‐              Data used to estimate the
                                                                           model parameters and
                                                   daten               tuning/complexity parameters
      DATA
       SET                                        Testdaten
                                                                            Data used to get an
                                                                       independent (internal validity)
                                                                           assessment of model
                                                                          predictive performance

23

     Google Image Search: June 12, 2018; July 15, 2019        Search Term: “University Professor”

24

                                                                                                               12
6/11/2020

     Google Image Search: Sept 16, 2019   Search Term: “University Professor”

25

26

                                                                                      13
6/11/2020

     Personalisierte …
     Medizin

     Strafmaße

     Versicherungsverträge

     Kredite

     Werbung …
                             Copyright ‐ Theirry Gregorious
                             available under an Attribution 2.0 Generic licence

27

     Transparenz – Grenzen

28

                                                                                        14
6/11/2020

     Verantwortungsvoller Umgang III
     Sei Teil der informierten Debatte!

29

       Ich mache einfach nicht mit ….

30

                                                15
6/11/2020

     Differential Privacy

31

                      Your first born child
       In using this service, you agree to relinquish your first
       born child to F-Secure, as and when the company
       requires it. In the event that no children are produced,
       your most beloved pet will be taken instead. The terms
       of this agreement stand for eternity.
                                                  March, 2025

32

                                                                         16
6/11/2020

     Zustimmungsraten lassen sich leicht verändern
                                                                                                                 Die Informationen, die Sie uns im
            Phone                     Front                    Back                Total n                       Laufe des Interviews geben werden,
                                                                                                                 sind nützlicher, wenn Sie dem
     Gain                                    90.8                   78.7                  598                    Zusammenspielen mit den Daten
                                                                                                                 der Bundesagentur zustimmen.Sind
                                                                                                                 Sie mit der Zuspielung der
                                                                                                                 Informationen einverstanden?

                                                                                                                                              Sample N
              Web                     Front                    Back                 Total                        Leider sind die Informationen, die
                                                                                                                 Sie uns im Laufe des Interviewsfor CATI
     Gain                                82.6                    62.4                  520                       geben werden, weniger nützlich,
     Loss                                86.3                    75.4                  489                       wenn Sie dem Zusammenspielen
                                                                                                                 mit den Daten der Bundesagentur
     Total                                511                     498                1009                        nicht zustimmen.

     Background: F Kreuter, JW Sakshaug, R Tourangeau - International journal of public opinion research, 2015

33

     Informierte Zustimmung – oft uninformiert
                                                                                     Consenters                          Non-consenters
                                Phone
                                                                                       % richtig                             % richtig

     Antworten ans IAB?                                                                                   88.3                            57.8
     Zusammenspielen der Daten?                                                                           93.3                            36.7
     Name/Adresse gespeichert?                                                                            68.3                            38.8
                                                                                                                                              Sample N
     Rückschlüsse auf Person möglich?                                                                     63.4                                 --for CATI
     Zugriff von Extern?                                                                                  85.6                                 --
     Zugriff auf personalisierte Daten?                                                                   87.5                                 --
      Study Design - JW Sakshaug, A Schmucker, F Kreuter, MP Couper… - Journal of Survey Statistics and Methodology, 2016

34

                                                                                                                                                                  17
6/11/2020

        coleridgeinitiative.org

                    http://www.applieddataanalytics.org/

                                           Digdeep.de

     survey‐data‐science.net

35

      DANKE

       frauke.kreuter@uni‐mannheim.de
       Podcast: digdeep.de @fraukolos

36

                                                                 18
Sie können auch lesen