MIT DEN RICHTIGEN DATEN DIE BESSEREN ENTSCHEIDUNGEN TREFFEN - Deutscher Marketing Verband eV
←
→
Transkription von Seiteninhalten
Wenn Ihr Browser die Seite nicht korrekt rendert, bitte, lesen Sie den Inhalt der Seite unten
COMPETENCE CIRCLE #CCTIM MIT DEN RICHTIGEN DATEN DIE BESSEREN ENTSCHEIDUNGEN TREFFEN Abstract Editorial Beruflich und privat segeln wir durch ein kaum noch über- Crowdsource Reviews: Kundenbewertungen verlie- schaubares Datenmeer. Unsere Schreibtische werden über- ren an Aussagekraft und behindern Innovationen. schwemmt mit Kundenbewertungen für Produkte und Dienst- leistungen sowie Nutzerdaten von Facebook, Instagram, Der Competence Circle Technologie, Innovation & Linkedin oder Twitter sowie Website-Analytics von den vielen Management #ccTIM ist ein Kompetenzzentrum für Tools, die wir im Marketing einsetzen. Zusätzlich bieten Un- AI, Blockchain, Data Analytics, digitale Geschäftsmo- ternehmen ihren Kunden vermehrt Studien zum kostenlosen delle und weitere technologische Trends. Denn die Download an. Ranglisten, wie sie in Blogs publiziert werden, fortschreitende Globalisierung und Digitalisierung reproduzieren Studiendaten im Überfluss. stellt Unternehmen vor neue Herausforderungen. Wie können Unternehmen strategisch von Big Data und Small Wie schaffen wir “Added Value“ für die Gesellschaft Data profitieren? und für unsere Kunden mit neuen Technologien? Gemäß Schätzungen weigern sich ein Drittel der Online-Käu- In diesem Whitepaper dreht sich alles um die richti- fer in den USA, Produkte zu kaufen, die keine positive Bewer- gen Daten, um damit die besseren Entscheidungen tungen haben. Gleichzeitig weist das Bundeskartellamt als treffen zu können. Sie erfahren, warum immer mehr unabhängige Wettbewerbsbehörde, deren Aufgabe der Schutz Unternehmen uns nach dem Einkauf direkt zu einer des Wettbewerbs in Deutschland ist darauf hin (2020-10), dass Kundenbewertung auffordern und wenn man Produkt- gefälschte und manipulierte Nutzerbewertungen beim Online- bewertungen analysiert, warum sie an Aussagekraft Shopping auf dem Vormarsch sind. verlieren und sogar Innovationen behindern können. Sie bekommen einen Einblick „hinter die Kulissen“ Die Datenflut steigt und wir wissen nicht mehr, welchen Daten von Studien - zu oft glauben wir den provokanten wir tatsächlich vertrauen können, um daraus die richtigen Ent- Headlines und den Studien. Doch wie werden die scheidungen für uns abzuleiten. Wir müssen Studien, Ranglis- Daten eigentlich richtig gesammelt und aufberei- tetet und wie kann ich mit einem geschulten Blick Inhalt analysieren, ob die Studie tatsächlich korrekt erstellt Einführung 01 wurde? Zum Schluss bekommen Sie anhand von Checklisten noch Tipps, wie Sie selber eine aussage- Datenqualität bewerten und verbessern 03 kräftige Studie erstellen. Datenerhebung durch Crowdsourcing? 11 Fazit: Daten im Digital Marketing von Studien Prof. Dr. Urs E. Gattiker bis zu Crowdsource Reviews 14 Präsident Marketing Club Lago Beispiele 15 Leiter Competence Circle Referenzliste / Whitepaper 19 „Technologie, Innovation & Management“ #ccTIM DMV Whitepaper Nr. 01 | Januar 2021
COMPETENCE CIRCLE TECHNOLOGIE, INNOVATION & MANAGEMENT #CCTIM DMV Whitepaper Nr. 01 | Januar 2021 ten, Nutzerbewertungen sowie Daten von Facebook oder Goog- Für ein besseres Verständnis bieten wir Ihnen relevante Infor- le kritisch hinterfragen. In diesem Whitepaper führen wir daher mationen, Checklisten, Tipps und Tricks mit vielen aktuellen zwei substantielle Erkenntnisse aus: Beispielen aus der Praxis. Wir illustrieren, wie Leser Studien- resultate, Daten und Fakten aus der Werbung und Marktfor- Auf der einen Seite dürfen wir Studiendaten über Korrelationen schung aber auch Crowdsource Reviews und ihre zugrunde keineswegs als Beweise für ein kausales Verhältnis zwischen liegenden Bewertungssysteme besser verstehen – und somit Ursache und Wirkung lesen. Zusammenhänge bedeuten nicht, einschätzen können, inwiefern sie ihnen vertrauen können dass das eine zwingend aus dem anderen folgt. oder eher weniger. Auf der anderen Seite verlieren insbesondere Kundenbewer- tungen an Aussagekraft und behindern Innovation – und das nicht nur, weil sie häufig gefälscht oder manipuliert wurden. Viele Fehler liegen schon in den Bewertungssystemen selbst. Die Leithemen Wie können Unternehmen strategisch von Big Data und Small Data profitieren? 1 Mithilfe von Daten Licht ins Dunkel bringen: Eine Entscheidung aus dem Bauch heraus ist meist mit einem großen Risiko verbunden. Im Marketing sind wir auf zuverlässige Daten und Insights angewiesen, die uns zu besseren Entscheidungen verhelfen. Doch welchen Daten können wir vertrauen? Von Studien über Ranglisten bis hin zu Crowdsource Reviews müssen wir unseren kritischen Blick trainieren, um mithilfe von den richtigen Daten Licht ins Dunkel bringen zu können. 2 Studien richtig verstehen: Korrelation ist nicht gleich Kausalität! Der häufigste Fehler in den Medien ist es wohl, eine Korrelation als einen Beweis für einen kausalen Zusammenhang zwischen Ursache und Wirkung darzustellen. Übrigens macht auch George Clooney Daten nicht zuverlässiger und vertrauenswürdiger. Ein Faktencheck hilft hier. 3 Datenerhebung im eigenen Unternehmen: Wenn wir die Meinungen von Kunden abbilden wollen gilt es, eine möglichst repräsentative Gruppe von Teilnehmern einer Umfrage zu sichern. Die Variablen Sprache, Alter, Geschlecht, Einkommen usw. sind fast immer wichtige Messpunkte, denn sie können Aussagen stark beeinflussen. Je mehr Faktoren Einfluss auf das Ergebnis haben, desto größer ist die benötigte Datenmenge und damit auch die Stichprobe, um daraus eine verlässliche Aussage treffen zu können. 4 Crowdsource Reviews und Bewertungssysteme durchschauen: Damit Kundenbewertungen uns einen wahren Mehrwert liefern, müssten sie einer Analyse wie der kritischen Betrachtung des Lektors einer wissenschaftlichen Studie standhalten. Doch viele Bewertungen sind oft gefälscht und auch die Bewer- tungssysteme selbst entsprechen oft nicht dem wissenschaftlichen Standard. Inwiefern helfen uns Kundenbewertungen so noch weiter, wenn sie an Aussagekraft und Nützlichkeit verlieren und Innovationen behindern? Schlagworte Zitiervorschlag #Analytics, #Big Data, #Digital Marketing, #Content Marketing, Gattiker, Urs E.; Sinistra, Patrizia; Babuzki, Johanna #Crowdsource Reviews, #Kundenbewertungen, & Temmen, Taina (Januar 2021). #Marketing-Studien, #Reliabilität, #Validität, #Studie, #Trust, Mit den richtigen Daten die besseren Entscheidungen treffen. #Airbnb, #Alibaba, #Amazon, #Apple, #Deliveroo, #drkpi, #eBay, Whitepaper. Duesseldorf: Deutscher Marketing Verband e.V. #Motel One, #Uber, #Zalando (DMV). https://test.drkpi.ch/download/38/ 02|20 Mit den richtigen Daten die besseren Entscheidungen treffen
COMPETENCE CIRCLE TECHNOLOGIE, INNOVATION & MANAGEMENT #CCTIM DMV Whitepaper Nr. 01 | Januar 2021 Datenqualität bewerten und verbessern Marketing baut auf der Suche nach Daten und ihrer kriti- der Schweiz” ausstatten zu können? Das können wir nur schen Analyse auf, um Erkenntnisse zu gewinnen und daraus nachvollziehen, wenn sinnvolle Auswahlkriterien klar defi- bessere Entscheidungen treffen zu können. Marketers brau- niert und publiziert sind. Beispielsweise, wie messen wir die chen daher Zugang zu aussagekräftigen Daten und Insights. unvergleichliche Akustik welche z.B. den Münchner Gasteig Detaillierte Informationen über Kunden und ihr Kaufverhal- zum besten Konzertsaal der Welt macht? Laut Mauró (2015- ten, die Antworten auf strategische Fragen liefern, sind Bei- 02) braucht es für ein optimales Klangergebnis verschiedene spiele dafür. Von Interesse ist dabei etwa, was Kundenrezen- Faktoren, die zusammenspielen müssen. Doch welche Fakto- sionen bewirken können. ren er ausgewählt hat und wie er dies bewertete, um seine Rangliste der besten 10 Konzertsäle der Welt zu erstellen, Vielleicht ist das ein Grund dafür, warum Ranglisten über Pro- bleibt dabei ein Rätsel. dukte und Dienstleistungen, Konzertsäle oder andere Tou- rismusdestinationen Hochkonjunktur haben. Auch Politiker Diese wenigen Beispiele zeigen bereits: Daten müssen unab- nutzen internationale Ranglisten wie das Weltbank-Ranking hängig ihrer Quelle erst einmal auf ihre Gültigkeit (Validität) zum Geschäftsklima als Argumentationshilfen (World Bank, und Zuverlässigkeit (Reliabilität) überprüft werden. Nicht alles 2019-05). Solche Ranglisten, die auf unbestimmten Faktoren lässt sich so einfach messen, wie es oftmals dargestellt wird. basieren, werden mittlerweile in inflationären Maß produ- Korrelationen lassen sich leichter aufzeigen als eindeutige, ziert. Jeder will sich einen Platz auf dem Treppchen sichern. kausale Verhältnisse – und sie sorgen für die besseren Schlag- Ein Rangplatz im Mittelfeld ist dabei schon Grund genug für zeilen in den Medien. Außerdem lassen Daten – im Kontext für einen symbolischen Sprung von der Klippe. betrachtet – oft sehr unterschiedliche Rückschlüsse zu. Doch welche Kriterien werden genutzt, um zum Beispiel entweder Basel oder Luzern mit “dem besten Konzertsaal Leitfragen für einen Schnelltest Tagtäglich finden wir in den Medien über provokante Thesen • “Besser bewertete Produkte erscheinen in der Default- abgeleitete fragwürdige Aussagen bzw. verfälschte Ergebnis- Einstellung weiter oben.” se aus beliebigen Studien. Oft sind diese aus zweiter Hand. Wer die zugrundeliegenden Studien dann nicht selbst liest, • “Häufiger bewertete Produkte erscheinen in der Default- ist nur so schlau wie der Journalist als Nutzer der Studien- Einstellung weiter oben.” resultate. Um Daten vertrauen zu können, müssen wir die zugrundeliegenden Studien daher selbst lesen und einige mittels einer Skala von eins (sehr stark) bis fünf (sehr schwach) Punkte überprüfen. bewerten. Gesunder Menschenverstand und ein wenig Zeit minimie- Um die Frage zu beantworten, inwiefern Unternehmen Kun- ren die Risiken und sparen uns oft später Geld und Ärger, denbewertungen beeinflussen, hat das Bundeskartellamt wenn die falschen Entscheidungen im Marketing getroffen also eher generelle Tendenzen gemäß der Selbsteinschät- werden, die im schlimmsten Fall zu gewaltigen Flops führen zung der Unternehmen abgefragt. Wie viele manipulierte Be- können. Wir bieten Ihnen daher eine Checkliste als Vorlage wertungen für einige Unternehmen publiziert werden, wurde zur Beurteilung einer beliebigen Studie. Damit stellen wir dabei jedoch nicht untersucht. sicher, dass wir eine Studie wirklich verstehen und mögliche Schwachstellen erkennen (siehe Seite 04). Allerdings ist fraglich, ob die Frage nach der genauen An- zahl gefälschter Rezensionen ein zuverlässiges Ergebnis In einer Gruppe von Fachfremden können bereits 59 Pro- liefern kann. Der Grund ist die Response-Bias durch die so- zent allein auf Basis der Beschreibung von Hypothese und ziale Erwünschtheit. Das bedeutet, dass Studienteilnehmer Methodik einer Studie korrekt angeben, ob eine Studie Sinn oftmals das äußern, was von der Gesellschaft eher akzep- macht und repliziert werden kann (Hoogeveen, Sarafoglou tiert wird. & Wagenmakers, 2020-09). Es lohnt sich also auch für Nicht- Experten, hier 30 Minuten Zeit zu investieren. Wir können also nicht sicher sein, ob die endgültige schwar- ze Zahl auf vollkommen ehrlichen Antworten basieren wür- Wird eine Studie – wie beispielsweise die des Bundeskartell- de. Wie viele Teilnehmer würden eine Antwort auf diese amts (2020-10-06) zu gefälschten und manipulierten Nutzer- Frage gänzlich verweigern (Non-Response)? Damit hatte bewertungen beim Online-Kauf publiziert – lohnt es sich, das Bundeskartellamt übrigens auch zu kämpfen (siehe Ab- auch den angehängten dreiteiligen Fragebogen genauer un- schlussbericht des Bundeskartellamts, 2020-11, S.10-11). ter die Lupe zu nehmen. Unternehmen mussten hier Aussa- gen wie beispielsweise Mit den richtigen Daten die besseren Entscheidungen treffen 03|20
COMPETENCE CIRCLE TECHNOLOGIE, INNOVATION & MANAGEMENT #CCTIM DMV Whitepaper Nr. 01 | Januar 2021 Checkliste für die Evaluation von beliebigen Studienberichten Leitfragen Beispiele von relevanten Faktoren Validität: Ist die Studie sinnvoll und gültig? 1. Auswahl des Untersuchungsgegen- Wer ist verantwortlich für die Studie, wer finanziert sie und aus welchem standes: Gibt es Neigungen oder Vor- Interesse (falls bekannt)? eingenommenheiten der Forschen- Wer führt sie durch? Sind die Parteien unabhängig, beispielsweise bei einer den? Ist die Studie repräsentativ? Medikamentenstudie? Ist die Stichprobe groß genug? Wird eine repräsentative Auswahl an Versuchspersonen getroffen? Wer sind die Befragten (Kunden, Studenten, Mitarbeiter, zufällig ausgesuchte Teilnehmer anhand von Mobil- und Festnetz-Anschlüssen, etc.)? Inwiefern sind beispielsweise Erkenntnisse aus einer Studie an amerikani- schen Studenten auf Kunden in der D-A-CH-Region übertragbar? 2. Studienverlauf: Wird die Studie Gibt es zum Beispiel mehrere Gruppen, um einen Vorher-Nachher-Vergleich zu einmal, mehrmals, über einen kurzen machen? Wird der Verlauf der Studie durch externe Faktoren, wie bestimmte Zeitraum oder langfristig durch- Ereignisse oder durch einen Lerneffekt der Versuchspersonen beeinflusst? geführt? Hat die Studie mehrere Wurden Langzeitfolgen überprüft? Phasen? 3. Datenerhebung: Wie wurden die Wurden strukturierte Interview-Fragen vorbereitet? Werden jedem Teilnehmer Daten gesammelt (Online-Frage- dieselben Fragen gestellt oder gibt es Abweichungen, z.B. andere Formulie- bogen, im Labor, Telefoninterview, rungen der Versuchsleiter in persönlichen Gesprächen? Sind die Fragebögen Online-Simulationen, per App auf einsehbar bzw. angehängt? Mobiltelefon, z.B. GPS, etc.)? Hat die Bewertungsskala mit beispielsweise fünf oder sieben Optionen einen neutralen Mittelpunkt oder nicht? 4. Eindeutigkeit: Gibt es einen klaren, Sind Definitionen klar und eindeutig? Sind die Fragen klar und nicht mehr- kausalen Zusammenhang zwischen deutig formuliert? Ursache und Wirkung oder kann Wird wirklich genau gemessen, was Ziel der Messung ist, oder werden noch lediglich eine Korrelation aufgezeigt andere Faktoren unbewusst bzw. gezwungenermaßen mitgemessen? werden? Gibt es mögliche Störfaktoren? Reliabilität: Ist die Studie zuverlässig und reproduzierbar? 5. Ort und Zeitpunkt der Studie: Wann und wo wird die Studie durchgeführt? Wirkt sich beispielsweise die Messungen, die zu verschiedenen Jahreszeit oder der Ort auf die Studie aus (Winter in Großstadt oder Sommer Zeitpunkten oder an unterschied- am Strand)? lichen Orten durchgeführt werden, Gibt es besondere Ereignisse, die die Studienergebnisse beeinflussen könnten produzieren häufig unterschiedliche (z.B. Wahl eines neuen Präsidenten, Marktveränderungen, etc.)? Ergebnisse. 6. Soziale Erwünschtheit: Antworten Gibt es beispielsweise unangenehme Fragen? (Im persönlichen Gespräch Teilnehmer der Studie ehrlich bezie- neigen Probanden eher dazu, sich in ein besseres Licht zu rücken als in anony- hungsweise sind sie fähig, wahrheits- men Fragebögen.) gemäß zu antworten? Wissen Teilnehmer die Antworten oder glauben sie vielleicht nur eine Antwort sei wahrheitsgemäß, obwohl sie nicht der Realität entspricht? 7. Methodik: Nutzt die Studie eine Wie wurden Interviews geführt? Sind diese aufgezeichnet worden und wie gut fundierte, objektive Methodik, wurden diese analysiert? die im Studienbericht genauer Sind Fragebögen standardisiert, oder besteht die Möglichkeit, dass Fragen beschrieben ist? auf unterschiedliche Art und Weise gestellt werden (z.B. im Interview)? Sind die Erklärungen zur Methodik Haben die Durchführenden die Ergebnisse beeinflusst? nachvollziehbar und verständlich? Weist die Studie bereits auf eigene Schwachstellen hin, die in Kauf genommen wurden (z.B. aus Kostengründen)? 04|20 Mit den richtigen Daten die besseren Entscheidungen treffen
COMPETENCE CIRCLE TECHNOLOGIE, INNOVATION & MANAGEMENT #CCTIM DMV Whitepaper Nr. 01 | Januar 2021 8. Wiederholbarkeit: Können wir die Re- Große Mengen von Daten bieten nicht automatisch einen Mehrwert. Sie können sultate mithilfe von eigenen, kleine- nicht einfach auf jede beliebige Personengruppe übertragen werden und können ren Experimenten kritisch überprüfen, im schlimmsten Fall zu falschen Rückschlüssen führen. Auch in kleineren Mengen um sie für die Optimierung unseres erzeugen Daten einen Wert – zum Beispiel mit einem A/B-Test auf der eigenen Produktes und/oder der Services zu Website. Damit können wir insbesondere überprüfen, ob die Ergebnisse der nutzen? Studie auf unsere Zielgruppe übertragbar sind. 9. Objektive Interpretation: Lassen die Wurden die Daten korrekt interpretiert oder wird eine bestimmte Perspektive genutzten (und genau bestimmten) nicht berücksichtigt? Eine Korrelation beweist keine Kausalität. Klare Verhältnis- Indikatoren sowie Kennzahlen die se zwischen Ursache und Wirkung sind sehr schwer zu beweisen, bei derartigen von den Autoren gemachten Rück- Behauptungen ist daher immer Vorsicht geboten. schlüsse zu? Zeitaufwand Checkliste: 30–60 Minuten. ! Notiz: Aktuell ist die Beständigkeit (Volatilität) der Daten besonders wichtig: Wie lange sind die Daten noch aktuell? Ist eine Studie, die “vor Corona” durchgeführt wurde, auch auf die Zeit während des Lockdowns und “nach Corona” übertragbar? Wurde die Studie durch den Lockdown beeinflusst beziehungsweise wurden Studienergebnisse signifikant von den Auswirkungen des Lockdowns beein- trächtigt? Korrelation ist nicht gleich Kausalität Der häufigste Fehler von Lesern einer Studie ist es, eine resse an Filmen. Die Studie wies auf einen Zusammenhang Korrelation als Kausalität zu erfassen. Eindeutige Kausal- hin, der nicht Ursache und Wirkung beschreibt, sondern Beweise geben auch bessere Schlagzeilen ab. Korrelationen eben nur eine Korrelation. haben weniger Wirkung, da sie nur vage Zusammenhänge aufzeigen. Daher kommt es vor, dass Headlines in Medien Ein weiteres großes Problem ist, dass wir häufig getäuscht oft Studienresultate auf eine möglichst prägnante Aussage werden – und zwar vom Aussehen der grafischen Aufma- reduzieren, die leider manchmal auch falsch sein kann. chung einer Studie oder einfach von einer Top-Schlagzeile. Das Aussehen schlägt dabei den eigentlichen Inhalt und die Ein Beispiel für die Schlagzeile einer Studie ist “Wer viel Qualität der Studie. Auch der Überbringer der Botschaft, in streamt, geht häufiger ins Kino.” (siehe Gattiker, 2020-05). dem Fall ein Werbebotschafter, ist oft wichtiger als die Qua- Doch exzessives Video-Streaming führt nicht grundsätzlich lität des Produktes oder der Daten. Insbesondere wenn es zu mehr Kinobesuchen, genauso wenig wie Kälte automa- sich dabei um prominente Persönlichkeiten wie Lady Gaga tisch den Schneefall zur Folge hat. Diese Dinge werden von oder Georg Clooney handelt. weiteren Faktoren beeinflusst, wie etwa das allgemeine Inte- Marketing-Studien: Aussehen schlägt Inhalt In den meisten Fällen sind Medienfachleute an einer Studie Es ist auch kein Geheimnis, dass Studien ein beliebtes Mar- mit weniger als 1.000 Teilnehmern wenig interessiert. Ob die keting-Instrument sowohl im B2B- als auch im B2C-Bereich Studie gut ist oder nicht, können Journalisten nicht immer geworden sind. Marketing-Studien können insbesondere das beurteilen, wenn ihnen das Know-How fehlt. Das Resultat: Interesse der informierten Kunden wecken, die sich nicht Die Wahl fällt auf eine Studie, die eine Top-Schlagzeile her- mehr so leicht von herkömmlicher TV- oder Print-Werbung gibt. Und ehe man sich versieht, wird aus einer Korrelation täuschen lassen und das Internet zur Recherche nutzen. fälschlicherweise eine Kausalität. Unternehmen wie Adobe, IBM, Microsoft oder Namics geben In der Praxis bedeutet das zum Beispiel auch, dass ein Da- gerne ihre aufwendigen Studien in Auftrag und bieten das tensatz mit 1.000 Teilnehmern in der Schweiz interessanter finale, grafisch aufbereitete Dokument schließlich kosten- ist als ein Datensatz mit 300 Teilnehmern aus Deutschland frei zum Download an. Doch die Daten können nicht immer – auch wenn letzterem die fachlich bessere Studie zugrunde differenziert genug analysiert werden. Wenn die möglichen liegt. Wird die Studie mit den 1.000 Schweizer Teilnehmern Effekte von Land, Sprache, Alter der Teilnehmer, Industrie- nun auch noch auf die deutsche Bevölkerung übertragen, zweig und so weiter jedoch nicht berücksichtigt werden, sind sollten bei allen die Alarmglocken läuten. Gültigkeit (Validität) und Zuverlässigkeit (Reliabilität) nicht immer garantiert.Und das Design gewinnt mehr an Priorität als der eigentliche Inhalt. Mit den richtigen Daten die besseren Entscheidungen treffen 05|20
COMPETENCE CIRCLE TECHNOLOGIE, INNOVATION & MANAGEMENT #CCTIM DMV Whitepaper Nr. 01 | Januar 2021 Daten im Kontext betrachtet Der Big-Mac-Index vergleicht Daten im Kontext: Die Kaufkraft In der EU hat Griechenland vielleicht ein größeres Problem verschiedener Währungen wird mithilfe der Preise für einen in Sachen Mehrwertsteuer als Deutschland, doch ist das Big Mac verglichen. Dabei zeigt sich, dass der Schweizer Land auch Vorbild: Zum Beispiel hat Griechenland den Asyl- Franken im Jahr 2020 dem US-Dollar gegenüber mit gut 20 antrag für gut 162 Flüchtlinge pro 100.000 Einwohner schon Prozent überbewertet ist. Beim Euro ist es eine gut 16-pro- beim Erstgesuch bewilligt. Für die Schweiz waren es 126, für zentige Unterbewertung. Der Index zeigt auf einfache Art Deutschland 85, für Malta 82 und für Schweden 59 Flüchtlin- und Weise auf, wie Wechselkurse die Kaufkraftparitäten nicht ge (pro 100.000 Einwohner) (EASO, 2020). unbedingt mit einbeziehen. (https://www.economist.com/news/2020/07/15/the-big- Verglichen mit verschiedensten Ressourcen der Länder (z.B. mac-index). flächenmäßige Landesgröße in Quadratmetern statt Einwoh- nerzahl) könnten wir willkürlich immer neue Bilder zeichnen, Aufgrund von Steuerbetrug und Schwachstellen im System neue Rangplätze verteilen und mal das eine, mal das andere entgehen den EU-Mitgliedstaaten Einnahmen aus der Mehr- Land weiter oben oder unten platzieren. wertsteuer. Die Differenz zwischen den erwarteten und den tatsächlichen Mehrwertsteuereinnahmen wird als Mehrwert- Auch bei Unternehmensentscheidungen können wir sehr gut steuerlücke bezeichnet. In Euro angegeben, weist Italien unterscheiden zwischen internen und externen Kontexten, 2018 die größte Mehrwertsteuerlücke auf, gefolgt vom Verei- die es zu berücksichtigen gilt. Der externe Kontext ist zum nigten Königreich und Deutschland. Griechenland ist erst auf Beispiel der Vergleich mit der Konkurrenz auf dem Markt. Platz sechs zu finden. Das entnehmen wir einer Rangliste der Financial Times (2020-09, S.1). Ein einfaches Beispiel: Aufgrund des Lockdowns macht ein Restaurantbetreiber – verglichen mit anderen Restaurants Doch diese absoluten Zahlen sind irreführend. Wenn wir in der Region – vielleicht nur einen geringen Verlust. Das die Daten in einem anderen Kontext betrachten – wie viel sagt noch nichts darüber aus, ob es nicht schon dieser Ver- Prozent der zu erwartenden Mehrwertsteuereinnahmen lust ist, der ihn in den Ruin treiben kann, weil zum Beispiel des jeweiligen Landes noch fehlen – sieht die Rangliste die Rücklagen nicht reichen, um auch die zweite Phase zu ganz anders aus (und deutet auf ein anderes Problem hin): überbrücken. In Deutschland macht die Mehrwertsteuerlücke unter 10 Prozent der Gesamtsumme aus. In Griechenland hingegen Kürzlich wies ein Kunde von drkpi® darauf hin, dass das ist sie bei rund 30 Prozent der gesamten Mehrwertsteuer- Leser-Engagement auf der unternehmenseigenen Com- einnahmen. munity Page rückläufig sei. Dank des drkpi® PageTracker 06|20 Mit den richtigen Daten die besseren Entscheidungen treffen
COMPETENCE CIRCLE TECHNOLOGIE, INNOVATION & MANAGEMENT #CCTIM DMV Whitepaper Nr. 01 | Januar 2021 konnte jedoch ein Langzeitvergleich für das Unternehmen Die Liste an Beispielen lässt sich über alle Bereiche hinweg des Kunden mit drei Konkurrenten errechnet werden. Und bis ins Unendliche fortführen, denn es lassen sich beliebig plötzlich sah das Ganze anders aus. Was das Leser-Enga- viele neue Kontexte formulieren. Die Frage ist natürlich, gement betraf, war die Community-Seite im Vergleich zur wann eine Betrachtung eines bestimmten Kontexts sinnvoll Konkurrenz extrem gut und in Deutschland in den Top 10 ist und – in Marketing-Angelegenheiten – wann sie für uns der Community Pages in diesem Industriezweig. Die Konse- sinnvoll ist. Eindeutig ist, dass die Betrachtung von Daten quenz: Das Investment in die Community Pages wurde nicht im Kontext helfen kann, Situationen besser einzuschätzen. heruntergefahren, denn wie sich zeigte, sind sie essentiell für die Qualität und Performance der eigenen Webseite und Natürlich begegnen wir in der Öffentlichkeit und in den Me- für das Content Marketing. dien auch häufig professionell wirkenden Statistiken und Behauptungen, die Daten eher in das eine als in das andere Daten sind immer dann besonders interessant, wenn die- Licht rücken. Ein bestimmter Kontext wird vorsätzlich oder se auch im Kontext betrachtet werden. “Wie viele Corona- mangels Wissen nicht beleuchtet. Hier hilft oft eine Recher- Neuinfektionen gibt es pro 100.000 Einwohner?” Die Antwort che, um sich ein neutrales Bild zu machen oder zumindest kann – ganz klar – für eine dicht besiedelte Großstadt wie mehrere Perspektiven kennenzulernen. Berlin etwas anderes als für den Schwarzwald bedeuten. Sind die Daten vertrauenswürdig? Daten sind nicht einfach gegeben. Egal wie vertrauens- Käufer zum günstigeren Produkt (Enneking, Kleine-Kalmer, würdig eine Grafik oder eine Studie wirkt, wir müssen uns Dauermann & Voigt, 2019-01). immer die kritische Frage stellen: „Woher kommen diese Daten eigentlich?“, damit wir Auswertungen vertrauen und Dieses geringe Kaufinteresse stand dabei im Widerspruch in eine Entscheidung einfließen lassen können: Wer hat die zu den Ergebnissen der parallel durchgeführten Befragung Daten wie gesammelt – wann und wo? Wie wurden die Da- mit fast 700 Konsumenten. In den kurzen Interviews gaben ten gesammelt und analysiert? Wie objektiv und zuverlässig deutlich mehr Konsumierende an, Tierwohl-Produkte zu ist die Interpretation der Ergebnisse? bevorzugen. Letzten Endes kamen die Ergebnisse von irgendwo her: Je- Fazit: Konsumenten geben im persönlichen Gespräch viel- mand hat gezählt oder gemessen und vielleicht noch ge- leicht an, dass sie sich eine artgerechte Haltung von Hüh- rechnet – idealerweise systematisch und mit Sorgfalt. Die- nern, Rindern oder Schweinen wünschen. Doch der eigene se Bemühungen erfordern Investment in Form von Budget Geldbeutel ist beim unbeobachteten Zahlen an der Kasse und Zeit sowie Fachwissen. Sie sind weder selbstverständ- dann doch wichtiger – wir haben es wieder mit dem Prob- lich noch garantiert. lem der sozialen Erwünschtheit zu tun. Auf der anderen Seite ist eine gute Studie daran zu er- Es ist schwierig im Voraus zu prüfen, welchen Aufpreis der kennen, dass im Studienbericht auch auf die in Kauf ge- Kunde tolerieren würde, wenn es dabei um soziale Akzep- nommenen Schwächen, beispielsweise auf Probleme einer tanz geht. Nach Steve Jobs sagen Nutzer scheinbar immer bestimmten Messtechnik oder auf Abweichungen selbst, “Ja” zu möglichen neuen Features bei technischen Pro- hingewiesen wird. dukten. Ob sie diese dann wirklich nutzen würden und wil- lens sind, dafür zu zahlen, steht auf einem anderen Blatt. Wir alle wollen aussagekräftige Daten und Insights. Wir be- nötigen detaillierte Informationen über unsere Kunden in Zum Träumen sagt kaum jemand “Nein” – bis wir den Preis jedem Bereich. Nur mit diesen können wir nachweislich sehen. Wer bares Geld zahlen soll, überlegt es sich dann aufzeigen, ob unsere Marketing-Aktivitäten erfolgreich sind. doch auch schnell wieder anders. Dieses Problem begeg- net uns in der Marktforschung besonders häufig. Die Sammlung und Zusammenführung aller verteilt vorlie- gender Marketing-Daten wird daher oft als kritischer Schritt Zuletzt ist auch bei Statistik-Dienstleistern, wie zum Bei- angepriesen. Nur dank dieser Zusammenführung und Ver- spiel Statista, ein zweiter Blick auf die Herkunft der Daten einheitlichung kann eine umfassende Datenanalyse statt- empfehlenswert. Erst die Überprüfung, woher die Daten finden. Doch was nützt die Zusammenführung von Daten, eigentlich kommen, zeigt uns, wie verlässlich die Daten wenn diese nicht vertrauenswürdig sind? wirklich sind. Dabei ist es vielleicht auch fragwürdig, wa- rum die Referenzen für eine Statistik wie dem Big-Mac- Daten sammeln ist aber noch lange nicht alles. Dass es ei- Index bei Statista andere sind, als beim Economist, dem nen Unterschied macht, wie Daten erhoben werden, illus- Erfinder dieses Indexes. Diese Zeitung errechnet und pu- triert eine Studie über den Fleischwaren-Kauf. Die Studie bliziert diesen Vergleich gemäß Kaufkraftparität bereits mit 18.000 Verkäufen in 18 Edeka Supermärkten zeigt, dass seit 1986 (siehe: https://de.statista.com/statistik/daten/ Konsumenten oft immer noch Billigfleisch bevorzugen. studie/199335/umfrage/big-mac-index--weltweiter-preis- Wenn Billigfleisch pro Kilo nur 50 Cent billiger ist als Fleisch fuer-einen-big-mac/). aus besseren Haltungsbedingungen, greifen zwei Drittel der Mit den richtigen Daten die besseren Entscheidungen treffen 07|20
COMPETENCE CIRCLE TECHNOLOGIE, INNOVATION & MANAGEMENT #CCTIM DMV Whitepaper Nr. 01 | Januar 2021 Checkliste für die Datenerhebung Mit den richtigen Daten bessere Entscheidungen zu treffen, ße Menge von Daten zu sammeln. Es muss also nicht immer heißt auch zu experimentieren. Zum Beispiel ist es für einen ein Marktforschungsinstitut mit einer Budget-verzehrenden Onlineshop-Betreiber interessant zu erfahren, wie die Anzahl Studie beauftragt werden. Doch wie die Tabelle unten zeigt, nicht abgeschlossener Käufe (Warenkorb-Abbrüche) und so- gibt es im Vorfeld einiges zu berücksichtigen, um sich Zeit, mit nicht gemachter Umsätze auf der eigenen Website am Budget und sogar Ärger zu sparen und, um die richtigen Daten besten verringert werden kann. zu bekommen. Im Rahmen einer großen Studie sandte Alibaba den Besu- Zuerst gilt es festzulegen, bei welchen strategischen Fragen, chern seines Online-Shops einen Rabattgutschein, und zwar welche Daten Licht ins Dunkel bringen können. Was muss ge- in dem Moment, als sie ihre gefüllten virtuellen Einkaufswa- messen werden und wie muss es gemessen werden, um kon- gen stehen ließen und den Einkauf somit abgebrochen haben. krete und praktikable Antworten auf diese zu erhalten? Dann Der Gutschein war 24 Stunden gültig (Zhang, Dai, Duong et.al., können wir bewerten, ob wir die notwendigen Ressourcen ha- 2018-12). ben, um die Datenerhebung und -analyse selbst in die Hand zu nehmen, oder ob externe Spezialisten als Dienstleister in Auch eine unkomplizierte Umfrage auf der eigenen Website ist Anspruch genommen werden sollten. ein gutes Mittel, um möglichst einfach und schnell eine gro- Checkliste zur Datenerhebung und -analyse im eigenen Unternehmen Fragen und Schritte bei der Vorbereitung Beispiele Zielsetzung: Formulieren Sie ein bis drei sinn- Zu allgemein: „Wie können wir unsere Verkaufszahlen im Online-Shop volle strategische Fragen, die es zu beantwor- erhöhen?“ (Unmengen von Variablen können hier in Betracht gezogen ten gilt. Die Fragen sollen Antworten liefern werden.) können, die an der praktischen Umsetzung → Präziser (und leichter zu überprüfen): „Wie können wir die Anzahl nicht orientiert sind. abgeschlossener Käufe im Online-Shop verringern?“ – siehe Alibaba- Studie. Notiz: Je präziser die Fragestellung ist, desto weniger Variablen sind im nächsten Schritt meist nötig. Definition der Variablen oder KPIs: Bei Alibaba z.B.: Anzahl der Online-Shop-Besucher, Anzahl der Online- Welche Daten können diese Fragen möglichst Käufe (z.B. mit und ohne genutzte Gutscheine), Summe der gekauften präzise beantworten? Wie werden sie gemes- Produkte, Einnahmen insgesamt, Anzahl der in den Warenkorb gelegten sen? Welche Daten und Methoden brauchen Produkte, die nicht gekauft wurden, etc. … wir für sinnvolle Berechnungen? Welche Daten → Weitere interessante Vergleichswerte im Detail sind z.B. die Dauer des können ohne größeren Aufwand zusätzlich ge- Besuchs der einzelnen Produktseiten oder die Gesamtzahl bei mehreren sammelt oder berechnet werden? In welchem Besuchen derselben Seite. Kontext müssen wir die Daten betrachten? Notiz: Oberste Priorität ist dabei sicherzustellen, dass die Daten GDPR- oder DSGVO-konform gesammelt und verarbeitet werden (siehe Gattiker, Temmen & Sinistra, 2018-04). Recherche: Welche Daten hat das Unterneh- Die Studie zu Alibaba kann beispielsweise für die eigenen Zwecke in einem men bereits, z.B. aus vergangenen Experimen- kleinen Rahmen reproduziert werden – mit Änderungen oder weiteren ten? Was sagen vorhandene Studien? Gibt Variablen, wo nötig. es sekundäre Daten (Bundesamt für Statistik → Daten für eine Umfrage können wir mit einem Online-Tool erfassen, etc.) und reichen uns diese vielleicht sogar das wir jedoch gut beherrschen sollten. für eine Entscheidung aus? Gibt es bestimmte → Manche Daten – beispielsweise SEO-Daten zur Performance der Web- Methoden und Ideen, mit denen wir selbst site – bekommen wir sehr schnell z.B. über Google Analytics oder drkpi® experimentieren können? Mit welchen Mitteln PageTracker. können die fehlenden Daten für unser Unter- nehmen erhoben werden? Notiz: Die intensive Recherche hilft bei der Entscheidung, ob wir die Daten selbst erheben können oder ob ein externer Spezialist oder eine professionelle Studie nötig ist. 08|20 Mit den richtigen Daten die besseren Entscheidungen treffen
COMPETENCE CIRCLE TECHNOLOGIE, INNOVATION & MANAGEMENT #CCTIM DMV Whitepaper Nr. 01 | Januar 2021 Methode festlegen: Wie können wir Variablen Fragenkataloge für Umfragen erstellen: Wir können Expertise einkaufen messen und genau die Daten bekommen, die (beispielsweise an einer Universität) oder selbst einen Fragenkatalog ent- wir benötigen? Online-Umfrage oder via App, wickeln. Werden allen nötigen Variablen erfasst und sinnvoll gemessen? im Kaufhaus oder telefonisch, etc.? Welche Methode eignet sich am besten? Achtung: Formulierungen sind wichtig. Lassen sie alle möglichen Antworten auf eine Frage zu oder nur bestimmte? Formulierungen können die Antworten der Teilnehmer stark beeinflussen! Wer sind die Studienteilnehmer: Wollen wir beispielsweise auch genügend Frauen aus Deutschland auf Kunden oder auch neue Zielgruppen? einer Online-Shopping-Plattform für Männermode befragen, werden 1.000 Rekrutierung der Teilnehmer nach Wohnort, deutsche Teilnehmer hier nicht reichen, wenn 80% davon Männer sind und Herkunft, Sprache, Geschlecht, Ausbildung, aus jedem Bundesland eine repräsentative Anzahl Frauen jeder Alters- Einkommen und anderen kritischen Faktoren klasse benötigt wird. Hier gilt es, Wahrscheinlichkeiten zu berücksichtigen (siehe Krebsstudie Beispiel 1, Seite 15). Je mehr (siehe Beispiel auf Seite 18). dieser Variablen einen Effekt auf die Ergeb- nisse haben können, desto höher muss die Teilnehmerzahl sein, um eine repräsentative Stichprobe zu erhalten. Braucht es eine Kont- rollinstanz? Zeitpunkt und Dauer: Wann wird die Studie Das Beispiel Alibaba zeigt: Kurzfristig werden dank der Gutscheine mehr durchgeführt? Wird ein Experiment einmalig Produkte verkauft. Langfristig verändert sich das Kaufverhalten signifikant: oder mehrmals oder langfristig (mit oder ohne Online-Shop-Besucher legen z.B. mehr Produkte in den Warenkorb, um Kontrollgruppe) durchgeführt? Wirken sich ver- Gutscheine per Mail zu erhalten. Eine solche Strategie kann auf lange Sicht schiedene Jahreszeiten oder sogar Tageszeiten dadurch als weniger profitabel entlarvt werden. auf das Ergebnis aus? Notiz: Das Kaufverhalten in der Vorweihnachtszeit kann für bestimmte Produkte anders sein als im Sommer und umge- kehrt. Macht es Sinn, Daten über 12 Monate zu sammeln oder nur über einen bestimmten Zeitraum auszuwählen? Methode/Datenanalyse: Quantitative (das Qualitative Datenerhebung kann sehr hilfreich sein, ist aber meist sehr heißt, parametrische oder nichtparametrische zeitintensiv. Quantitative Tests lassen sich leichter durchführen. Tests) oder qualitative Analyse/Studie (bei- spielsweise Ethnographie). Reporting: Bleiben die Resultate nur intern Die Alibaba-Studie wurde veröffentlicht und leistet einen wertvollen Bei- zugänglich oder auch auf der Website für Jour- trag in der Marketing-Community. nalisten, Medien und Kunden verfügbar? Notiz: Publizieren Sie Resultate, sollte die Berichterstattung klar und transparent sein. Auch ein Whitepaper kann sinnvoll sein. Die perfekte Studie gibt es nicht. Weisen Sie daher auch auf mögliche Schwachstellen der eigenen Studie hin, wenn Sie diese veröffentlichen. Umsetzung der Resultate: Inwiefern und wie Die Alibaba-Studie zeigt, dass Gutscheine die Verkaufszahlen kurzfristig genau können die Daten genutzt werden? steigern können, langfristig nimmt die Kaufbereitschaft für Produkte Was soll im Marketing/Verkauf mithilfe die- ohne Rabatt jedoch ab aufgrund der strategischen Schnäppchen-Jagd ser Daten optimiert werden? der lernenden Konsumentenn („Wenn ich Produkte im Warenkorb zu- rücklasse, bekomme ich einen Gutschein“). Notiz: Meist impliziert dies schon die Fragestellung, die Sie zu Beginn formuliert haben (Kosten senken, mehr Sales generieren etc.). Sie sollten also bereits wissen, wie sich mögliche Antworten auf die formulierte Frage umsetzen lassen! Notiz: Die Vorschläge können als grobe Richtlinien bei der Vorbereitung der Datenerhebung im eigenen Unternehmen genutzt werden. Für die spezifischen Fragestellungen, Umfragen und andere Experimente müssen die wichtigen Details natürlich im Einzelfall entschie- den werden. ! Mit den richtigen Daten die besseren Entscheidungen treffen 09|20
COMPETENCE CIRCLE TECHNOLOGIE, INNOVATION & MANAGEMENT #CCTIM DMV Whitepaper Nr. 01 | Januar 2021 Es kann selbstverständlich immer passieren, dass wir nach der Analyse und Interpretation der gesammelten Daten kei- Praxisbeispiele zur Datenerhebung und ne eindeutigen Antworten auf die formulierten Fragen erhal- ten. Das kann daran liegen, dass die zu Beginn formulierten Studientauglichkeit folgen am Ende des Fragen nicht präzise genug waren. Ein anderer Fehler ist die Whitepapers (Seite 16-18) Selektion der Studienteilnehmer oder aber der Variablen, die gemessen wurden. Fehler in der Analyse sind ebenfalls Wie sind professionelle Studien aufgebaut? möglich. Es kann auch passieren, dass wir nicht die Antwort Zwei Beispiele: STATISTIK AUSTRIA (positiv) und bekommen, die wir hören wollten. Promarca Brand of the Year 2020 (negativ) Deshalb ist es wichtig, alles so detailliert und sorgfältig wie Was muss bei der Nutzung von Crowd-Plattformen möglich im Voraus zu planen und wenn möglich, doch einen zur Datensammlung berücksichtigt werden? Spezialisten zurate zu ziehen, damit böse Überraschungen, Ein Beispiel anhand von Amazon Mechanical Turk Frust und Misserfolge vermieden werden können. Wie werden Stichproben richtig zusammengesetzt? Wie kann eine möglichst hohe Datenqualität gesichert werden? Besser Entscheidungen dank Experimenten treffen Das Experiment des Online-Händlers Alibaba zeigt, wie hilf- Eine andere Art von Experiment zeigte Steve Jobs: reich eigene Experimente im Marketing sein können, um bei- Steve Jobs wird nachgesagt, dass er ein „Stickler“ für Details spielsweise den Verkauf zu optimieren. Ähnliche Testungen war, was die Benutzerfreundlichkeit der Apple-Produkte be- aber auch Umfragen kann ein Unternehmen relativ leicht traf. Aus diesem Grund wollte er immer selbst sehen, wie selbst umsetzen, ggf. auch mit der Hilfe von Spezialisten pro- Nutzer ein neues iPhone bedienten. Er war davon überzeugt, fessionell gestalten. dass er damit genau beobachten könne, wie benutzerfreund- lich oder auch kompliziert die Geräte tatsächlich waren. Eine Bei Alibaba geht es nicht nur darum, ob ein bestimmter Rabatt solche Beobachtung kann auch schon bei einer nicht-reprä- funktioniert, sondern auch um das wie und das warum. Diese sentativen Stichprobe von nur fünf Kunden hilfreiche Erkennt- Daten im eigenen Unternehmen zu erheben und zu sammeln, nisse bringen. Im Falle eines neuen Produktes kann ein “Test kann für strategische Entscheidungen extrem wertvoll sein, auf Herz und Nieren” eines neuen Finanz-Produktes vom Ma- denn wir müssen nicht auf die Daten der Anderen vertrauen nagement das Risiko für einen Flop-Launch minimieren. Das und diese auf uns übertragen, was immer mit Unsicherheiten verhindert einen Imageverlust und höhere Kosten (Gattiker, verbunden ist. Bei einer eigenen Erhebung ist allerdings da- 2020-10). rauf zu achten, dass die Daten gemäß DSGVO sicher gespei- chert werden. 10|20 Mit den richtigen Daten die besseren Entscheidungen treffen
COMPETENCE CIRCLE TECHNOLOGIE, INNOVATION & MANAGEMENT #CCTIM DMV Whitepaper Nr. 01 | Januar 2021 Datenerhebung durch Crowdsourcing? Nach einem Aufenthalt im Hotel, einem Online-Einkauf sprechend am häufigsten zu finden sein. Es handelt sich in oder einem Flug mit der Lieblings-Airline passiert es fast der Theorie um eine Normalverteilung. immer: Wir erhalten die Aufforderung, eine Bewertung ab- zugeben. Die Beispiele in den nächsten Paragraphen zeigen jedoch auf, dass die Verteilungen im Vergleich zu dieser erwarteten Crowdsource Reviews scheinen auf den ersten Blick ein in- Normalverteilung stark verzerrt sind, sodass die Daten an telligentes System zu sein: Das Unternehmen spart – im Aussagekraft verlieren. Vergleich zur aufwendigen Studie – viel Zeit und Geld, in- Ein Beispiel im Voraus (siehe Zervas, Proserpio & Byers, 2015- dem die Arbeit direkt an Kunden ausgelagert wird. 01): Wenn ein Online-Portal angibt, dass die dort gelisteten Die statistischen Berechnungen sind leicht zu bewältigen, Hotels im Durchschnitt mit 4,5 Sternen von fünf Sternen programmierbar und können automatisiert im Hintergrund bewertet werden, entspricht das nicht der zu erwartenden ablaufen. Normalverteilung mit einem Mittelwert von 3,0. Die Nutzerbe- wertungen zeichnen eine verzerrte Verteilung (skewed distri- Gleichzeitig können innerhalb kurzer Zeit Massen animiert bution) und wir können gar nicht mehr einschätzen, welches werden, Daten abzugeben, die zwar subjektiv, im Idealfall Hotel nun wirklich ein sehr gutes oder ein sehr schlechtes Ho- aber auch unabhängig sind und dem Unternehmen so ei- tel ist, denn anscheinend sind alle top. Doch gibt es wirklich nen großen Mehrwert liefern können. Je mehr Bewertungen so gut wie gar keine schlechten Hotels mehr? Wohl kaum. abgegeben werden, desto weniger problematisch ist auch die Subjektivität. So die Theorie. Eine negative Ein- oder Zwei-Sterne-Bewertung in einer Doch stellen wir den Blick auf die verschiedenen Bewer- App beeinflusst das Markenimage. Gemäß einer Umfrage tungssysteme einmal scharf, kommen schnell Zweifel auf. von Apptentive (nicht datiert) trifft dies auf rund 55 Prozent Wie werden diese Daten genau gesammelt und wie vertrau- ihrer Studienteilnehmer zu. 71 Prozent der Befragten gaben enswürdig und nützlich sind sie? Wie aussagekräftig sind dabei an, dass eine Vier- oder Fünf-Sterne-Bewertung der Kundenbewertungen und wie gut sind die Zensuren auf den App einer bekannten Marke im App-Store ihre Sicht auf die verschiedenen Plattformen wirklich? Marke als Ganzes positiv beeinflusst. Bei den klassischen Crowdsource-Bewertungssystemen Appentive weist auch darauf hin, dass eine Verbesserung mit fünf Sternen, die wir in den meisten Online-Portalen der durchschnittlichen Bewertung von zwei auf drei Sterne finden, gibt die Anzahl der Sterne den Durchschnitt aller die Conversion-Rate im App-Store um 306 Prozent steigert. Kundenbewertungen per Sterne-Vergabe an. Wir könnten Klettert die App von drei auf vier Sterne, kann das die Con- nun erwarten, dass die schlechteste Bewertung (1,0 Ster- version nochmals um bis zu 92 Prozent steigern. ne) auch die schlechtesten Produkte auf der Plattform markiert. Die beste Bewertung (5,0 Sterne) sollte ungefähr Kundenbewertungen verbessern die Chancen für einen er- gleichermaßen selten zu finden, denn nur so sind wir in der folgreichen Verkaufsabschluss. Doch wenn die Bewertungen Lage, die Angebote innerhalb eines Portals untereinander mit Tricks gezielt manipuliert werden, sind Aussagekraft und vergleichen zu können. Der Mittelwert von 3,0 Sternen soll- Nützlichkeit dieser Daten für Konsumenten abgeschwächt. te durchschnittliche Produkte beschreiben und dement- Sie könnten langfristig sogar mehr schaden als helfen. Kundenbewertungen bei Airbnb und TripAdvisor In einer Analyse von über 600.000 Airbnb-Liegenschaften Somit scheinen TripAdvisor-Nutzer ehrlichere Bewertunge- stellten Forscher (Luca & Zervas, 2015-05) fest, dass fast 95 nen abzugeben als Airbnb-Nutzer. Normalerweise könnte Prozent der Angebote entweder 4,5 oder fünf Sterne erhiel- man annehmen, dass der Mittelwert der eingereichten Eva- ten. Fünf Sterne sind dabei die höchstmögliche Bewertung. luation bei drei von fünf Punkten liegt – nur dann hat das Sie stellten diese Airbnb-Bewertungen denjenigen von Trip- Bewertungssystem einen Sinn und kann dazu dienen, die Advisor mit etwa 500.000 gelisteten Hotels gegenüber. Hier Hotels in einem Portal miteinander zu vergleichen. Doch liegt der Durchschnitt bei weitaus niedrigeren 3,8 Sternen. das Ranking erscheint nach oben hin verzerrt zu sein. Eine wichtige Unterscheidung im Bewertungssystem der Dies wiederum schwächt auch hier den Wert der Bewer- beiden Portale: Im Gegensatz zu TripAdvisor erlaubt es tungen für zukünftige Gäste ab, da anscheinend fast alle Airbnb nicht nur den Gästen, Unterkünfte zu bewerten, son- Airbnb-Angebote einen Top-Service bieten. dern auch umgekehrt: Gastgeber können die Gäste ebenfalls Wie viele Bewertungen dabei zusätzlich teilweise „mani- bewerten. Bewerten sich Gäste und Gastgeber gegenseitig, puliert“ wurden, um gegenüber den wirklich guten Unter- könnte dies dazu führen, dass alle Nutzer tendenziell posi- künften konkurrenzfähig zu bleiben, muss ebenfalls hin- tivere Bewertungen abgeben – um im Gegenzug selbst eine terfragt werden. möglichst positive Bewertung zu erhalten (oder zumindest keine negative Bewertung zurückzubekommen). Mit den richtigen Daten die besseren Entscheidungen treffen 11|20
COMPETENCE CIRCLE TECHNOLOGIE, INNOVATION & MANAGEMENT #CCTIM DMV Whitepaper Nr. 01 | Januar 2021 Uber-Evaluationen auf Basis von Reziprozität Uber lässt Fahrer ebenfalls auch die Fahrgäste bewerten. Da Uber-Fahrer keine Auftragnehmer, sondern Angestellte Das heißt, dass nicht nur Kunden Uber-Fahrer bewerten, sind, ist das im Prinzip die Kündigung. sondern auch umgekehrt. Somit kann Uber auf Basis der Bewertungen nicht nur den Fahrern kündigen, sondern Ein Bewertungssystem auf Basis der Reziprozität liefert auch den Kunden “Hausverbot” erteilen. Dies führt zu weder Kunden noch Anbietern einen besonderen Mehr- der unaufrichtigen gegenseitigen Zusicherung hoher Be- wert. Es führt im obigen Beispiel im schlimmsten Fall wertungen – derselbe Fehler, dieselbe Methode, wie im zu Diskrimierung und Entlassungen. Wir möchten keine Bewertungssystem von Airbnb, die zu Verfälschungen füh- schlechten Bewertungen abgeben, wenn der Angestellte ren kann. Wenn das Rating eines Fahrers unter den Wert aufgrund dieser seinen Arbeitsplatz verlieren kann. Fazit: von 4,6 von maximal fünf Punkten fällt (Moore, 2020-01), Wir sollten uns auf Bewertungen in einem solchen System kann das Unternehmen den Uber-Fahrer “deaktivieren”. schlicht und einfach nicht allein verlassen. Amazon-Bewertungen gegen Vergütung 1996 ging es bei Amazon nur darum, ein gekauftes Buch zu Die Verlockung für Händler, zweifelhafte Methoden wie die- bewerten. Heute verkaufen Amazon und unzählige andere se zu nutzen, ist offensichtlich. Wer täglich mehrere Ver- Unternehmen auf dem Amazon-Marketplace Produkte jegli- käufe auf Amazon verzeichnen kann, die positiv bewertet cher Art, die ebenfalls bewertet werden können. Mit illega- werden, wird mit einem hohen Rangplatz in der Amazon- len Tricks bauen einige Billig-Händler ihre Vormachtstellung Suche belohnt. Das kann den Umsatz des Händlers schnell beim weltgrößten Online-Portal aus. um mehrere 100 Prozent steigern. Beliebt sind zum Beispiel “Produkttester-Gruppen” für Es wundert nicht, dass die Methode weiterhin genutzt wird, Amazon-Produkte auf Facebook. Wer in einer solchen wie verschiedene Recherchen zeigen (Hitchins, 2019-04) Gruppe ist, kann die zu testenden Produkte bei Amazon – obwohl Amazon „das Erstellen, Ändern oder Posten von bestellen, hinterlässt eine positive Bewertung in deutscher Inhalten im Austausch gegen eine Vergütung jeglicher Art Sprache und erhält im Gegenzug dann den Kaufpreis zu- (einschließlich kostenloser oder verbilligter Produkte) oder rückerstattet. Oben drauf gibt es oft noch einen Bonus im Namen anderer“ in den Community-Richtlinien aus- (Kaufmann, 2019-09). drücklich verbietet. 12|20 Mit den richtigen Daten die besseren Entscheidungen treffen
COMPETENCE CIRCLE TECHNOLOGIE, INNOVATION & MANAGEMENT #CCTIM DMV Whitepaper Nr. 01 | Januar 2021 Apple und Google: Die Inflation der App-Bewertungen ist schlecht für Innovationen Gaming-Apps werben um eine Bewertung vom Nutzer einer Bewertung, wenn dieser gerade ein Spiel verloren schon kurz nachdem dieser eine hohe Punktzahl im Game oder eine schlechte Nachricht bekommen hat. Erst wenn erreicht hat. Auch Banking-Apps scheinen Nutzer um Be- der Nutzer nach der richtigen Vorbereitung mit positiven wertungen zu bitten, wenn sie wissen, dass “Zahltag” ist. Reizen eine In-App-Bewertung vorgenommen hat, initiiert Und Sport-Apps geben den Anstoß zu bewerten, wenn das die App die “offizielle” Bewertung, die dann auch den App- Team des Fans, der die App nutzt, gerade gewonnen hat. Store erreicht. App-Entwickler manipulieren uns mit Belohnungsreizen Das Resultat ist, dass Entwickler von mittelmäßigen Apps und nutzen unsere Stimmung gezielt, um ihr Ranking im dennoch eine Top-Bewertung erhalten können. Besse- App-Store zu verbessern. Die durchschnittliche Zahl der re Bewertungen erlauben es den Entwicklern dann auch Bewertungen für Apps von Apple stieg von 19.000 im Jahr noch sich auf ihren Lorbeeren auszuruhen, anstatt die 2017 auf über 100.000 im Jahr 2019 an (McGee, 2020-09). Apps zu verbessern (McGee, 2020-09). Der Auslöser für diese Inflation war ein scheinbar harmlo- Übrigens zeigen die Daten auch, dass App-Bewertungen ses Update von Apple zur Stärkung des Verbraucher-Enga- mit angehängten schriftlichen Ausführungen seit Septem- gement im September 2017 – “In-App-Prompts”. Die Nutzer ber 2017 keinerlei Inflation erfahren haben (Lin, 2020-08). mussten nicht mehr proaktiv in den App-Store gehen, um Die Idee, dass mehr Sterne die bessere Qualität von Apps eine App zu bewerten – ein System, das oft nur frustrierte für iPhone oder iPad widerspiegeln, kann also nicht bestä- Nutzer anzog. Sie können Bewertungen nun auch bequem tigt werden. Es ist eher auf die langen schriftlichen Erklä- in der App selbst abgeben. rungen zu achten. Im Gegensatz dazu kletterten die Bewertungen im Play Lin (2020-08) zitiert auch Entwickler, die das Tool dafür Store von Google, der in diesem Zeitraum keine In-App- loben, dass es ihnen geholfen hat: „Nur eine Woche, nach- Bewertungen nutzte, von 33.000 auf nur 43.000 Bewertun- dem wir In-App-Reviews implementiert haben, haben wir gen pro App. Erst 2020 wurden In-App-Reviews auch hier die höchste Bewertung aller Zeiten erreicht.“ implementiert. Dies ist ein klares Bekenntnis: Entwickler können einen Das neue System ermöglicht es Entwicklern, Schlupflöcher Anstieg der Bewertungen durch In-App-Reviews erwarten auszunutzen und die Verbraucher dazu zu bringen, ihre – unabhängig davon, ob sie ihre App tatsächlich verbessert Bewertungen aufzublähen. Beispielsweise können Ent- haben. Der Ansporn für kleine Verbesserungen und große wickler einen Verbraucher vorbereiten, bevor er die App Innovationen durch die realen Bedürfnisse und Wünsche bewertet. Sie fragen den App-Nutzer sicher nicht nach der User scheint damit immer geringer zu werden. Mit den richtigen Daten die besseren Entscheidungen treffen 13|20
COMPETENCE CIRCLE TECHNOLOGIE, INNOVATION & MANAGEMENT #CCTIM DMV Whitepaper Nr. 01 | Januar 2021 Inflationäre Crowdsource-Bewertungen: Schlecht für Verbraucher? Wenn kaum jemand auf einer Fünf-Punkte-Skala unter Beispielsweise ist die Personengruppe, die ihre Meinung über 3,5 rangiert, ist eine Bewertung von 3,5 schon ziemlich Restaurants in den USA besonders aktiv austauscht, weitest- schlecht. Eine durchschnittliche Bewertung die “wirklich gehend weiß und relativ wohlhabend. Film-, Fernseh- und einen Unterschied macht” und nur etwas darunter liegt, Spielkritiken werden hingegen von jungen Männern dominiert kann für ein Mietobjekt jedoch verheerend sein oder den (Hill, 2019-09). Ob hier die Zielgruppe des einzelnen Restau- Fahrer direkt auf die Straße setzen. Wir wollen nieman- rant-Betreibers oder des Filmemachers immer angemessen den verletzen und erst recht nicht Grund dafür sein, dass repräsentiert wird, muss von Fall zu Fall überprüft werden. jemand seine Lebensgrundlage verliert – aufgrund einer schlechten Bewertung. Trotz der beschriebenen Probleme sind Kundenbewertungen für Hotels, Beratungsunternehmen oder gar Werkzeugma- Nicht nur gefälschte und manipulierte Bewertungen sind das schinenhersteller für uns interessant – speziell Bewertungen große Problem. Die Beispiele oben zeigen, dass die Glaubwür- mit angehängten schriftlichen Ausführungen (Lin, 2020-08) digkeit von Massenrezensionen durch die Funktionsweisen oder mit selbstgedrehten Videos. Diese geben dem Unter- und Schwachstellen der Bewertungssysteme auf den ver- nehmen und uns als potenzielle Kunden Informationen, die schiedenen Plattformen fast völlig aufgehoben werden kann. beispielsweise auf Probleme in einem der Hotels einer Kette oder auf Missstände in Sachen Gastfreundlichkeit hinweisen. Wie die Beispiele oben zeigen, wird die Aussagekraft der Likes und Sterne helfen vergleichsweise wenig. Eine genaue Bewertungen fast überall stark abgeschwächt. Das Prinzip Beschreibung des Problems bringt uns deutlich weiter. der gegenseitigen Bewertungen ist für die Verbraucher, die sich informieren wollen, frustrierend, denn gegenseitige Be- Das eigene Engagement, das heißt die Reaktion auf eine wertungen fallen vielfach positiver aus. Die Angst vor Diskri- Bewertung als Unternehmen, ist hier der Schlüssel zum Er- minierung schränkt die Nutzbarkeit noch weiter ein. Verbes- folg. Bekommen wir ein ausführliches positives Feedback – serungen und Innovationen bleiben dabei auf der Strecke. zum Beispiel zu einer Newsletter-Mail privat oder öffentlich auf einer Website – ist ein Dankeschön für Unternehmen Zu guter Letzt muss hinterfragt werden, inwiefern die Kun- hier ein Pflichtprogramm. den- oder Nutzerbewertungen repräsentativ sind in Bezug auf Variablen wie Einkommen, Alter, Beruf und Geschlecht. Bei einer sehr schlechten Bewertung ist die Entschuldigung Legitime Bewertungen beim Online- oder Offline-Kauf können das Mindeste und die teilweise Wiedergutmachung des verzerrt sein, wenn bestimmte Personengruppen häufiger Fehlers das Ziel – bei einem Hotel zum Beispiel mit einem Bewertungen hinterlassen als andere. Vielbeschäftigte Men- Gutschein für den nächsten Aufenthalt. Das hilft auch den schen haben weniger Zeit Produktbewertungen zu schreiben zukünftigen Kunden, die sehen, dass Bewertungen beant- und sind deshalb eher unterrepräsentiert. wortet werden und Kunden souveräne Hilfestellungen bei Problemen oder kulante Ersatzleistungen bekommen. Fazit: Daten im Digital Marketing von Studien bis zu Crowdsource Reviews Man nennt dies die Zeit von Big Data. Doch von der Daten- Studien und anderen Quellen. Aber auch bei der Entschei- flut aus Berichten, Ranglisten, Statistiken und Studien (von dungsfindung im Unternehmen sind diese essentiell. oftmals fraglicher Qualität) werden wir geradezu erschlagen und die vielen ganzen und halben Sterne „rasen uns um die Dieses Whitepaper hat aufgezeigt, mit welchen einfachen Köpfe“. Einen Überblick zu erlangen, ist schwierig. Mitteln die Zuverlässigkeit von Daten überprüft werden kann. Mithilfe von unserer Checkliste (siehe Seite 04/05) kann eine Eine Korrelation zwischen Video-Streaming und der Anzahl Studie sehr leicht auf Validität, Reliabilität und Objektivität an Kinobesuchen bedeutet nicht, dass ein kausaler Zusam- überprüft werden. Wichtig ist: Man muss kein Wissenschaft- menhang besteht. Gute Kundenbewertungen für ein Un- ler sein, um unplausible Datenerhebungen oder Statistiken ternehmen bedeuten nicht, dass diese Bewertungen den und falsche Schlussfolgerungen zu durchschauen. Tatsachen entsprechen. Positive Bewertungen sind wichtig, um konkurrenzfähig zu bleiben – ob gefälscht oder echt. Sie Auch bei Ranglisten, wie sie in Magazinen, Blogs und White- sichern einem Verkäufer auf Amazon einen guten Rangplatz papers häufig veröffentlicht werden, lohnt es sich, anhand in den Suchergebnissen der Plattformen. der Checkliste zu überprüfen, welche Kriterien wie gemes- sen wurden, um das Ranking zu erstellen. Ranglisten können Wenn wir Daten nicht im Kontext betrachten und von allen nach diesem oder jenem Kriterium beliebig neu geordnet Seiten genau beleuchten, tappen wir eben weiterhin im Dun- und in einem anderen Licht präsentiert werden. Können keln (zumindest teilweise). Auch unsere Entscheidungen auf (reproduzierte) Daten in einem Whitepaper einer kritischen Basis dieser Daten – sowohl privat als auch im Beruf – kön- Prüfung wie dieser standhalten, handelt es sich wohl um ei- nen sich „als mindestens als sehr riskant entpuppen“. Das nen sehr guten, zuverlässigen Report. Solche Reports oder A und O sind deshalb gut durchdachte, klare Definitionen, Studienberichte gibt es, wenn auch weniger als wir uns dies Regeln und Transparenz bei der Bewertung von Daten aus wünschen. 14|20 Mit den richtigen Daten die besseren Entscheidungen treffen
Sie können auch lesen