The Age of Voice 2.0 Voice Assistance in Deutschland: Nutzer, Content und neue Nutzungssituationen - OMD Germany Blog

Die Seite wird erstellt Gustav Scholl
 
WEITER LESEN
The Age of Voice 2.0 Voice Assistance in Deutschland: Nutzer, Content und neue Nutzungssituationen - OMD Germany Blog
The Age
of Voice 2.0
Voice Assistance in Deutschland:
Nutzer, Content und neue Nutzungssituationen

                                               1
The Age of Voice 2.0 Voice Assistance in Deutschland: Nutzer, Content und neue Nutzungssituationen - OMD Germany Blog
„Hello, Voice…“
                                 Liebe/r Leser/in,

                                 als wir 2018 die erste Studie durchgeführt haben, wurden wir von Neugier
                                 getrieben: Es gab zwar etliche Aussagen bezüglich des Besitzes von Smart
                                 Speakern, aber wenig über deren Nutzung und die Nutzungsmotivationen.
                                 Auch gab es keine Unterscheidung zwischen der Nutzung von Voice Assistants und
                                 Smart Speakern. In „The Age of Voice“ haben wir deutlich gesehen, wie wichtig es
                                 ist, bei dem noch jungen Thema beide Stränge getrennt zu betrachten.
                                 Wir haben damals prognostiziert, dass sich Voice (als übergreifendes Thema)
Kate Burgarth                    im Laufe des Jahres 2019 festigen und deutlich etablieren wird. Hatten wir
Managing Director, OMD Hamburg
                                 recht? Eindeutig: ja.

                                 The Age of Voice 2.0 zeigt deutlich, dass Voice absolut im Mainstream ange-
                                 kommen ist. Und nicht nur das – auch auf Content hat Voice einen deutlich
                                 spürbaren Einfluss und es verschmelzen bereits sprachgesteuerter Audio- und
                                 Visual-Content, getrieben durch neue „voice enabled devices“.

                                 Und diese neue Hardware (wie beispielsweise sprachgesteuerte Kopfhörer)
                                 führt dazu, dass Voice auch in neuen Verwendungsmomenten zum Tragen
                                 kommt – das finde ich persönlich richtig spannend. Denn diese Entwicklungen
                                 bieten aufregende und innovative Möglichkeiten für Marken, in Kontakt mit
                                 Konsumenten zu treten und der bestehenden Kommunikation durch Voice eine
                                 wichtige Facette hinzuzufügen.

                                 Ich freue mich also sehr, die zweite Welle unserer Studie präsentieren zu können –
                                 und hoffe, wir können auch mit The Age of Voice 2.0 Ihre Neugier wecken. Wir
                                 sind gespannt auf Ihre Anregungen, Feedback, Fragen und auf den inhalt-
                                 lichen Austausch mit Ihnen. Denn mir fallen nach wie vor keine Marken oder
                                 Produkte ein, bei denen Voice im Kommunikationsmix keine Rolle spielen kann.

                                 „Sprechen“ Sie uns gerne an!

                                 Happy Reading und viele Grüße
                                 Kate Burgarth
Inhaltsverzeichnis
The Age of Voice 2.0 → S. 04

Forschungsdesign → S. 05

10 Key Findings → S. 06

Status Quo: Voice in Deutschland → S. 08

Nutzer & Motivationen → S. 15

Der Einfluss von Voice auf Audionutzung & Content → S. 22

Voice in neuen Nutzungssituationen → S. 30

Die Zukunft von Voice → S. 37

Impressum und Kontakt → S. 39
The Age of Voice 2.0

The Age of Voice 2.0
Alexa. Willkommen im Mainstream.
Voice Assistants und Smart Speaker sind in der Gesellschaft angekommen – das machen die Zahlen und Erkennt-
nisse der vorliegenden Befragung deutlich: sowohl in der Verbreitung als auch in der Art und Weise, wie Menschen
hierzulande die Technologie in ihren Alltag integrieren.

Zählten 2018 noch 38 % der Deutschen zu den aktiven Nutzern von Voice, trifft dies Ende des ersten
Quartals 2020 schon auf jeden Zweiten zu. Und sogar mehr als jeder zweite Voice-Nutzer gibt an, öfter als
noch vor einem Jahr mit der Technologie zu interagieren. Auch die Anzahl von Smart-Speaker-Haushalten
ist in Deutschland Ende 2019 auf von 22 % auf 30 % gestiegen.

Voice ist im Mainstream angekommen und der Trend ist eindeutig: Voice wird weiterhin wachsen!

Zeit für ein Update
Treiber für „The Age of Voice“ war unsere Neugier. Vor unserer Studie gab es Erhebungen zu Nutzungszahlen und
Verbreitung – das „Warum“ beziehungsweise „Warum nicht“ wurde jedoch nicht oder nur selten hinterfragt.
Um tiefer in die kommunikative Nutzung von Voice einzusteigen, haben wir Nutzungstreiber und -motivationen ab-
gefragt und unterschiedliche Nutzungskontexte analysiert. Und unser Ansatz traf den Zahn der Zeit. Das
durchweg positive und zahlreiche Feedback hat uns ermutigt, diese Themen jetzt mit einer Folgestudie weiter-
zuverfolgen und zu vertiefen:

The Age of Voice 2.0
Die vorliegende Studie aktualisiert die Daten zur Verbreitung und Nutzung von Voice sowie der Überprüfung von
Nutzungstreibern für 2019 mit kurzfristigen Nutzungsprognosen bis Ende Q1 2020. Ergänzend beleuchten wir in
dieser Welle den Einfluss von Voice auf Audionutzung und Content sowie den Einzug von Voice in neue Nutzungs-
situationen. Im Ergebnis stehen neue Möglichkeiten für Unternehmen, mit ihren Zielgruppen über Voice in Kontakt
zu treten: durch Inspiration für den Nutzer, den passenden Audio Content und der passenden Voice Strategie als
integrativer Teil eines größeren Ökosystems mit einer wachsenden Anzahl und Rolle von Displays.

Eines ist klar: Es wird immer wichtiger, sich mit den Chancen, die Voice bietet, auseinanderzusetzen.
Insbesondere jetzt, da die Technologie bereits im Nutzungs-Mainstream angekommen ist, ist es essenziell, den
richtigen „Audio-Weg“ für die eigene Marke zu definieren und relevanter Teil der Voice-Nutzung zu sein.

                                                                                                               4
The Age of Voice 2.0 | Forschungsdesign

Forschungsdesign
Die Studie wurde analog zu der Studie im Jahr 2018 umgesetzt. Sie wurde mittels Panelbefragung
unter Onlinern E18-65 durchgeführt.
– Quantitative Befragung im Online-Access-Panel
– Durchführendes Institut: Trend Research, Hamburg
– Zielgruppe: Onliner E18-65 (repräsentativ für Geschlecht und Alter)
– Stichprobe: n = 3.002 Interviews (Nachbefragung*: n = 2.404 Interviews)
– Befragungszeitraum: 03.12.2019 bis 11.12.2019 (Nachbefragung*: 17.12.2019 bis 19.12.2019)

Die Befragung fand – anders als 2018 – im Dezember 2019 statt. Um vergleichbare Ergebnisse zum Vorjahr liefern zu
können, wurden Black-Friday-Käufe bei der Ausweisung des Smart-Speaker-Besitzes herausgerechnet.

Struktur der Befragten

Geschlecht                                                              Alter (in Jahren)

                                                                        18-29
                                                                                                    22 %
                                                                        30-39
                                                                                                 19 %
                                                    50 %                40-49
                                                                                                  20 %
                                                                        50-65
                                                    50 %                                                                 39 %

Basis: alle Befragten; n = 3.002; n = 2.404 (Nachbefragung)

Die Erhebung erfolgte mit freundlicher Unterstützung von

Anmerkung: Die Veränderung der Frage nach dem Smart-Speaker-Besitz im Haushalt (Marke und Anzahl Geräte) führte zu unplausiblen Ergebnissen. Die Befragungsteilnehmer
*

wurden nachträglich gebeten, die zwei Fragen zur Smart-Speaker-Bekanntheit und zum Besitz noch einmal zu beantworten. Die Fragen wurden analog zur 2018er-Studie gestellt. Von den
3.002 Befragten nahmen 2.404 erneut an der kurzen Nachbefragung teil.

Die Auswertungen zum Smart-Speaker-Besitz sowie die Bildung der Nutzertypen erfolgte auf Basis der Nachbefragung (n = 2.404 Interviews) – im Folgenden in den Fallzahlen mit ° gekennzeichnet.
Die sonstigen Auswertungen (zum Beispiel zu Voice Assistants und Podcasts) basieren auf dem Gesamtdatensatz.

                                                                                                                                                                                                 5
The Age of Voice 2.0 | 10 Key Findings

10 Key Findings
1 — Voice Assistants sind Mainstream: Ende März 2020 nutzt jeder
zweite Deutsche einen Voice Assistant aktiv – das heißt mindestens
wöchentlich.
2 — Smart Speaker sind Mainstream: Ende 2019 verfügen 30 % der
Haushalte über Smart Speaker. In einem durchschnittlichen Smart-
Speaker-Haushalt stehen zwei Smart Speaker.
3 — Voice only? Nein – der Trend geht zur Kombination mit einem
Display: Fast jeder vierte Smart-Speaker-Besitzer hat einen Smart
Speaker mit Display. 84 % der Voice-Nutzer interagieren mit Voice auf
ihrem Smartphone. Voice festigt somit seine Rolle als Eingabemedium.
4 — Wer Voice intensiv nutzt, tut dies mittlerweile unabhängig
vom Device: 89 % der Intensivnutzer von Voice Assistants nutzen auch
einen Smart Speaker.
5 — Die User Experience von Voice hat sich aus Nutzersicht nicht
signifikant verbessert. Dennoch etabliert sich Voice als relevanter
Touchpoint zur Interaktion mit situativ passenden Services – und
vor allem mit Content wie Informationen oder Unterhaltung.

                                                                      6
The Age of Voice 2.0 | 10 Key Findings

6 — Schlüssel zum Erfolg bleiben Inspiration zu Interaktionen mit der
Technologie sowie ein verbesserter Schutz der Privatsphäre.
7 — Die Nutzung von Smart Speakern treibt die Nutzung von Audio
Content wie Musik-Streaming und Podcasts: 66 % Voice-Intensivnutzer
und 51 % Gelegenheitsnutzer konsumieren mehr Audio Content,
seitdem sie ihre Smart Speaker nutzen.
8 — Nutzer haben sich an die Steuerung von Content per Sprache
gewöhnt und sind offen für interaktive Werbung. Dieses Aktivierungs-
potenzial gilt auch für neuere Audioformate wie Podcasts.
9 — Nutzer sind zudem offen für Voice in „neuen“ Situationen wie
im Auto oder beim Sport – sogar, wenn die Interaktionen nicht un-
mittelbar etwas mit der Situation oder Tätigkeit zu tun haben.
Das zeigt, dass die Technologie als Mehrwert wahr- und auch
angenommen wird.
10 — Nutzer können sich neue Nutzungssituationen ähnlich gut vor-
stellen wie die Szenarien aus dem letzten Report. Sie sind bereit, Voice
stärker in den Alltag einzubinden. Eine Chance für Marken, durch
Inspiration und Audio Content zu punkten.

                                                                        7
The Age of Voice 2.0 | Status Quo: Voice in Deutschland

Status Quo: Voice
in Deutschland

1 — Voice Assistants sind Mainstream:
Ende März 2020 nutzt jeder zweite
Deutsche einen Voice Assistant aktiv –
das heißt mindestens wöchentlich.

2 — Smart Speaker sind Mainstream:
                                                          Voice Assistants sind
2019 verfügen 30 % der Haushalte                          Anwendungen, die Anfragen per Sprach-
                                                          befehl erfassen und entsprechende
über Smart Speaker. In einem durch-                       Ergebnisse liefern. Sie sind als Software
                                                          unter anderem Teil vieler Smartphones,
schnittlichen Smart-Speaker-Haushalt                      Tablets oder Smart Speaker. Beispiele
                                                          sind Alexa (Amazon), der
stehen zwei Smart Speaker.                                Google Assistant oder Siri (Apple).

3 — Voice only? Nein – der Trend geht
zur Kombination mit einem Display:
Fast jeder vierte Smart-Speaker-
Besitzer hat einen Smart Speaker mit
Display. 84 % der Voice-Nutzer
interagieren mit Voice auf ihrem
Smartphone. Voice festigt somit
                                                          Smart Speaker sind Lautsprecher, auf
seine Rolle als Eingabemedium.                            denen Voice Assistants installiert sind.
                                                          Beispiele sind Amazon Echo,
                                                          Google Home oder der HomePod von
                                                          Apple. Die Lautsprecher können somit
                                                          als Eingabeinstrument für
                                                          Sprachsteuerung genutzt werden.

                                                                                                      8
The Age of Voice 2.0 | Status Quo: Voice in Deutschland

Wie sieht die Nutzung von Voice-Technologie heute aus?
Der positive Trend für Voice in Deutschland setzt sich fort: Ende 2018 haben 61 % der Deutschen mit einem Voice
Assistant interagiert, ein Jahr später ist dieser Anteil auf 64 % angestiegen. Im gleichen Zeitraum erhöhte sich der
Anteil von aktiven Nutzern* von 38 % auf 44 % – ein deutlich überproportionales Wachstum. Zu diesen aktiven
Nutzern kommen diejenigen, die nach eigenen Angaben in den kommenden drei Monaten erstmalig Sprach-
steuerung nutzen wollen (6 %). Ende März 2020 zählt somit jeder zweite Deutsche zu den aktiven Voice-Nutzern.

Die Zahlen bestätigen zudem unsere letztjährige Prognose, dass Ende 2019 mindestens jeder fünfte Deutsche
täglich seinen Voice Assistant nutzen würde – aktuell sind es sogar 23 %.

Voice Assistants: Nutzung

                            2018                                                            2019

                                                                                 36 %                   64 %

        39 %                                     61 %

                                                   38 %                    6%                                  44 %

         Voice Assistant schon mal genutzt                                   Aktive Nutzer (mindestens 3-4x im Monat)
         Noch nie genutzt                                                    zukünftige Nutzer (planen innerhalb von Q1 2020 zu nutzen)

„Haben Sie schon einmal einen Voice Assistant genutzt?“;
„Wie häufig nutzen Sie Ihren Voice Assistant ganz generell?“
 Basis: alle Befragten; n = 3.255 (2018); n = 3.002 (2019)

Die Nutzerstruktur wird zudem älter: Waren Ende 2018 noch 70 % der Nutzer älter als 30 Jahre, sind es Ende 2019
bereits 75 %. Diese Zahlen belegen: Voice Assistants sind im deutschen Mainstream angekommen!

Da verwundert es nicht, dass im Jahresvergleich sowohl Bekanntheit als auch Nutzung der Voice Assistants
steigen. Interessant ist, dass der Google Assistant und Siri ihre Plätze getauscht haben: Google liegt hier nun in
der Nutzung vor Apple, obwohl iOS im Verlauf von 2019 wieder Marktanteile von Android hinzugewinnen konnte[1].
Eine Erklärung für die stärkere Nutzung vom Google Assistant gegenüber Siri ist nicht nur, dass Google das Pro-
dukt 2019 stark beworben hat, sondern auch, dass deutlich mehr Geräte mit dem Google Assistant als mit
Siri steuerbar sind (beispielsweise LG Smart TVs) – und Nutzer ihre Voice Assistants auf mehr Devices nutzen.

*
    aktiver Nutzer = Voice-Nutzung mindestens 3-4x pro Monat
 [1]
       Quelle: https://www.kantarworldpanel.com/global/smartphone-os-market-share/

                                                                                                                                          9
The Age of Voice 2.0 | Status Quo: Voice in Deutschland

Voice Assistants: Bekanntheit                                                  Voice Assistants: Nutzung nach Assistant

Amazon Alexa                                                                   Amazon Alexa
                                                  89 %                                          25 %
                                                  90 %                                             32 %
Apple Siri                                                                     Google Assistant
                                         72 %                                                    27 %
                                         73 %                                                     29 %
Google Assistant                                                               Apple Siri
                                 58 %                                                            27 %
                                  62 %                                                         23 %
Microsoft Cortana                                                              Microsoft Cortana
                          46 %                                                           14 %
                           48 %                                                         13 %
Telekom Magenta*                                                               Vorinstallierte Voice Assistants im Auto*
               24 %                                                                   9%
Samsung Bixby                                                                  Samsung Bixby
         15 %                                                                     4%
              23 %                                                                 6%
Vorinstallierte Voice Assistants im Auto*                                      Telekom Magenta*
            18 %                                                                  3%
Ich kenne keine Voice Assistants
    5%
   4%

    2018       2019                                                                2018       2019
*
 2018 noch nicht abgefragt                                                     *
                                                                                2018 noch nicht abgefragt
“Welche der folgenden Voice Assistants kennen Sie, wenn auch                   “Haben Sie schonmal einen Voice Assistant genutzt? Wenn ja,
 nur dem Namen nach?”, Mehrfachantworten möglich.                               welchen?”, Mehrfachantworten möglich.
 Basis: alle Befragten; n = 3.255 (2018), n = 3.002 (2019)                      Basis: alle Befragten; n = 3.255 (2018), n = 3.002 (2019)

Das gleiche Bild zeigt sich für Smart Speaker: Die steigende Anzahl der Nutzer und ein höheres
Durchschnittsalter zeigen, dass die Speaker mittlerweile nicht mehr nur ein Thema für Early
Adopter sind. Untermauert wird dies durch die steigende Anzahl von Smart-Speaker-Haushalten,
die zudem im Schnitt mehr Geräte haben als noch vor einem Jahr.

Smart Speaker: Besitz im Haushalt

             2018                                                                            2019

                                   22 %                                                                             30 %

        1,6                                                                               2,1
                                   Smart Speaker im                                                                 Smart Speaker im
                                   Haushalt vorhanden                                                               Haushalt vorhanden

       Speaker pro                 78 %                                                   Speaker pro               70 %
        Haushalt                   kein Smart Speaker                                      Haushalt                 kein Smart Speaker
                                   im Haushalt                                                                      im Haushalt
                                   vorhanden                                                                        vorhanden

„Gibt es in Ihrem Haushalt einen oder mehrere der folgenden
 Smart Speaker?“ Basis: alle Befragten; n = 3.255 (2018); n = 2.404 (2019) °

                                                                                                                                             10
The Age of Voice 2.0 | Status Quo: Voice in Deutschland

Steigende Verbreitung und mehr Geräte pro Haushalt = steigende Nutzungsintensität
30 % der Nutzer von Voice Assistants oder Smart Speakern nutzen die Technologie häufiger als noch vor einem
Jahr – zählt man die 26 % hinzu, die letztes Jahr noch nicht zu den Voice-Nutzern gezählt haben, nutzt sie sogar
mehr als jeder Zweite häufiger. Weitere 31 % nutzen Voice in etwa genauso häufig wie noch vor einem Jahr.
Bei nur 10 % ist die Nutzung rückläufig, 4 % haben die Nutzung von Voice bereits wieder aufgegeben.

Voice Assistants & Smart Speaker: Nutzungsintensität

4%                                                             30 %
nicht mehr                                                     häufiger als vor
26 %                                                           einem Jahr

vor einem Jahr noch
keine Nutzung

10 %                                                           31 %
seltener                                                       in etwa genauso
                                                               häufig

„Wenn Sie an Ihre Nutzung in den letzten Wochen denken, inwieweit
 hat sich Ihre Nutzung in den letzten zwölf Monaten verändert?“
 Basis: Nutzer von Voice Assistants und/oder Smart Speakern
 (mindestens selten); n = 1.640, Summe >100% durch Rundungsdifferenz

Interessant ist die leicht unterschiedliche Entwicklung der Nutzung von Voice Assistants allgemein und
Smart Speakern im Speziellen. Während die Nutzungsfrequenz von Voice Assistants insgesamt steigt, lassen
sich die ersten Nutzer beobachten, die ihre Smart Speaker nicht mehr nutzen.

Voice Assistants: Nutzungsintensität                                              Smart Speaker: Nutzungsintensität

2018       15 % 11 %    21 %    15 %      19 %   18 %                             2018        44 %      24 % 24 %      5% 3%1%

2019         22 %    13 % 20 % 13 % 17 %         15 %                             2019         46 %     21 % 19 %      6% 3%2% 3%

   mehrmals täglich            seltener                                              mehrmals täglich           seltener
   1-2 x pro Tag               ich habe die Funktion                                 1-2 x pro Tag              ich habe die Funktion
   mehrmals pro Woche          1-2 x ausprobiert                                     mehrmals pro Woche         1-2 x ausprobiert
   3-4 x pro Monat             nie                                                   3-4 x pro Monat            nie

„Wie häufig nutzen Sie ihren Voice Assistant ganz generell?“                      „Wie häufig nutzen Sie den Voice Assistant in Ihrem Smart
 Basis: Nutzer von Sprachassistenten (mindestens selten);                          Speaker ganz generell?“
 n = 1.985 (2018), n = 1.919 (2019)                                                Basis: Besitzer von Smart Speakern; n = 713 (2018), n = 411 (2019) °

Wir halten aber fest: 92 % der Nutzer nutzen ihre Geräte mindestens wöchentlich und die wachsende Anzahl an
Smart-Speaker-Haushalten und Geräten pro Haushalt belegt den positiven Trend der Verbreitung in Deutschland.
Eine Sättigung, wie im letzten Report thematisiert, lässt sich aktuell nicht beobachten.

                                                                                                                                                          11
The Age of Voice 2.0 | Status Quo: Voice in Deutschland

Smart Speaker – Nutzungsintensität & Dauer des Besitzes

Seit 2 Monaten                                   83 %                          12 %        5%

Vor 3-6 Monaten                        58 %                           38 %                 4%

Vor 7-12 Monaten                          66 %                          28 %          6%

Länger als 12 Monate                     62 %                       22 %        16 %

   mindestens tägliche Nutzung          (mehrmals) wöchentliche Nutzung               seltener oder nicht (mehr)

„Wann haben Sie oder Ihr Haushalt erstmalig einen Smart Speaker gekauft und / oder geschenkt bekommen?“,
„Wie häufig nutzen Sie den Voice Assistant in Ihrem Smart Speaker ganz generell?“
 Basis: Besitzer von Smart Speakern; n = 411 °

Diejenigen, die ihre Smart Speaker nicht mehr nutzen, besitzen ihre(n) Smart Speaker größtenteils länger als ein Jahr.
In der internationalen OMD-Studie „The Retail Revolution“, die das Konsumentenverhalten hinsichtlich AI-basierter
Technologien in über 13 Märkten vergleicht, beobachten wir einen ähnlichen Effekt: Zu Beginn der Nutzung gibt
es einen „Honeymoon“-Moment, in dem Nutzer zunächst viel mit der neuen Technologie ausprobieren und ent-
sprechend intensiv nutzen. In der Folge flacht diese ausgeprägte Nutzung allerdings ab („post adoption there is a
decline in usage and excitement.“).

In Anlehnung an diese Erkenntnisse und Gartners „Hype Cycle for Emerging Technologies“ gehen wir von drei
Phasen der Nutzungsintensität von Smart Speakern aus:

Phase 1: Ausprobieren
In den ersten zwei Monaten nutzen über 80 % mindestens täglich, getrieben durch Neugierde und Entdeckungslust
(„Honeymoon“, OMD-Studie „The Retail Revolution“).

Phase 2: Gewöhnung
Die Intensität nimmt ab, häufig durch Ernüchterung, da neue Technologien die (sehr) hohen Erwartungen an
Usability und Services nicht direkt erfüllen können („Trough of Disillusionment“, Gartner).

Phase 3: Alltag
Die Nutzung steigt wieder etwas und pendelt sich auf einem „Normal-Level“ ein.
(„Plateau of Productivity“, Gartner).

Intensität

  100

  50

                                                                                                        Es bleibt abzuwarten, ob und auf
  1-2 Monate           3-6 Monate             7-12 Monate      Dauer des Besitzes
                                                                                                        welchem Level sich die Alltagsnutzung
   mindestens täglicher Nutzer             Nicht-Mehr-Nutzer                                            langfristig einpendelt.

                                                                                                                                                12
The Age of Voice 2.0 | Status Quo: Voice in Deutschland

Voice wächst – Amazon gewinnt
Mehr aktive Nutzer, mehr Smart-Speaker-Haushalte: Größter Nutznießer dieses Wachstums ist – wie auch schon
bei den Voice Assistants – Amazon. Im Hinblick auf die massive Werbepräsenz von Amazon zu Aktionen wie dem
Prime Day oder Black Friday, bei denen die Amazon-eigenen Geräte oft im Fokus stehen, verwundert dies nicht.

Smart Speaker: Bekanntheit                                                    Smart Speaker: Besitz

Amazon Echo                                                                   Amazon Echo
                                                                67 %                                                                     59 %
                                                                       76 %                                                                      67 %
Google Home                                                                   Google Home
                                              47 %                                                  21 %
                                            44 %                                               16 %
Amazon Echo Spot                                                              Amazon Echo Show
                      22 %                                                           6%
                     21 %                                                                   13 %
Apple HomePod                                                                 Amazon Echo Spot
                   18 %                                                                  10 %
                    19 %                                                                  11 %
Amazon Echo Show                                                              Google Home Mini
               14 %                                                                      10 %
                   18 %                                                                 10 %
Google Home Mini                                                              Bose SoundTouch
                     20 %                                                                 11 %
                  17 %                                                                7%
Sonos One                                                                     Sonos One
                       22 %                                                              10 %
                15 %                                                                 6%
Hallo Magenta*                                                                Apple HomePod
             12 %                                                                     7%
Bose SoundTouch                                                                      6%
                  17 %                                                        Hallo Magenta*
            11 %                                                                    5%
JBL LINK *
                                                                              JBL LINK*
         8%                                                                        4%
Google Nest Hub*                                                              Google Nest Hub*
        7%                                                                       2%
Lenovo Smart Display*                                                         Lenovo Smart Display*
     4%                                                                          2%
Harman Kardon Citation*                                                       Harman Kardon Citation*
    3%                                                                           2%
JBL LINK VIEW*                                                                JBL LINK VIEW*
   2%                                                                           1%
Libratone ZIPP*                                                               Libratone ZIPP*
  1%                                                                            1%
Ich kenne keinen
                       22 %
                15 %

  2018       2019                                                               2018       2019
2018 noch nicht abgefragt
*
                                                                              2018 noch nicht abgefragt
                                                                              *

„Welche der folgenden Smart Speaker kennen Sie, wenn auch nur                 „Gibt es in Ihrem Haushalt einen oder mehrere der folgenden Smart
 dem Namen nach?“,​Mehrfachantworten möglich.​                                 Speaker?“, Mehrfachantworten möglich.

Basis: alle Befragten; n = 3.255 (2018), n = 3.002 (2019)​                    Basis: Besitzer von Smart Speakern; n = 713 (2018), n = 735 (2019) °

                                                                                                                                                        13
The Age of Voice 2.0 | Status Quo: Voice in Deutschland

Touchpoints für Voice Interaktionen und die Rolle des Displays
Interessant: Mittlerweile hat fast jeder vierte Smart-Speaker-Besitzer einen Smart Speaker mit integriertem
Display (23 %) – im Vergleich zum Vorjahr ein deutlicher Zuwachs von 77 %. Hinzu kommt, dass 84 % der Nutzer
von Voice Assistants diese auf dem Smartphone nutzen – dies unterstreicht die Bedeutung eines visuellen
Feedbacks in Verbindung mit Sprachsteuerung und die Rolle von Voice als Eingabemedium. Diese Entwicklung
wird sich – so unsere Erwartung – fortsetzen: Displays werden (wie im letzten Report vermutet) einen signi-
fikanten Einfluss auf unsere Voice-Nutzung haben. Denn auch wenn es sich zuweilen für manche noch fremd
anfühlt, besticht Eingabe per Voice im Vergleich zur haptischen Tastatur vor allem durch die mögliche Ge-
schwindigkeit: Durchschnittlich können Menschen mehr als dreimal schneller sprechen als tippen [2]. Ein Display
als Ausgabemedium ermöglicht eine schnellere, weil multisensorische Informationsaufnahme des Rezipienten.

Voice Assistants: Genutzte Geräte

     87 %
            84 %
                                                                                       2018      2019

                         52 % 51 %

                                               28 %                         28 %
                                           22 %               23 %                 23 %       24 %
                                                                                                     19 %

    Smartphone        Smart Speaker        Smart TV*    Vorinstallierte       Tablet          Notebook |
                                                       Voice Assistants                        Laptop
                                                           im Auto**

umfasst Smart TV sowie Smart TV im weiteren Sinne (Amazon Fire TV, Apple TV)
*

2018 noch nicht abgefragt
**

“Welche der folgenden Geräte nutzen Sie, um mit Ihrem Voice Assistant zu interagieren?”,
 Mehrfachantworten möglich.
 Basis: Nutzer von Voice Assistants (mindestens selten); n = 1.618 (2018), n = 1.634 (2019)

Dienstleistungen und Produktkauf über Voice
Schritt-für-Schritt Rezeptanleitungen haben sich offenbar als weniger nützlich herausgestellt als im letzten Jahr
gedacht: 2018 konnten sich dies noch 40 % der Befragten vorstellen, ein Jahr später nur noch 29 %. Das gilt ebenso
dafür, Vergleichsportale abzurufen (2018: 31 %; 2019: 23 %). Die Vermutung liegt nahe, dass beides Funktionen
sind, die mit visueller Unterstützung für Nutzer einfacher vorstellbar sind (da die Ergebnisse mit visueller Unterstützung
intuitiver verarbeitet werden können). Bewahrheitet sich diese Vermutung in Zukunft, müssen Marken prüfen, wie
sie Content und Werbung entsprechend optimieren können, da wir schon heute eine steigende Verbreitung von
Smart Speakern mit Displays beobachten (s.o.).

Wie vor einem Jahr geben 6 % der Befragten an, bereits Produkte per Sprachbefehl gekauft zu haben. Weitere
35 % können sich vorstellen, dies generell zu tun. Damit bewegen sich die Werte auf konstantem Niveau – mit
positivem Ausblick: 14 % der Befragten planen, innerhalb der kommenden drei Monate Produkte über Voice zu
kaufen. Wir glauben, dass der steigende Anteil von Smart Speakern mit Displays auch auf diese Entwicklung
einen positiven Effekt haben wird.

[2]
      Quelle: Statista TrendCompass 2020

                                                                                                                       14
The Age of Voice 2.0 | Nutzer & Motivationen

Nutzer &
Motivationen
In „The Age of Voice“ wurden Motivationen und Wünsche sowie Treiber für die Technologie und Werbetreibende auf
Basis von drei Nutzertypen abgeleitet:
– Intensivnutzer von Smart Speakern
– Intensivnutzer von Voice Assistants, die noch keinen Smart Speaker nutzen
– Befragte, die keinerlei Voice Technologie nutzen

Diese Nutzertypen unterschieden sich teils deutlich – dadurch zu erklären, dass die Thematik noch recht jung war.
Mit „Voice im Mainstream“ muss dieses Bild neu gezeichnet werden. Dafür spricht vor allem:

Wer Voice intensiv nutzt, tut dies unabhängig vom Device.

1 — Wer Voice intensiv nutzt,
tut dies mittlerweile unabhängig
vom Device: 89 % der Intensivnutzer
von Voice Assistants nutzen auch
einen Smart Speaker.

2 — Die User Experience von Voice
hat sich aus Nutzersicht nicht
signifikant verbessert.

3 — Schlüssel zum Erfolg bleiben
Inspiration zu Interaktionen mit der
Technologie sowie vor allem ein
verbesserter Schutz der Privatsphäre.

                                                                                                                    15
The Age of Voice 2.0 | Nutzer & Motivationen

Voice-Nutzer haben in der Regel auch einen Smart Speaker zuhause: Mittlerweile nutzen 89 % der Intensivnutzer von
Voice Assistants intelligente Lautsprecher (2018: 67 %). Die Voice-Nutzung unterscheidet sich also nicht mehr nach dem
Endgerät, sondern vielmehr nach Intensität – und diese ist nach eigener Aussage der Befragten relativ konstant:

Gerade einmal 2 % geben an, dass sie ihre Nutzung in den kommenden drei Monaten intensivieren wollen.
Im Folgenden vergleichen wir:

                                                   Intensivnutzer                                                         50 %   HHNE €3000+
                                                   Nutzen mindestens täglich Voice

                                                                                                                          23 %
             23 %                                                                                                                jünger als 30

                                                   39 %                    61 %                                           68 %   jünger als 50

                                                   Intensivnutzer sind im Schnitt jünger, eher Männer und verfügen über ein höheres Einkommen.

                                                   Gelegenheitsnutzer                                                     44 %   HHNE €3000+
                                                   Nutzen (mehrmals) wöchentlich Voice

                                                                                                                          22 %
              21 %
                                                                                                                                 jünger als 30

                                                    40 %                   60 %                                           64 %   jünger als 50

                                                   Gelegenheitsnutzer sind soziodemographisch betrachtet den Intensivnutzern zwar ganz ähnlich,
                                                   unterscheiden sich aber teils deutlich in ihren Einstellungen.

                                                   Nichtnutzer                                                            33 %   HHNE €3000+
                                                   Nutzen Voice nicht (mehr)
                                                                                                                         15 %    jünger als 30
             46 %                                   57 %                   43 %                                           52 %   jünger als 50

                                                   Nichtnutzer sind zum jetzigen Stand die klassische Late Majority und die Laggards aus der Diffu-
                                                   sionstheorie. Sollte der Schutz der Privatsphäre merklich verbessert werden, sind mindestens 17 %
                                                   der Deutschen bereit, Voice zukünftig zu nutzen.

Fehlende Prozente bis 100 % = Nutzer, die seltener als 3-4x pro Monat mit Voice interagieren. Diese Nutzer werden im Folgenden
nicht als Nutzertyp betrachtet.

                                                                                                                                                       16
The Age of Voice 2.0 | Nutzer & Motivationen

Je intensiver die Nutzung, desto natürlicher die Integration in den Alltag
Für knapp zwei Drittel der Intensivnutzer sind Voice Assistants weiterhin ein fester Bestandteil des Alltags. Auch bei
Gelegenheitsnutzern beobachten wir in der Tendenz steigende Werte, allerdings ist hier noch deutlich Luft nach
oben: Obwohl diese per Definition (mehrmals) wöchentlich mit der Technologie interagieren, sagt nur jeder Fünfte,
dass Voice Assistants ein fester Bestandteil seines Alltags sind.

„Der Voice Assistant ist ein fester Bestandteil meines Alltags.“

2018                                                                  62 %
                          17 %

2019                                                                    64 %
                             20 %

   Intensivnutzer       Gelegenheitsnutzer

„Wie sehr treffen die folgenden Aussagen auf Sie zu?“, 7er-Skala von „treffen voll und ganz zu“ bis
„treffen gar nicht zu“. Top 3 Werte.

Basis: Nutzertypen; Intensivnutzer (2018 n = 580; 2019 n = 563), Gelegenheitsnutzer (2018 n = 678 ; 2019 n = 473​) °

Eine Erklärung dafür liegt in den bislang nicht ausreichend erfüllten Erwartungen der Gelegenheitsnutzer.

Innerhalb des letzten Jahres hat Voice gefühlt keinen signifikanten, technischen Sprung gemacht
Meistgenannte Erwartungen an die Technologie waren im letzten Jahr eine Verbesserung der Spracherkennung,
eine verbesserte, einfachere User Experience (UX) und ein erweiterter Funktionsumfang innerhalb von Voice-Apps
(beziehungsweise eine Kompatibilität zwischen [Voice]-Apps).

Die Spracherkennung ist vor allem aus Sicht der Intensivnutzer besser geworden
und konnte die Bedenken der letztjährigen Befragung etwas auflösen:

2018

Ich habe Bedenken bezüglich
                                                                                 42 %
der fehlenden Lernfähigkeit des                                                 40 %
Assistenten.

Ich habe Bedenken, dass die Eingabe                                                              57 %
                                                                                                         66 %
nicht richtig verstanden wird.

2019

Die Spracherkennung ist – seitdem                                                                         67 %
ich sie nutze – besser geworden.                                                      46 %

   Intensivnutzer       Gelegenheitsnutzer

„Welche Bedenken haben Sie bei der Nutzung von Voice Assistants oder Smart Speakern?“ (2018), „Wie sehr treffen die
 folgenden Aussagen auf Sie zu?“ (2019), jeweils 7er-Skala von „voll und ganz“ bis „gar nicht“. Top 3 Werte.​

Basis: Nutzertypen; Intensivnutzer (2018 n = 580; 2019 n = 563), Gelegenheitsnutzer (2018 n = 678 ; 2019 n = 473​) °

                                                                                                                       17
The Age of Voice 2.0 | Nutzer & Motivationen

Allerdings schafft es Voice weiterhin nicht, einen klaren Mehrwert gegenüber Tastatureingaben zu bieten. Einen
deutlichen Gap beobachten wir vor allem bei Nichtnutzern. Das ist damit zu erklären, dass diejenigen, die im letzten
Jahr eher die Vorzüge von Voice gesehen haben, mittlerweile zu Nutzern geworden sind – und diejenigen, die
weiterhin Nichtnutzer sind, der Technologie insgesamt weniger zutrauen.

„Sprachsteuerung bietet keinen Mehrwert gegenüber Tastatureingaben.”

Intensivnutzer
                               29 %
                                      35 %
Gelegenheitsnutzer
                           25 %
                            27 %
Nichtnutzer
                                      35 %
                                               44 %

   2018          2019         2018        2019            2018        2019

„Wie sehr treffen die folgenden Aussagen auf Sie zu?“, 7er-Skala von „treffen voll und ganz zu“
 bis „treffen gar nicht zu“. Top 3 Werte.​

Basis: Nutzertypen; Intensivnutzer (2018 n = 580; 2019 n = 563), Gelegenheitsnutzer
(2018 n = 678; 2019 n = 473);​Nichtnutzer (2018 n = 1.624; 2019 n = 1.114) °

Eine „deutliche“ Verbesserung der Technologie beziehungsweise UX wird aus Nutzersicht also insgesamt noch
nicht bescheinigt. Dennoch sagen 69 % der Intensivnutzer, es sei einfacher geworden, mit der eigenen Stimme
Aufgaben und Apps zu steuern – unter Gelegenheitsnutzern stimmen dieser Aussage immerhin 43 % zu.

Nutzer der Technologie empfinden es überwiegend als normal, mit einem elektronischen Gerät zu sprechen;
die Werte bewegen sich auf in etwa demselben Level wie im letzten Jahr und zeigen, dass Berührungsängste
mit der Technologie schnell abgebaut werden, wenn sie denn genutzt wird.

„Ich empfinde es nicht als seltsam, mit einem elektrischen Gerät zu sprechen.“​

Intensivnutzer
                                                                       69 %
                                                                     66 %
Gelegenheitsnutzer
                                                                    65 %
                                                                     67 %
Nichtnutzer
                                         39 %
                                          40 %

   2018          2019         2018        2019            2018        2019

„Wie sehr treffen die folgenden Aussagen auf Sie zu?“, 7er-Skala von „treffen voll und ganz zu“
 bis „treffen gar nicht zu“. Top 3 Werte.​

Basis: Nutzertypen; Intensivnutzer (2018 n = 580; 2019 n = 563), Gelegenheitsnutzer
(2018 n = 678; 2019 n = 473);​Nichtnutzer (2018 n = 1.624; 2019 n = 1.114)​°

                                                                                                                   18
The Age of Voice 2.0 | Nutzer & Motivationen

Inspiration und verbesserter Datenschutz bleiben die Schlüssel zum Erfolg
Dass sowohl Nichtnutzer als auch Nutzer noch zu häufig gar nicht wissen, was mit Voice möglich ist und sie daher
Aufklärung und Inspiration brauchen, war eine der zentralen Erkenntnisse aus dem letztjährigen Report. Die Er-
gebnisse der aktuellen Erhebung zeigen zwei Punkte: Jeder fünfte Nichtnutzer möchte gerne mehr erfahren – das
Interesse an der Technologie ist also auch unter Nichtnutzern da. Und: Je häufiger Voice genutzt wird, desto aus-
geprägter ist der Wunsch nach mehr Inspiration.

„Ich wünsche mir mehr Inspiration und Anregungen dazu, was ich über Sprachbefehle steuern kann.“

63 %                                             46 %                         21 %
Intensivnutzer                                   Gelegenheitsnutzer           Nichtnutzer

„Wie sehr treffen die folgenden Aussagen auf Sie zu?“, 7er-Skala von „treffen voll und ganz zu“
 bis „treffen gar nicht zu“. Top 3 Werte.​

Basis: Nutzertypen; Intensivnutzer (2018 n = 580; 2019 n = 563), Gelegenheitsnutzer
(2018 n = 678; 2019 n = 473);​Nichtnutzer (2018 n = 1.624; 2019 n = 1.114) °​

Interessant: Zum einen sagen Intensivnutzer, dass sie ihre Smart Speaker vielseitig nutzen, neue Befehle auspro-
bieren und sich aktiv über neue Funktionen informieren – doch genau wie Gelegenheitsnutzer nutzen sie in der
Regel immer dieselben wenigen Funktionen. Das ist ganz ähnlich wie bei installierten und tatsächlich genutzten
Apps auf unseren Smartphones: Fast jeder dritte Smartphone Nutzer hatte 2017 mindestens 20 oder mehr Apps
installiert, jeder Zweite nutzt aber maximal sechs davon regelmäßig (das heißt mindestens einmal pro Monat)[3].

Ich nutze meinen Smart Speaker ganz vielseitig
                                                                                                      66 %
und habe Spaß daran,                                                                  31 %
neue Befehle auszuprobieren.

Ich suche eigenständig nach beziehungsweise                                                          64 %
informiere mich über neue Funktionen                                                          40 %
und probiere diese aus.

Ich nutze eigentlich immer dieselben wenigen                                                          65 %
                                                                                                      65 %
Funktionen der Sprachsteuerung.

       Intensivnutzer             Gelegenheitsnutzer

„Wie sehr treffen die folgenden Aussagen auf Sie zu?“
Basis: Nutzertypen; Intensivnutzer (n = 563), Gelegenheitsnutzer (n = 473) °​

[3]
      Quelle: YouGov Report „App in die Tonne“

                                                                                                                   19
The Age of Voice 2.0 | Nutzer & Motivationen

Unabhängig vom Grad der Nutzung und ihrem Interesse an der Technologie haben Deutsche weiterhin ausgeprägte
Bedenken bezüglich ihrer Privatsphäre – im Vergleich zum letzten Jahr sogar leicht steigend. Möglicherweise ist
dies getrieben von Pressemeldungen um Mitschnitte von Privatgesprächen, die etwa händisch transkribiert und
analysiert wurden.[4]

„Ich habe Angst, durch Smart Speaker überwacht zu werden.“

Intensivnutzer
                                                        43 %
                                                         45 %
Gelegenheitsnutzer
                                                                     54 %
                                                                         59 %
Nichtnutzer
                                                                                64 %
                                                                                        70 %

       2018           2019              2018        2019             2018          2019

„Wie sehr treffen die folgenden Aussagen auf Sie zu?“ Basis: Nutzertypen; Intensivnutzer (2018 n = 580; 2019 n = 563), Gelegenheitsnutzer
 (2018 n = 678 ; 2019 n = 473);​Nichtnutzer (2018 n = 1.624; 2019 n = 1.114) °​

Im Kontext der Datenschutz-Thematik wird Voice von Nutzern entsprechend bewusst eingesetzt – was sich auch
darin widerspiegelt, dass es für alle Nutzertypen Räume gibt, in denen Smart Speaker nichts verloren haben.

Ich sehe die Vorteile neuer Technologien
                                                                                                                                        60 %
(zum Beispiel Smart Speaker), nutze sie jedoch                                                                                           61 %
zunächst nur bewusst / begrenzt.                                                                         33 %

Es gibt Räume in meiner Wohnung / meinem                                                                                                     62 %
Haus, wo Smart Speaker nichts verloren haben.                                                                                                       70 %

       Intensivnutzer             Gelegenheitsnutzer              Nichtnutzer

„Wie sehr treffen die folgenden Aussagen auf Sie zu?“, 7er-Skala von „treffen voll und ganz zu“ bis „treffen gar nicht zu“. Top 3 Werte.
 Basis: Nutzertypen; Intensivnutzer (n = 563), Gelegenheitsnutzer (n = 473), Nichtnutzer (n = 1.114) °

Mit steigender Intensität geht dennoch eine sorgenfreiere oder bewusstere Nutzung einher. Besonders deutlich wird
dies dadurch, dass Intensivnutzer und in Teilen Gelegenheitsnutzer bereit sind, für die Vorteile der Voice-Nutzung
ihre Privatsphäre ein Stück weit aufzugeben. Diese Erkenntnis deckt sich mit der in anderen Studien nachgewiesenen
Bereitschaft, mit „eigenen Daten“ für entsprechende Services zu zahlen (beispielsweise sind 36 % der Deutschen
bereit, Services mit privaten Daten zu bezahlen[5]). Für Nichtnutzer stellt dies dennoch ein absolutes No-Go dar.

Meine Daten werden sowieso überall
gespeichert. Es lohnt sich nicht, sich darüber                                                                                     55 %
                                                                                                      31 %
zu viele Gedanken zu machen.                                                              21 %

Die Sprachsteuerung bringt viele Vorteile mit                                                                                        57 %
sich. Deshalb bin ich bereit, einen Teil meiner                                                  26 %
                                                                    2%
Privatsphäre aufzugeben.

       Intensivnutzer             Gelegenheitsnutzer              Nichtnutzer

„Wie sehr treffen die folgenden Aussagen auf Sie zu?“, 7er-Skala von „treffen voll und ganz zu“ bis „treffen gar nicht zu“. Top 3 Werte.
 Basis: Nutzertypen; Intensivnutzer (n = 563), Gelegenheitsnutzer (n = 473), Nichtnutzer (n = 1.114) °

[4]
      Quelle: https://www.spiegel.de/netzwelt/gadgets/amazon-mitarbeiter-hoeren-sich-tausende-privatgespraeche-mit-alexa-an-a-1262315.html
[5]
      Quelle: OMD, The Retail Revolution 2019

                                                                                                                                                           20
The Age of Voice 2.0 | Nutzer & Motivationen

Nutzung und Intensität werden zukünftig deutlich steigen, wenn die Anforderungen an Daten- und Privatsphären-
schutz erfüllt werden: 37 % der Nichtnutzer sind bereit, Smart Speaker zu nutzen, wäre die Nutzung sicherer.

„Ich würde Smart Speaker (mehr) nutzen, wenn die Nutzung sicherer wäre
(zum Beispiel durch Abhörschutz, Server in Deutschland).“

57 %                                        60 %                                37 %
Intensivnutzer                              Gelegenheitsnutzer                  Nichtnutzer

„Wie sehr treffen die folgenden Aussagen auf Sie zu?“

Basis: Nutzertypen; Intensivnutzer (2018 n = 580; 2019 n = 563),
Gelegenheitsnutzer (2018 n = 678; 2019 n = 473);​Nichtnutzer (2018 n = 1.624; 2019 n = 1.114) °​

Neben mehr Sicherheit muss Voice durch einfache Anwendungen überzeugen
Auf der einen Seite beobachten wir eine steigende Verbreitung mit 50 % der Deutschen als aktive Nutzer. Auf der
anderen Seite steht eine für Nutzer vorerst nur moderat spürbare Verbesserung der Technologie: Dies drückt sich
durch konstante bis langsam ansteigende Werte für die Integration in den Alltag (bei Intensivnutzern auf hohem,
bei Gelegenheitsnutzern auf niedrigem Niveau) und die Nutzung von überwiegend wenigen Funktionen (die dafür
in hoher Frequenz) aus. Beides spricht dafür, dass Voice zwar angekommen ist, sowohl die Technologie als auch
Anwendungen das Potenzial allerdings noch nicht ausgeschöpft haben. Dies kann an zwei Aspekten liegen:

Zum einen an einer zu hohen Erwartungshaltung aus Nutzersicht – wobei Voice noch am Anfang steht. Anfänglich
wiesen beispielsweise auch Smartphone-Apps nur eingeschränkte Funktionen auf, die bei weitem nicht das ganze
Potenzial der Technologie ausnutzen.

Zum anderen fehlt es noch an überzeugenden Use Cases, die vor allem erst einmal simpel zu bedienen sind, anstatt
zu schnell zu viel zu wollen. Erfolgsfaktoren sind hierbei Anwendungen, die Zeit sparen, Abläufe einfacher
gestalten, dem Nutzer Hilfestellungen geben oder ihn unterhalten – also einen spürbaren Mehrwert im Alltag stiften.
Anwendungen müssen dafür einfach, intuitiv und systemübergreifend kompatibel sein (vgl. The Age of Voice #1,
2019).

Einen ersten Lösungsansatz bietet Amazon bereits mit „App to App Account Linking“. Das Feature ermöglicht dem
Nutzer, aus einer Smartphone-App heraus einen Skill auf dem Smart Speaker zu aktivieren und gleichzeitig auto-
matisch beispielsweise Bezahlmittel aus dem Amazon-Konto zu hinterlegen. Aus Nutzersicht entfallen hierdurch
nervige Schritte, was die Nutzung vereinfacht. Aus Anbietersicht wird Voice auf diese Weise natürlicher in das digitale
Ökosystem bestehend aus App und Website integriert und als Interface für Nutzerinteraktionen verstanden – und
nicht als Stand-Alone-Lösung, die den hohen Erwartungen der Nutzer (noch) nicht gerecht werden kann.[6]

[6]
      Quelle: All About Voice Podcast #21

                                                                                                                     21
The Age of Voice 2.0 | Der Einfluss von Voice auf Audionutzung & Content

Der Einfluss von
Voice auf Audio-
nutzung & Content
Zwei Drittel der Nutzer haben bereits ihre Voice-Gewohnheiten entwickelt und nutzen eine begrenzte Anzahl an
Befehlen, die sich für sie bewährt haben (siehe S. 19). Dass Content hierbei eine zentrale Rolle einnimmt, konnten
wir bereits im letzten Report belegen. Entertainment wurde als einer der Haupttreiber für die Nutzung von Voice
identifiziert: Die meisten Befragten konnten sich am ehesten vorstellen, Musik abzuspielen, Video-on-Demand-In-
halte abzurufen oder Kinotickets über ihre Assistants zu bestellen. Das Entdecken oder Abspielen von Musik war
dabei der meistgenannte Anreiz, die Technologie zu nutzen.

1 — Die Nutzung von Smart Speakern
treibt die Nutzung von Audio Content
wie Musik-Streaming und Podcasts:
66 % Voice-Intensivnutzer und 51 %
Gelegenheitsnutzer konsumieren mehr
Audio Content, seit sie ihre Smart
Speaker nutzen.

2 — Nutzer haben sich an die Steue-
rung von Content per Sprache ge-
wöhnt und sind offen für interaktive
Werbung. Dieses Aktivierungspoten-
zial gilt auch für neuere Audioforma-
te wie Podcasts.

                                                                                                                 22
The Age of Voice 2.0 | Der Einfluss von Voice auf Audionutzung & Content

Audio Content hat also einen deutlichen Einfluss auf die Nutzung von Smart Speakern. Und dies ist ein beidseitiger
Effekt: Smart Speaker haben einen Einfluss auf die Art und Weise, wie wir Audio Content konsumieren – und vor
allem auch wie viel.

66 %                                                        51 %                                                  46 %
der Voice-Intensivnutzer                                    der Gelegenheitsnutzer                                der Nichtnutzer können sich
konsumieren insgesamt mehr                                  konsumieren insgesamt mehr                            vorstellen, Musik über einen
Audio Content, seitdem sie                                  Audio Content, seitdem sie                            Voice Assistant oder
ihre(n) Smart Speaker nutzen.                               ihre(n) Smart Speaker nutzen.                         Smart Speaker zu hören
                                                                                                                  (2018 waren dies noch 32 %).

Der größte Effekt lässt sich für Musik-Streaming-Dienste nachweisen, gefolgt von Radioinhalten vor Podcasts. Die
Zahlen belegen den Einfluss von Voice auf eine steigende Relevanz von non-linearen Audioinhalten, die im Ausblick
des letztjährigen Reports als Hypothese thematisiert wurde.

Effekt von Smart Speakern auf Audio-Content-Konsum

Seitdem ich Smart Speaker nutze…

  höre ich mehr...     höre ich in etwa gleich viel(e)...      höre ich ich weniger, beziehungsweise kein(e)...

Musik-Streaming-Dienste                    51 %                                40 %             9%
Radio                                   39 %                          51 %                     10 %

Postcasts                        26 %                             57 %                       17 %

Basis: Nutzer von Smart Speakern (mindestens selten); n = 364 ˚

Unterschiedliche Content-Arten profitieren also von Voice, wie das non-lineare Musik-Streaming und die aktuell
stark wachsenden Podcasts im Folgenden beweisen:

Musik-Streaming
In welchem Umfang Interaktionen mit Audio Content beziehungsweise Streaming-Diensten über Sprachbefehle
vorstellbar sind, bewerteten die Befragten in einem Szenario anhand einer 7er-Skala („kann ich mir sehr gut
vorstellen“ – „kann ich mir überhaupt nicht vorstellen“). Im Vergleich zum letzten Report haben wir die Interaktions-
möglichkeiten bewusst reduzierter beschrieben – mit dem Effekt, dass sich Nutzer, egal welchen Typs,
das Szenario deutlich weniger gut vorstellen können:

                                                                                                                                                 23
The Age of Voice 2.0 | Der Einfluss von Voice auf Audionutzung & Content

Szenario:
Musik-Streaming
Sie hören online Ihre Lieblingsmusik (beispielsweise
über einen Streaming-Dienst) über Ihren Smart Spea-
ker oder Ihr Smartphone. Sie haben keine Hand frei,
weil Sie zum Beispiel gerade kochen. Per Sprachbefehl
können Sie zum nächsten Song oder zu einem ande-
ren Interpreten wechseln. Zwischen den Songs er-
fahren Sie, dass der Künstler demnächst in Ihrer Stadt
ein Konzert gibt. Sie können per Sprachbefehl sofort
Konzerttickets und Fan-T-Shirts bestellen.

„Dieses Szenario kann ich mir ganz allgemein (sehr)
 gut vorstellen.“

Intensivnutzer

    63 %                          32 %
          2018                          2019

Gelegenheitsnutzer                                            Nichtnutzer

    42 %                          21 %                               17 %                       10 %
          2018                          2019                             2018                         2019

  Intensivnutzer          Gelegenheitsnutzer           Nichtnutzer

Basis: Nutzertypen; Intensivnutzer (2018 n = 580; 2019 n = 563), Gelegenheitsnutzer (2018 n = 678; 2019 n = 473);​
Nichtnutzer (2018 n = 1.624; 2019 n = 1.114)​°

                                                                                                                     24
The Age of Voice 2.0 | Der Einfluss von Voice auf Audionutzung & Content

Die niedrigeren Werte im Vergleich zur ausführlicheren Szenario-Beschreibung im letzten Jahr sind ein weiterer
Beleg dafür, dass Inspiration Grundlage für eine (intensive) Nutzung ist – auch weil die Zustimmungswerte für die
einzelnen Funktionen in etwa auf dem Vorjahresniveau liegen beziehungsweise deutlich geringere Unterschiede zu
den oben aufgeführten Werten aufweisen:

Szenario – Musik-Streaming (Einzelfunktionen)

Titelauswahl/Wiedergabe per                                                    72 %                                             62 %                        31 %
Sprachbefehl steuern                                                       66 %                                              58 %                       27 %

Musik (Streaming/Radio) über                                                  71 %                                       54 %                           28 %
den Smart Speaker                                                           67 %                                                                       24 %
                                                                                                                         52 %
Vorschläge für neue Musik
                                                                          64 %                                        46 %                           22 %
basierend auf Ihren
Hörgewohnheiten anfordern                                          52 %                                           42 %                         16 %

                                                                       58 %                                    38 %                              17 %
Per Sprachbefehl Informationen
über Künstler abrufen                                            49 %                                         35 %                            14 %

Konzertkarten bestellen                               30 %                                          18 %                                  10 %

                                       2018        2019                                   2018         2019                            2018          2019

Basis: Nutzertypen; Intensivnutzer (2018 n = 580; 2019 n = 563), Gelegenheitsnutzer (2018 n = 678 ; 2019 n = 473);​
Nichtnutzer (2018 n = 1.624; 2019 n = 1.114) °​

Das Szenario offenbart
Potenzial für Käufe über Voice:

30 %
der Intensivnutzer können sich
vorstellen, Konzerttickets oder
Merchandise aus dem Stream
heraus per Sprachinteraktion
zu kaufen.

                                                                                                                                                                   25
The Age of Voice 2.0 | Der Einfluss von Voice auf Audionutzung & Content

Podcasts
Als Anfang der 2000er Podcasts als neues Audioformat in der Medienlandschaft auftauchten, waren Akzeptanz
und Nutzung in Deutschland lange Zeit eher verhalten – nach einem kurzen anfänglichen (kleinen) Hype mit bis zu
8 % Nutzern, haben zwischen 2008 und 2014 durchschnittlich gerade einmal 5 % der Deutschen zumindest selten
Podcasts gehört. Seit 2015 erlebt das Audioformat einen Aufschwung und kann deutliche Nutzerzuwächse ver-
zeichnen: Im ersten Quartal 2019 hören 19 % der Deutschen ab 14 Jahren mindestens monatlich Podcasts.[7]
Ende 2019 sind es bereits 19 %, die in etwa wöchentlich hören – das sind 25 % der befragten deutschen Onliner
in der vorliegenden Studie. 42 % hören mindestens selten und hinzu kommen bis Ende des ersten Quartals 2020
weitere 5 %, die planen, Podcasts zu nutzen.

Während Podcasts hauptsächlich über das Smartphone abgespielt werden, spielen Smart Speaker hierbei noch
eine untergeordnete Rolle. Immerhin nutzt aber insgesamt jeder zehnte Podcast-Hörer einen Smart Speaker für
das Abspielen – und sobald Hörer einen Speaker besitzen, geht dieser Wert signifikant nach oben. Das zeigt: Mit
steigender Verbreitung der Geräte gibt es ein deutliches Potenzial für Podcasts, über Voice einen Rückkanal zu
schaffen und zukünftig etwa interaktive Inhalte oder Werbung zu integrieren.

Podcasts: Nutzungsintensität                                      Podcasts: Geräte, über die Podcasts gehört werden

43 %                                             4%               Smartphone
Nie und ich plane                                (Mehrmals)                                                                               71 %
dies auch nicht in                               täglich                                                                                     76 %
den nächsten drei                                                                                                                         72 %
Monaten                                                           PC, Laptop und Notebook
                                                 10 %
                                                                                                         40 %
                                                 Mehrmals                                           34 %
5%
                                                 pro Woche                                             38 %
Nie, aber ich plane
es in den nächsten                                                Tablet
drei Monaten                                     11 %                                    23 %
                                                 3-4x pro Monat                            26 %
                                                                                          25 %
                                                                  Fernseher oder Smart TV (mit und ohne Spielekonsole)
                                                 17 %                        11 %
                                                 Seltener                       14 %
                                                                                     19 %
                                                 10 %             Smart Speaker
                                                 Habe es 1-2x               10 %
                                                                                 15 %
                                                 probiert, dann                            26 %
                                                 aber wieder
                                                 gelassen
                                                                     Nutzer von Podcasts       Nutzer von Podcasts und Voice Assistants
                                                                     Nutzer von Podcasts und Smart Speakern

„Wie häufig nutzen Sie Podcasts?“                                 „Über welche der folgenden Geräte hören Sie Podcasts in der Regel?“,
 Basis: alle Befragten, n = 3.002                                  Mehrfachantworten möglich. Basis: Nutzer von Podcasts (n = 989),
                                                                   Nutzer von Podcasts und Voice Assistants (n = 613), Nutzer von Podcasts
                                                                   und Smart Speakern (n = 248) °

Die Befragten haben ebenfalls bewertet, ob das zuvor skizzierte Werbeformat
tatsächlich vorstellbar ist und auch genutzt werden würde:

[7]
      Quelle: ARD/ZDF-Onlinestudie 2006 - 2019

                                                                                                                                                 26
The Age of Voice 2.0 | Der Einfluss von Voice auf Audionutzung & Content

Szenario:
Podcast
Sie hören sich einen Podcast an, in dem Werbung
ausgespielt wird. Im Werbespot wird Ihnen die
Möglichkeit gegeben, über einen Sprachbefehl
das beworbene Produkt/den Service direkt zu be-
stellen - inklusive Rabattcode. ​

„Dieses Szenario kann ich mir ganz allgemein
 (sehr) gut vorstellen.“

Intensivnutzer

    26 %                       32 %
     Intensivnutzer               Intensivnutzer
                              mit Podcast-Nutzung

Gelegenheitsnutzer                                        Nichtnutzer

    12 %                        14 %                              5%                        6%
   Gelegenheitsnutzer         Gelegenheitsnutzer                  Nichtnutzer               Nichtnutzer
                             mit Podcast-Nutzung                                       mit Podcast-Nutzung

  Intensivnutzer        Gelegenheitsnutzer          Nichtnutzer

Basis: Nutzertypen; Intensivnutzer (n = 563), Gelegenheitsnutzer (n = 473); Nichtnutzer (n = 1.114);
Intensivnutzer mit Podcast-Nutzung (n = 377); Gelegenheitsnutzer mit Podcast-Nutzung (n = 240);
Nichtnutzer mit Podcast-Nutzung (n = 278)​°

Das Szenario zeigt: Die Offenheit für eine gezielt werbliche
Aktivierung, gerade unter Intensivnutzern, ist da – sogar gesteigert, wenn
diese bereits Podcasts nutzen. Besonders Essensbestellungen und das
Ordern von beispielsweise Kinotickets können sich 47 % beziehungsweise
43 % der Intensivnutzer in diesem Szenario vorstellen. Aber auch unter Ge-
legenheitsnutzern und sogar Nichtnutzern zeigen sich Potenziale für eine
promotionale Aktivierung über Voice und Podcasts.

                                                                                                             27
The Age of Voice 2.0 | Der Einfluss von Voice auf Audionutzung & Content

Szenario: Podcast (Einzelfunktionen)​

                                    Intensivnutzer                                    Gelegenheitsnutzer                         Nichtnutzer

Essen beim Lieferdienst                                            47 %                                 25 %                                 17 %
bestellen                                                      41 %                                    24 %                                12 %

Kinotickets oder sonstige                                      43 %                                20 %                                    13 %
Eintrittskarten buchen
                                                            36 %                                  18 %                                   10 %

                                                          38 %                                   16 %                                   9%
Mietwagen reservieren
                                                       30 %                                    13 %                                    7%

Elektronische Kleingeräte                                   37 %                               14 %                                     8%
bestellen                                               31 %                                   13 %                                   6%

Haushaltswaren oder                                         36 %                               13 %                                     9%
Heimtextilien bestellen                               29 %                                     13 %                                   6%

Probefahrten für einen                                      36 %                                15 %                                   7%
Pkw vereinbaren                                        30 %                                    14 %                                   5%

Kosmetik oder Pflegeprodukte                            33 %                                    15 %                                   8%
bestellen                                            27 %                                      13 %                                   6%

Sportschuhe/-bekleidung                                 32 %                                   14 %                                    7%
bestellen                                            26 %                                     12 %                                    5%

Zahlungspflichtige Ratgeber-                            31 %                                   13 %                                   5%
App herunterladen                                  24 %                                     8%                                       4%

                                       mit Podcastnutzung             alle               mit Podcastnutzung          alle           mit Podcastnutzung   alle

Basis: Nutzertypen; Intensivnutzer (n = 563), Gelegenheitsnutzer (n = 473); Nichtnutzer (n = 1.114); Intensivnutzer mit Podcast-Nutzung (n = 377);
Gelegenheitsnutzer mit Podcast-Nutzung (n = 240); Nichtnutzer mit Podcast-Nutzung (n = 278) °​

Podcasts sind also durchaus geeignet, Voice als Rückkanal für werbliche Aktivierung zu nutzen. Mit steigender
Nutzung von Podcasts und steigender Verbreitung von Voice werden diese Potenziale zukünftig größer ausfallen
und – wie das Diagramm zeigt – für unterschiedliche Branchen Chancen durch interaktive Werbeformate bieten.

Potenziale durch diese Art von Werbeformaten können sich zukünftig vor allem die großen Plattformen sichern:
Meistgenutzte Plattform für Podcasts ist YouTube, gefolgt von den Musik-Streaming-Anbietern Spotify und Amazon
Music. Beide Streaming-Anbieter können deutlich von einer intensiveren Smart-Speaker-Nutzung profitieren.

                                                                                                                                                                28
The Age of Voice 2.0 | Der Einfluss von Voice auf Audionutzung & Content

Podcast: Genutzte Apps & Plattformen                                                                    Podcast: Nutzungsorte

YouTube                                                                                                Zu Hause
                                                                   52 %                                                                                                                  78 %
                                                                  51 %                                                                                                                75 %
                                                                  51 %                                                                                                                    79 %
Spotify                                                                                                Unterwegs im Auto
                                              34 %                                                                                   29 %
                                                 38 %                                                                                    33 %
                                                          44 %                                                                           33 %
Amazon Music                                                                                           Unterwegs in öffentlichen Verkehrsmitteln
                                    26 %                                                                                          27 %
                                              34 %                                                                                     31 %
                                                 38 %                                                                                    33 %
Audible                                                                                                Unterwgs im Fernverkehr
                        16 %                                                                                                 21 %
                           19 %                                                                                                23 %
                               23 %                                                                                                  29 %
Apple Podcast                                                                                          Unterwegs zu Fuß oder mit dem Rad
                       15 %                                                                                             16 %
                         17 %                                                                                            17 %
                        16 %                                                                                                 21 %
Overcast                                                                                               Am Arbeitsplatz, in der Schule / Universität
    4%                                                                                                           9%
      6%                                                                                                          10 %
         9%                                                                                                       10 %
Catcher!                                                                                               Außer Haus bei Freunden / Familie / Bekannten
     5%                                                                                                      5%
      6%                                                                                                     5%
        8%                                                                                                   5%
                                                                                                       Sonstiges
                                                                                                          3%
                                                                                                         2%
                                                                                                         2%

       Nutzer von Podcasts                     Nutzer von Podcasts und Voice Assistants                   Nutzer von Podcasts               Nutzer von Podcasts und Voice Assistants
       Nutzer von Podcasts und Smart Speakern                                                              Nutzer von Podcasts und Smart Speakern

“Welche Apps, bzw. Anbieter nutzen Sie, um Podcasts zu hören?”,                                        “Wo hören Sie sich üblicherweise Podcasts an?”,
 Mehrfachantworten möglich.                                                                             Mehrfachantworten möglich.
 Basis: Nutzer von Podcasts (n = 989), Nutzer von Podcasts und Voice                                    Basis: Nutzer von Podcasts (n = 989), Nutzer von Podcasts und Voice
 Assistants (n = 613), Nutzer von Podcasts und Smart Speakern (n = 248) °                               Assistants (n = 613), Nutzer von Podcasts und Smart Speakern (n = 248) °

Die häufigste Situation, in denen Podcast gehört werden, ist gleichzeitig diejenige, in der wir am häufigsten mit
Voice interagieren. Aber auch im Auto, einem relevanten Umfeld für Voice, hört fast jeder dritte Podcast-Nutzer
das Audioformat – und auch hier gibt es entsprechend Potenzial für kontextuell passende Werbung (siehe S. 33)

Dass Marken Produkte und Content sowohl im Kontext von Musik-Streaming als auch von Podcasts erfolgreich
über Voice zugänglich gemacht haben, zeigen zwei Beispiele.

BACARDÍ – Produkt-Sampling via Smart Speaker                                                           Kid’s Crest – Chompers
(BACARDÍ, OMD | GER)                                                                                   (P&G, Hearts & Science | USA)
BACARDÍ hat Ende 2019 seinen neuen Rum BACARDÍ Añejo Cuatro über Audio                                 Ein Case, der sehr früh und erfolgreich das Potenzial von Podcasts in Verbindung
Spots auf Smart Speakern beworben. Das Besondere: Durch Interaktion mit dem                            mit Voice für sich genutzt hat, ist „Chompers“: Kurze Podcast-Episoden, die via
Smart Speaker konnten Nutzer eine kleine Flasche des Rums direkt zu sich nach                          Skill abrufbar sind, animieren durch Spiele, Songs und Rätsel zum morgendlichen
Hause bestellen. Die Kampagne vereinte somit Marke, thematische Nähe (Spiri-                           und abendlichen Zähneputzen. Chompers kombiniert dabei erfolgreich das bei
tuose und Musik) und Produkterlebnis (durch den direkten Rückkanal via Voice)                          Kindern als lästig wahrgenommene Zähneputzen mit Unterhaltung über den
ohne Medienbruch und auf einfachem Weg. Stephanie Baars (Brand Managerin,                              Smart Speaker und sorgt durch Cliffhanger von der morgendlichen zur abend-
BACARDÍ) sieht in der innovativen Art des Produktsamplings über Smart Speaker                          lichen Podcastfolge (zum Beispiel die Auflösung der Rätsel) für über 8 Millionen
zukünftiges Potenzial: „Dieser neue Weg der Sample-Bestellung wird in Zukunft an                       Skill-Aktivierungen innerhalb der ersten Wochen und 45 % tägliche Nutzer. Kid’s
Bedeutung gewinnen.“                                                                                   Crest war dabei als „Sponsor“ des Formats bei jedem Zähneputzen dabei.[8][9]

[8]
      Quelle: https://www.adweek.com/digital/how-gimlet-media-is-tweaking-its-podcast-programming-for-voice-assistants/
[9]
      Quelle: https://clios.com/awards/winner/audio/p-g-crest-kids/chompers-422

                                                                                                                                                                                          29
The Age of Voice 2.0 | Voice in neuen Nutzungssituationen

Voice in neuen
Nutzungssituationen
Mit dem Einzug von Voice im Mainstream wird die Technologie zunehmend Bestandteil von neuen Lebensbereichen
und Nutzungssituationen. Getrieben wird diese Entwicklung durch weitere „voice enabled devices“, die Interaktio-
nen mit Voice an mehr Touchpoints im Alltag ermöglichen. Beispielsweise hat Amazon im September 2019 ange-
kündigt, seine Echo-Familie um unterschiedlichste Endgeräte deutlich auszubauen:

Mit Echo Loop, Echo Frames und Echo Buds sind das zum Beispiel ein smarter Ring, eine smarte Brille und
smarte Kopfhörer. Echo Flex, als Smart Speaker für die Steckdose im Kleinstformat, bringt Voice flexibel an Orte,
an denen sich Konsumenten keinen „normalen“ Echo stellen möchten oder können. Aber nicht nur im Alexa-
Kosmos, sondern auch für den Google Assistant, Siri und Bixby kommt immer weitere Hardware auf den Markt.

1 — Nutzer sind offen für Voice in „neu-
en“ Situationen, wie einer Nutzung im
Auto oder beim Sport – auch wenn die
Interaktion nicht unmittelbar etwas
mit der Situation oder Tätigkeit zu tun
hat. Das zeigt, dass die Technologie
als Mehrwert wahr- und auch ange-
nommen wird.

2 — Voice etabliert sich als relevanter
Touchpoint zur Interaktion mit situ-
ativ passenden Services und vor al-
lem Content wie Informationen oder
Unterhaltung.

                                                                                                                    30
Sie können auch lesen