"Alexa, frage KIT-Bibliothek wo ich lernen kann" - Einsatz von digitalen Sprachassistenten im Umfeld von Bibliotheken und Erweiterung um eigene ...
←
→
Transkription von Seiteninhalten
Wenn Ihr Browser die Seite nicht korrekt rendert, bitte, lesen Sie den Inhalt der Seite unten
128 FACHBEITRÄGE Dierolf | Skarupianski
„Alexa, frage KIT-Bibliothek wo ich lernen kann“
Einsatz von digitalen Sprachassistenten im Umfeld von Bibliotheken und
Erweiterung um eigene Dienste
Uwe Dierolf und Michael Skarupianski
Dierolf | Skarupianski
preis sind der Grund für einen großen Ansturm auf
Das Thema sprachgesteuerte persönliche Assistenten ist im wahrsten Sinne des die smarten Lautsprecher von Amazon. Genaue Zah-
Wortes in aller Munde. Die KIT-Bibliothek hat daher Ende 2017 entschieden, sich len gibt es von den Herstellern nicht, allerdings hat
mit diesem Thema unter technischen Gesichtspunkten exemplarisch am Beispiel Amazon alleine im dritten Quartal 2017 mindestens
Amazon Alexa zu beschäftigen. Dazu wurde Anfang 2018 begonnen, den Alexa
20 Millionen Echo-Geräte verkauft. Laut einer reprä-
Skill „KIT-Bibliothek“ zu entwickeln, um Erfahrungen mit den von Amazon bereit-
gestellten Entwicklerwerkzeugen und dem Review-Prozess zu sammeln, der ähn-
sentativen Umfrage haben 16% der US-Amerikaner
lich wie bei der App-Entwicklung durchlaufen werden muss. Dieser Beitrag gibt einen smarten Lautsprecher zu Hause stehen. Dabei
Einblick in die gewonnenen Erfahrungen und Probleme und verweist auf ähnliche hat Amazon einen Marktanteil von fast 70% [1]. Aus
Entwicklungen an anderen Bibliotheken. diesen Gründen fiel die Wahl bei der Auswahl eines
Voice assistants can be found in many households and more and more people are möglichen Assistenten für die KIT-Bibliothek auf Ama-
using such devices. At the end of 2017 the KIT Library decided to engage in this top- zons Alexa.
ic by developing an Alexa Skill called „KIT-Bibliothek”. The reasons for doing this step Wie bereits erwähnt ist Alexa der reine Software-
were primarily cause of gaining experience and was a technique-driven approach. Assistent. Um diesen zu benutzen wird eine Hard-
The process of developing a skill is similar to the development of a smartphone app warekomponente benötigt. Die erste verfügbare
and includes a review process to publish the skill. This reading delivers an insight in- Hardware war der von Amazon selbst vertriebene
to the experiences we made but shows also the challenges and gives a short over-
Lautsprecher „Amazon Echo”. Die günstigste Variante
view of developments made by other libraries.
nennt sich „Echo Dot”, ist kaum größer als ein Eisho-
ckey Puck und besteht aus einem Lautsprecher, vier
Tasten sowie 7 Fernfeld-Mikrofonen (diese sorgen da-
für, dass man auch trotz Nebengeräuschen oder aus
Sprachassistenz – mehr als nur ein Hype? dem nächsten Zimmer verstanden wird). Das obere
❱ Ob Apples Siri, der Google Assistant oder Ama- Ende der Produktpalette der Smarten Lautsprecher
zons Alexa – fast wie eine Flut kommen jeden Monat bildet der „Echo Show” mit eingebautem Bildschirm.
neue Geräte mit eingebauten Sprachassistenten auf Dazwischen gibt es noch den klassischen „Echo”
dem Markt und buhlen um die Gunst der Kunden. (etwa dreimal so groß wie der „Echo Dot” und mit
Unbestrittener Vorreiter war dabei Apples Siri auf besserem Lautsprecher, den „Echo Plus” mit einge-
dem iPhone, jedoch unterscheidet man mittlerweile bautem Smart-Home Hub und den „Echo Spot”, einen
den reinen Software-Assistenten (z.B. Siri) und das Radiowecker großen Lautsprecher mit kleinem Bild-
Hardware-Gerät, auf dem dieser ausgeführt wird (z.B. schirm. Der Normalpreis für den Echo Dot liegt bei 60
iPhone). €, allerdings lockt Amazon alle paar Wochen mit Son-
Die Software-Hersteller gehen dabei unterschiedliche derangeboten und bietet diesen schon ab 35 € an,
Wege. Während Apple seine Assistentin exklusiv auf beim Oberklasse-Modell „Echo Show” mit Bildschirm
die eigene Produktlinie beschränkt (iPhone, Apple TV, liegt der Normalpreis bei 220 €.
Homepod, etc.), vermarktet Google den Assistenten Neben den Geräten bietet Amazon seinen Assistenten
auf eigenen Lautsprechern, als App auf Android und auch in den Apps für Android (Alexa-App und Amazon
iOS Geräten, sowie in Lizenz an diverse Hardware Music) sowie in der Fernbedienung zur hauseigenen
Hersteller. Auch Amazon geht diesen Schritt und baut Set-Top-Box FireTV an.
nicht nur selber Hardware mit dem hauseigenen As- Grundsätzlich haben alle Geräte eines gemeinsam:
sistenten „Alexa”, sondern ermöglicht auch Fremd- Sie bestehen aus einem oder mehreren Mikrofonen
herstellern diesen in (fast) beliebige Hardware einzu- um die Frage des Benutzers aufzunehmen und einem
binden. Die Tatsache, dass Amazon der erste Herstel- Lautsprecher um die Antwort auszugeben. Zum Be-
ler mit einem reinen smarten Lautsprecher war, die trieb benötigen Sie zudem eine Internetverbindung.
aggressive Vermarktung und ein niedriger Einstiegs- Auf dieser Basis erlaubt es Amazon Fremdfirmen,
online
Bibliothek. Information. Technologie.
21 (2018) Nr. 2 www.b-i-t-online.deDierolf | Skarupianski FACHBEITRÄGE 129
eigene Geräte zu entwickeln oder die Technik in be- kann sowohl per Hardware als auch per Software er-
reits vorhandene Hardware zu integrieren. Da Ama- weitert werden. Dritthersteller können Ihre Produkte
zon seine Geräte zuerst in den USA veröffentlicht, ist so erweitern, dass diese mittels Alexa gesteuert
hier bereits ein großer Markt für Hardware mit Alexa- werden. Es gibt bereits jetzt schon steuerbare Glüh-
Integration entstanden. So gibt es z.B. Kopfhörer mit birnen, Thermostate, Steckdosen, Saugroboter und
eingebauter Alexa oder kleine Sticks, die man im Auto Fernseher. Sie müssen nur „Alexa, schalte das Licht
in den Zigarettenanzünder steckt und die so das nor- in der Küche ein” sagen und der Computer erledigt
male Auto in ein Smart Car verwandeln sollen. Für den Rest. Oft sind die Preise natürlich höher als bei
Mitte des Jahres ist sogar die erste Smartwatch an- gleichen nicht-smarten Geräten, aber durch die hö-
gekündigt, die den Sprachassistenten eingebaut hat here Marktverbreitung sind auch diese gefallen und
[4]. Auch die Autohersteller selber integrieren Alexa so gibt es z.B. per Alexa steuerbare Glühbirnen schon
in ihre Infotainment-Systeme. Ford und Seat bieten für unter 10 €.
entsprechend ausgestattete Autos bereits seit 2017 Auf die Spitze treiben es Nissan und Ford, bei denen
auf dem US-Markt an. BMW und Toyota haben ange- mittels Alexa der Benzinstand abgefragt, das Licht im
kündigt, dieses Jahr nachzuziehen [5]. Auto ein und ausgeschaltet, oder der Motor gestartet
Die Frage die sich nun unweigerlich stellt, ist: „Was und gestoppt werden kann (wohlgemerkt auch aus
kann ich damit tun?”. der Ferne, nicht nur, wenn man selbst im Auto sitzt)
Um den Lautsprecher zu aktivieren sagt man zuerst [6][7]. Und wenn man glaubt, das ganze kann nicht
immer den Namen des Assistenten und stellt da- überboten werden: Auf Kickstarter gibt es eine Kam-
nach die gewünschte Frage. Für Faktenfragen sagt pagne für eine beheizbare Jacke, die mittels Alexa an-
man z.B. „Alexa, was ist die Hauptstadt von Tuvalu?”. und ausgeschaltet werden kann [8].
Der Lautsprecher antwortet mit: „Die Hauptstadt
von Tuvalu ist Funafuti.” Dabei wurde nach dem Ak-
tivierungswort „Alexa” automatisch die Aufnahme
gestartet. Nach dem Ende des Satzes wurde diese
Audioaufnahme in die Amazon Cloud geladen, dort
analysiert und im Anschluss die Antwort (als Text)
zurückgeschickt. Der lokale Lautsprecher hat diese
Antwort dann vorgelesen.
Wenn Sie dieses Beispiel selbst testen möchten, ge-
nügt ein Amazon Account und ein Smartphone. Ins-
tallieren Sie unter Android die Amazon Alexa-App [2]
oder unter iOS die App „Amazon Music” [3]. Abbildung 1: Echo-Familie (Echo Dot, Echo, Echo Plus)
Eine der am häufigsten genutzten Funktionen ist na- im Größenvergleich zu einer Computermaus.
türlich auch das Abspielen von Musik [1]. Amazon
macht hier natürlich Werbung für den hauseigenen Neben Hardware kann das System auch mit Program-
Dienst „Amazon Music”, mit einem Echo-Lautspre- men (den sogenannten Skills) erweitert werden.
cher können Sie aber auch kostenlos über das Ra- Diese Skills können mittels Sprache oder über die
dionetzwerk TuneIn auf Streams von Radiostationen Alexa-App aktiviert werden. Möchte man den Skill
zugreifen. Sagen Sie dazu einfach „Alexa, spiele Surf „Fernsehprogramm” installieren, genügt ein „Alexa,
Radio” und Alexa spielt den entsprechenden Stream aktiviere den Skill Fernsehprogramm”. Im Anschluss
ab. ist dieser sofort verfügbar und man kann ihm Fra-
Alexa kann natürlich eine schier unendliche Menge gen stellen wie „Alexa, frage Fernsehprogramm, was
von Fragen beantworten und Aktionen ausführen. Sei heute Abend läuft”. Im Moment sind laut Amazon
es das Wetter („Alexa, wie wird das Wetter heute?”), über 30000 solcher Skills verfügbar, egal ob man
die Nachrichten („Alexa, was sind die Nachrichten?”), seine Gitarre stimmen möchte („Alexa, aktiviere Gi-
ein Timer („Alexa, stelle Teetimer auf 5 Minuten”) tarrenstimmer”) oder über die neuesten Weinfeste
oder die Einkaufsliste („Alexa, setze Nudeln auf meine informiert sein will („Alexa, aktiviere Weinfestka-
Einkaufsliste”) – auf alles hat Alexa bereits die Ant- lender”). In der Amazon-Suche [9] erhält man einen
wort eingebaut. Dabei wird das System seitens Ama- Überblick über verfügbare Skills. Da die Skills nicht
zon ständig erweitert – der neueste Clou sind (Video)- tatsächlich auf dem Gerät installiert werden, sondern
gespräche zwischen Alexa-fähigen Geräten. lediglich in der Cloud aktiviert sind, ist die Anzahl der
Und wenn dies alles nicht reicht – Amazons System aktiven Skills theoretisch nicht limitiert. Ebenso ist
www.b-i-t-online.de 21 (2018) Nr. 2 online
Bibliothek. Information. Technologie.130 FACHBEITRÄGE Dierolf | Skarupianski
ein aktivierter Skill auf allen Alexa-Geräten desselben Neuigkeiten zur UB umfasst.
Accounts verfügbar. In Österreich hat sich die FH Burgenland mit dem
Thema „Alexa Skill” beschäftigt und bietet den Skill
Warum beschäftigt sich eine Bibliothek mit „Bücherregal” an – allerdings auch nur im Dev-Mo-
dem Thema Sprachassistenten? dus und somit nicht sichtbar für alle Nutzer.
Das Thema wurde in erster Linie unter technischen Wie im Fall der UB Bamberg wird hier nach dem Star-
Gesichtspunkten an der KIT-Bibliothek Ende 2017 in ten des Skills nicht nur erklärt, was der Skill kann,
Angriff genommen. Aber natürlich sollen auch mög- sondern es wird dem Benutzer die Frage gestellt, für
liche Einsatzszenarien evaluiert werden. Dazu im Fol- welches Thema er sich interessiert. Das ist insofern
genden ein paar Beispiele. sehr praktisch, da man nur den Namen des Themas
Die KIT-Bibliothek ist seit April 2006 eine 24/7-Biblio- nennen muss, um eine Antwort zu erhalten. Der Nut-
thek. Täglich besuchen knapp 3000 Personen die KIT- zer kann den Skill also auch nutzen, ohne die Art und
Bibliothek. Bei so vielen Menschen wird natürlich die Weise zu kennen, wie man mit dem Skill sprechen
Auskunft rege genutzt, um auf allerlei Fragen Antwor- muss, um verstanden zu werden. Dieses Thema „was
ten zu erhalten. Die Auskunft ist werktags bis 19 Uhr muss ich tun, damit mich Alexa versteht?” wird im
und am Samstag bis 12.30 Uhr besetzt. Zu allen an- kommenden Kapitel genauer betrachtet.
deren Zeiten ist lediglich Wachpersonal der Campus-
sicherheit anwesend. Dieses auch häufig wechselnde Wie funktioniert Spracheingabe bei Alexa?
Personal kann nicht in allen Fällen adäquat Auskunft Jeder Skill besitzt neben dem eigentlichen Namen
auf Fragen geben. noch einen Aufrufnamen („invocation name”). Der
Daher ist ein naheliegendes Szenario für den Einsatz Aufrufname muss aus zwei Wörtern bestehen (Aus-
von Sprachassistenten die Beantwortung von Fak- nahmen sind nur für Markennamen und zusammen-
tenfragen. Der Einsatz einer Alexa-Box scheidet aus gesetzte Namen erlaubt) und wird benutzt um den
Datenschutzgründen natürlich aus (aber dazu später Skill zu aktivieren oder zu starten. Ein Skill kann z.B.
mehr). Alexa kann jedoch auch direkt vom Smartphone den Namen „Virtuelle Buchsuche mit Buchguru” ha-
aus genutzt werden, um Fragen nach Räumlichkeiten ben, wird aber mit „buch guru” aufgerufen.
„wo befindet sich das Medienzentrum”, „wo finde ich Die Funktionen, die ein Skill zur Verfügung stellt wer-
Bücher zum Thema …” zu beantworten. Weitere ggfs. den „Intents” (Absichten) genannt. Für jede Funk-
für manche Nutzer relevante Fakten sind Öffnungszei- tion, die ein Skill zur Verfügung stellen soll, muss ein
ten oder die Nennung von Telefonnummern, Räume Intent definiert werden (z.B. ein Intent für die Suche,
von Fachreferenten oder Direktion etc. einer für die Auskunft, etc.). Schließlich müssen zu
Auch die sprachgesteuerte Nutzung dynamischer jedem Intent passende Beispieläußerungen (im Alexa-
Services wie dem Seatfinder zur Ermittlung freier Ar- Jargon heißen die Äußerungen „Utterances”) ange-
beitsplätze ist sicherlich eine nützliche Angelegenheit geben werden.
für manche Menschen. Auf die Frage „wo kann ich Der Buchguru hat z.B. einen Intent Buchsuche. Nun
lernen” kann der Skill die maschinenlesbaren Schnitt- gibt man einen Beispielsatz an, was der Benutzer sa-
stellen des Seatfinders verwenden, um Auskunft über gen würde, wenn er diesen Intent ausführen will. Soll
freie Lernräume zu geben. Dies wurde bereits für den der Skill z.B. auf „Alexa frage buch guru nach Neu-
Skill „KIT-Bibliothek” implementiert. erscheinungen” reagieren, würde der Beispielsatz
Als ein mögliches Szenario, bei dem Alexa sogar sinn- „nach Neuerscheinungen” lauten.
voll zu Hause via Alexa-Box genutzt werden könnte, Damit Alexa weiß, welcher Intent gemeint ist, sollte
wäre die Beantwortung von Fragen nach der Rück- man möglichst viele Variationen angeben. Immer-
gabe von Büchern mit ggfs. durchzuführender Einzel- hin kann der Skill nicht nur mit dem Schlüsselwort
oder Pauschalverlängerung. Bis zur Klärung der Frage „frage”, sondern auch mit „sage”, „lade”, ”starte”,
nach dem Datenschutz ist die Kontoverknüpfung bis- „öffne” und noch weiteren Möglichkeiten eingebun-
her allerdings nur angedacht, jedoch noch nicht im- den werden. So wären für die Neuerscheinungen auch
plementiert worden. folgende Beispiele möglich: „Alexa, starte buch guru
Die UB Bamberg hat für ihren Skill „Unibib” diese und suche nach Neuerscheinungen”, „Alexa rufe bei
Verbindung von Amazon-Konto und Bibliothekskonto buch guru die Neuerscheinungen ab” sowie „Alexa,
sogar schon implementiert. Allerdings ist dieser Skill was sind die Neuerscheinungen von buch guru”.
noch nicht für die Öffentlichkeit sichtbar, da auch hier Dazu würde man passende Utterances erstellen: „su-
noch nicht sicher ist, was rechtlich erlaubt ist. Sie bie- che nach Neuerscheinungen” bzw. nur „Neuerschei-
ten auch den umfangreichsten Skill an, der auch die nungen”.
online
Bibliothek. Information. Technologie.
21 (2018) Nr. 2 www.b-i-t-online.deDierolf | Skarupianski FACHBEITRÄGE 131
Abbildung 2:
Alexa Developer
Konsole mit bereits
erstellten Intents
(Absichten)
Abbildung 3:
Mögliche Bei-
spielsätze für
die Lokalisierung
eines Gerätes
oder Ortes
innerhalb der
Bibliothek
Je komplizierter der Intent ist, desto komplizierter kön- zurück. Wenn kein vorgegebener Typ (Nummer, Daten,
nen auch die Beispielsätze werden. Möchte man den Regionen, Vornamen, etc..) passt, kann man auch ei-
Neuerscheinungen-Intent um eine Datumsfunktion er- gene definieren (z.B. für Buchgenres). Dabei sind die
weitern, muss man nicht alle Möglichkeiten eintippen Slots nur als mögliche Beispiele zu sehen, d.h. sie soll-
(z.B. Neuerscheinungen diese Woche, Neuerscheinun- ten z.B. zwar möglichst viele Buchgenres angeben, es
gen nächste Woche, Neuerscheinungen gestern), son- müssen aber nicht alle angegeben werden.
dern kann hier Variablen einsetzen (diese werden bei
Alexa „Slots” genannt). So genügt die Angabe eines Ein leichtgewichtiger Ansatz
Slots in Klammern z.B. „Neuerscheinungen für {ER- Die KIT-Bibliothek hat mit einem leichtgewichtigen
SCHEINUNGS_DATUM}” dem Slot ERSCHEINUNGS_ Ansatz einen Prototypen eines Skills entwickelt. Für
DATUM kann man dann entweder einen vordefinierten diesen war es nötig einen kostenlosen Developer-Ac-
Typ (Datum) zuweisen oder einen eigenen Typ definie- count bei Amazon anzulegen. Unterstützt wird man
ren. Beim Datum würde man den vorhandenen Typ von einer umfangreichen Dokumentation, vielen Vi-
AMAZON.DATE auswählen und Amazon erkennt auto- deos, Beispielen und kostenlosen Webinaren. Dabei
matisch das Datum und liefert es an den Entwickler muss jedoch beachtet werden, dass fast alle Medien
www.b-i-t-online.de 21 (2018) Nr. 2 online
Bibliothek. Information. Technologie.132 FACHBEITRÄGE Dierolf | Skarupianski
auf Englisch sind und vorrangig die Amazon-Dienste miersprache auf dem eigenen Server). Da die KIT-
benutzen. Die Entwicklung findet in der sog. „Alexa Bibliothek Webservices erfolgreich mit PHP einsetzt,
Skill Kit Developerkonsole” statt. Dies ist eine Samm- wurde dieser Weg gewählt.
lung von Online-Tools, die beim Erstellen eines Skills Amazon verschickt seine Anfragen in einem bestimm-
unterstützen. ten JSON-Format und erwartet auch eine entspre-
Bereits beim Einrichtn des Namens gab es das erste chende JSON-Antwort. Aus diesem Grund wurde ein
Problem, da Amazon das Wort KIT nicht als Abkür- kleines externes PHP-Framework eingesetzt, um die
zung einzelner Buchstaben (kah-iih-tee) sondern als Anfragen zu parsen und Antworten zu verschicken
ein Wort (KIT wie in Fugenkit) ansieht. Hier wurde [10]. Mit diesen Voraussetzungen können nun die
also der Skillname „KIT-Bibliothek” und der Rufname gestellten Fragen beantwortet werden. Wichtig dabei
„k. i. t. bibliothek” benutzt. ist, dass Amazon nur den Intent und die Slots an den
Als Funktionen wurde die Abfrage des Seatfinders (ei- Entwickler sendet, aber nicht den genauen Satz, den
nes Systems zur Lokalisierung von freien Arbeitsplät- der Benutzer gesagt hat. Man erhält also keine Audio-
zen in Bibliotheken), die Lokalisierung von Orten („Wo Datei sondern wirklich nur JSON-Text.
finde ich”), das Zählen aller Medien und die Abfrage Sagt der Benutzer z.B. „Alexa, frage k. i. t. Bib-
der aktuellen Veranstaltungen gewählt. liothek wo das Medienzentrum ist”, schickt der
Abbildung 4:
Mögliche Werte
für den Typ
BIB_PLACE
(inklusive
Synonyme)
Das Anlegen der Intents und die Konfiguration erfolgt Amazonserver an den eigenen Server eine An-
bequem über die Webtools. frage mit dem Inhalt {Intent: LocationInfoIntent,
Vor allem bei den Beispielsätzen muss man beachten, Slot{bibplace:medienzentrum}}. Der Inhalt wäre
auf wie viele mögliche Arten eine Frage gestellt wer- gleich, wenn der Nutzer: „Alexa, wo ist das Medien-
den kann. „Wo ist der Scanner”, „Wo sind die Scan- zentrum von k. i. t. bibliothek” gesagt hätte.
ner”, „Wo finde ich Scanner”, „Wo gibt es scanner” Auf diese Frage erstellt der Server dann eine Text-
sind nur einige Beispiele. Antwort „Das Medienzentrum ist im dritten Oberge-
Die Variablen (sog. „Slots”) bestehen immer aus ei- schoß Altbau.”. Diese Antwort landet bei Amazon,
nem Typen, dem Werte zugewiesen werden. Abbil- wird dann zum Benutzer weitergeschickt und das
dung 3 zeigt mögliche Werte für den Typ BIB_PLACE, Echo-Gerät liest dieselbe vor. Hat der Benutzer ein
der dem Slot {bibplace} zugewiesen ist. Gerät mit Display, kann man mit der Antwort auch
Sind alle Intents erstellt und mit Beispielsätzen verse- einen Text mitschicken (dieser muss nicht unbedingt
hen, muss noch angegeben werden, wo sich der Code dem gesprochenen Text entsprechen). Dabei soll die
befindet, der auf den Skill antworten soll. Antwort nach dem voice first Prinzip sein: Das wich-
Dazu kann man entweder die von Amazon betrie- tigste ist die gesprochene Antwort, der Text ist nur
bene Cloudlösung AWS Lambda benutzen (mit Java-, eine Begleitung derselben. Aus diesem Grund darf
Node.js-, C#- und Python Unterstützung) oder einen der angezeigte Text auch keine Links zu anderen Web-
eigenen Webservice betreiben (in beliebiger Program- seiten erhalten, oder gar andere Apps öffnen.
online
Bibliothek. Information. Technologie.
21 (2018) Nr. 2 www.b-i-t-online.deDierolf | Skarupianski FACHBEITRÄGE 133
Testen und Veröffentlichen eines Skills Ist die App genug getestet, kann man diese für den Re- Abbildung 5:
Während der Entwicklung der Antworten für die In- view Prozess freigeben. Dazu muss man drei Beispiel- Beispielfrage
tents stellt sich natürlich die Frage wie diese getestet sätze angeben, auf die Alexa antwortet und (im Falle nach dem Me-
dienzentrum in
werden können. eines eigenen Webservers) mehrere Sicherheitsfea- der Developer
Zum einen bietet Amazon selber in der Developer- tures wie z.B. eine Signaturprüfung implementieren. Konsole
Konsole ein Tool an, in das man entweder per an- Dafür gibt es aber bereits fertige Skripte [11].
geschlossenem Mikrofon oder Texteingabe den Skill Amazon überprüft den Skill innerhalb von fünf Werk-
testen kann. Man schreibt z.B. „alexa frage k. i. t. tagen und gibt detaillierte Rückmeldung, wenn das
bibliothek wo das medienzentrum ist” und erhält die Review nicht geklappt hat. War das Review erfolg-
Antwort gesprochen mit passender Anzeige (falls
eine mitgeschickt wird).
Hier lauert schon eine der ersten Fallen der Sprache-
ingabe: Was eingetippt wird, ist nicht immer das, was
man sagt. Hätte man im oberen Satz hinter das Wort
Alexa ein Komma gesetzt, lautet die Antwort „Das
weiß ich leider nicht”.
Um einen Test auf „richtigen” Alexa Geräten durch-
zuführen, ist es möglich, bis zu 500 Benutzer (bzw.
deren Amazon Account Email Adressen) anzugeben,
die den Skill noch während der Entwicklung auf den
eigenen Geräten testen können.
Vor allem während dieser Tests auf realen Geräten
kamen einige Unzulänglichkeiten zu Tage. Eines der
größten Probleme stellte nicht die Erkennung der In-
tents sondern das des eigentlichen Skill-Namens dar.
Während der Satz „Alexa, wo kann ich lernen von k. i.
t. Bibliothek” relativ gut verstanden wurde, gab es mit
„ Alexa, frage k. i. t. bibliothek wo ich lernen kann” in
fast 50% der Fälle Probleme. Dies führte dann beim
Testen zu so absurden (für Alexa aber syntaktisch kor-
rekten) Sätzen wie „Alexa, sag k. i. t. bibliothek wo
das medienzentrum ist”. Ähnliche Probleme mit der
Einbindung sind uns auch von der Universitätsbiblio-
thek Bamberg bekannt.
Leider erhält man hier oft keine genaue Rückmeldung
Abbildung 6:
von Amazon (Alexa antwortet nur mit einem „Das Der fertige
weiß ich leider nicht”) und man kann dann nur mut- Skill im
maßen, was genau schief gegangen ist. Alexa-Store
www.b-i-t-online.de 21 (2018) Nr. 2 online
Bibliothek. Information. Technologie.134 FACHBEITRÄGE Dierolf | Skarupianski
reich, erfolgt die sofortige Verfügbarkeit für alle Alexa zon zwar mit vielen Tools und guter Dokumentation
fähigen Geräte. unterstützt, wieso Alexa plötzlich etwas anderes ver-
steht, bleibt aber oft ihr Geheimnis. Für die Entwick-
„Wer ist Alice?“ – Erfahrungen mit der lung ist dies natürlich hinderlich, da man nie weiß,
Spracheingabe ob der Fehler bei der KI oder beim Entwickler selbst
Noch liegen wenig Erfahrungen mit der Sprachein- liegt. Dabei ist das „Internet of Voice” noch ein re-
gabe außer den selbst gewonnenen vor, da der Skill lativ neuer Trend und es fehlen entsprechende Lite-
noch nicht beworben wurde. ratur und Erfahrungen mit Sprachinterfaces. Ebenso
Wenn man mit dem Thema beginnt, hat man in der müssen wir noch unsere Sprache umständlich an die
Regel eher zu große Erwartungen. Man denkt, dass Syntax der Systeme anpassen, vielleicht wird das in
die KI im Hintergrund Fragen unabhängig davon ver- Zukunft schon anders herum sein. Wir sind schon auf
steht, wie sie formuliert werden. Dem ist bei weitem die nächste Generation der Geräte gespannt.
(noch) nicht so. Einzelne Wörter werden ohne An- Was die weitere Entwicklung des eigenen Skills be-
lernphase i.d.R. sehr gut erkannt. Nicht so gängige trifft, so werden an der KIT-Bibliothek weiterhin häu-
Begriffe und somit meistens auch alle Abkürzungen fig gestellte Fragen von Nutzern gesammelt. Fragen,
müssen wie oben beschrieben der KI beigebracht die einfach zu verstehen und hoffentlich auch einfach
werden. Ein witziges Beispiel ist der Begriff des Le- zu beantworten sind, sollen dann vom Skill verarbei-
sesaals, der in Bibliotheken oft als „LS” abgekürzt tet werden können. Die Suche nach der „Killer”-An-
wird. Obwohl dem Skill „KIT-Bibliothek” die Abkürzun- wendung für einen Skill im Bibliotheksumfeld dürfte
gen wie LSM (Medienzentrum), LST (Technik), LSW weiterhin spannend sein. ❙
(Wirtschaft) „beigebracht” wurden, funktionierte die
Erkennung beim Testen oft nicht. Ein Blick in die aus- Links & Literatur
führlichen Anfragedaten, die man intern in so einem
Fall im JSON-Format erhält, führte dann zumindest [1] The smart audio report https://bit.ly/kit_skill_1
[2] Amazon Alexa Android Apps bei Google Play
zu einer Erklärung. LS klingt schnell ausgesprochen
https://bit.ly/kit_skill_2
für einen Menschen aus dem anglo-amerikanischen
[3] iTunes – Amazon Music App https://bit.ly/kit_skill_3
Sprachraum wie der Vorname „Alice” und auf die
[4] mVoice G2: World‘s First „Watch“ with Voice
Frage wo sich „Alice” befindet hatte unser Skill keine
https://bit.ly/kit_skill_4
Antwort parat. Hier merkt man der KI von Alexa dann
[5] Alexa in the car: Which vehicles will get Alexa this
doch sehr ihre Herkunft an. year? https://bit.ly/kit_skill_5
[6] NissanConnect | Amazon Alexa
Fazit https://bit.ly/kit_skill_6
Derzeit in Klärung befindet sich die Frage an die am [7] Alexa in the Car: Ford, Amazon to Provide Access
https://bit.ly/kit_skill_7
KIT bestellte datenschutzbeauftrage Person, ob es
[8] The First Intelligent Heated Jacket
sich bei Sprachsamples um personenbezogene Daten https://bit.ly/kit_skill_8
handelt. Das würde den Einsatz einer im Bereich ei- [9] Amazon Alexa Skill Suche https://bit.ly/kit_skill_9
ner Bibliothek aufgestellten Alexa-Box definitiv verbie- [10] GitHub – Amazon Alexa PHP Library
ten. Selbst dann, wenn man – und das ist mit einem https://bit.ly/kit_skill_10
Alexa-Business-Account für wenige Euro pro Monat [11] GitHub – Validator for incoming Amazon Alexa
requests https://bit.ly/kit_skill_11
technisch möglich – eine solche Box so konfiguriert,
dass sie nur den eigenen Skill versteht.
Allerdings ist das Thema Sprachassistenz generell ein
heißes Eisen und öffentliche Einrichtungen wie Bib-
liotheken tun vermutlich gut daran, hier kein Öl ins Dipl.-Inform. Uwe Dierolf
Feuer zu gießen. Denn zu Sprachassistenz gibt es Leiter der IT-Abteilung
meist nur zwei Positionen – die einen mögen es und M. Sc. Michael Skarupianski
haben keine Probleme damit, sich in jedes Zimmer Mitarbeiter der IT-Abteilung
ein solches Gerät zu stellen und die anderen fühlen Anfragen bitte an
sich schon bei dem Gedanken unwohl, dass sie beim alexa@bibliothek.kit.edu
Karlsruhe Institut für Technologie (KIT)
Besuch von Freunden inzwischen nicht mehr wissen,
KIT-Bibliothek
wer sonst noch so mithört, unabhängig davon, ob die
Straße am Forum 2
Gastgeber das Gerät deaktiviert haben oder nicht. 76131 Karlsruhe
Bei der technischen Umsetzung wird man von Ama-
online
Bibliothek. Information. Technologie.
21 (2018) Nr. 2 www.b-i-t-online.deSie können auch lesen