"Alexa, frage KIT-Bibliothek wo ich lernen kann" - Einsatz von digitalen Sprachassistenten im Umfeld von Bibliotheken und Erweiterung um eigene ...
←
→
Transkription von Seiteninhalten
Wenn Ihr Browser die Seite nicht korrekt rendert, bitte, lesen Sie den Inhalt der Seite unten
128 FACHBEITRÄGE Dierolf | Skarupianski „Alexa, frage KIT-Bibliothek wo ich lernen kann“ Einsatz von digitalen Sprachassistenten im Umfeld von Bibliotheken und Erweiterung um eigene Dienste Uwe Dierolf und Michael Skarupianski Dierolf | Skarupianski preis sind der Grund für einen großen Ansturm auf Das Thema sprachgesteuerte persönliche Assistenten ist im wahrsten Sinne des die smarten Lautsprecher von Amazon. Genaue Zah- Wortes in aller Munde. Die KIT-Bibliothek hat daher Ende 2017 entschieden, sich len gibt es von den Herstellern nicht, allerdings hat mit diesem Thema unter technischen Gesichtspunkten exemplarisch am Beispiel Amazon alleine im dritten Quartal 2017 mindestens Amazon Alexa zu beschäftigen. Dazu wurde Anfang 2018 begonnen, den Alexa 20 Millionen Echo-Geräte verkauft. Laut einer reprä- Skill „KIT-Bibliothek“ zu entwickeln, um Erfahrungen mit den von Amazon bereit- gestellten Entwicklerwerkzeugen und dem Review-Prozess zu sammeln, der ähn- sentativen Umfrage haben 16% der US-Amerikaner lich wie bei der App-Entwicklung durchlaufen werden muss. Dieser Beitrag gibt einen smarten Lautsprecher zu Hause stehen. Dabei Einblick in die gewonnenen Erfahrungen und Probleme und verweist auf ähnliche hat Amazon einen Marktanteil von fast 70% [1]. Aus Entwicklungen an anderen Bibliotheken. diesen Gründen fiel die Wahl bei der Auswahl eines Voice assistants can be found in many households and more and more people are möglichen Assistenten für die KIT-Bibliothek auf Ama- using such devices. At the end of 2017 the KIT Library decided to engage in this top- zons Alexa. ic by developing an Alexa Skill called „KIT-Bibliothek”. The reasons for doing this step Wie bereits erwähnt ist Alexa der reine Software- were primarily cause of gaining experience and was a technique-driven approach. Assistent. Um diesen zu benutzen wird eine Hard- The process of developing a skill is similar to the development of a smartphone app warekomponente benötigt. Die erste verfügbare and includes a review process to publish the skill. This reading delivers an insight in- Hardware war der von Amazon selbst vertriebene to the experiences we made but shows also the challenges and gives a short over- Lautsprecher „Amazon Echo”. Die günstigste Variante view of developments made by other libraries. nennt sich „Echo Dot”, ist kaum größer als ein Eisho- ckey Puck und besteht aus einem Lautsprecher, vier Tasten sowie 7 Fernfeld-Mikrofonen (diese sorgen da- für, dass man auch trotz Nebengeräuschen oder aus Sprachassistenz – mehr als nur ein Hype? dem nächsten Zimmer verstanden wird). Das obere ❱ Ob Apples Siri, der Google Assistant oder Ama- Ende der Produktpalette der Smarten Lautsprecher zons Alexa – fast wie eine Flut kommen jeden Monat bildet der „Echo Show” mit eingebautem Bildschirm. neue Geräte mit eingebauten Sprachassistenten auf Dazwischen gibt es noch den klassischen „Echo” dem Markt und buhlen um die Gunst der Kunden. (etwa dreimal so groß wie der „Echo Dot” und mit Unbestrittener Vorreiter war dabei Apples Siri auf besserem Lautsprecher, den „Echo Plus” mit einge- dem iPhone, jedoch unterscheidet man mittlerweile bautem Smart-Home Hub und den „Echo Spot”, einen den reinen Software-Assistenten (z.B. Siri) und das Radiowecker großen Lautsprecher mit kleinem Bild- Hardware-Gerät, auf dem dieser ausgeführt wird (z.B. schirm. Der Normalpreis für den Echo Dot liegt bei 60 iPhone). €, allerdings lockt Amazon alle paar Wochen mit Son- Die Software-Hersteller gehen dabei unterschiedliche derangeboten und bietet diesen schon ab 35 € an, Wege. Während Apple seine Assistentin exklusiv auf beim Oberklasse-Modell „Echo Show” mit Bildschirm die eigene Produktlinie beschränkt (iPhone, Apple TV, liegt der Normalpreis bei 220 €. Homepod, etc.), vermarktet Google den Assistenten Neben den Geräten bietet Amazon seinen Assistenten auf eigenen Lautsprechern, als App auf Android und auch in den Apps für Android (Alexa-App und Amazon iOS Geräten, sowie in Lizenz an diverse Hardware Music) sowie in der Fernbedienung zur hauseigenen Hersteller. Auch Amazon geht diesen Schritt und baut Set-Top-Box FireTV an. nicht nur selber Hardware mit dem hauseigenen As- Grundsätzlich haben alle Geräte eines gemeinsam: sistenten „Alexa”, sondern ermöglicht auch Fremd- Sie bestehen aus einem oder mehreren Mikrofonen herstellern diesen in (fast) beliebige Hardware einzu- um die Frage des Benutzers aufzunehmen und einem binden. Die Tatsache, dass Amazon der erste Herstel- Lautsprecher um die Antwort auszugeben. Zum Be- ler mit einem reinen smarten Lautsprecher war, die trieb benötigen Sie zudem eine Internetverbindung. aggressive Vermarktung und ein niedriger Einstiegs- Auf dieser Basis erlaubt es Amazon Fremdfirmen, online Bibliothek. Information. Technologie. 21 (2018) Nr. 2 www.b-i-t-online.de
Dierolf | Skarupianski FACHBEITRÄGE 129 eigene Geräte zu entwickeln oder die Technik in be- kann sowohl per Hardware als auch per Software er- reits vorhandene Hardware zu integrieren. Da Ama- weitert werden. Dritthersteller können Ihre Produkte zon seine Geräte zuerst in den USA veröffentlicht, ist so erweitern, dass diese mittels Alexa gesteuert hier bereits ein großer Markt für Hardware mit Alexa- werden. Es gibt bereits jetzt schon steuerbare Glüh- Integration entstanden. So gibt es z.B. Kopfhörer mit birnen, Thermostate, Steckdosen, Saugroboter und eingebauter Alexa oder kleine Sticks, die man im Auto Fernseher. Sie müssen nur „Alexa, schalte das Licht in den Zigarettenanzünder steckt und die so das nor- in der Küche ein” sagen und der Computer erledigt male Auto in ein Smart Car verwandeln sollen. Für den Rest. Oft sind die Preise natürlich höher als bei Mitte des Jahres ist sogar die erste Smartwatch an- gleichen nicht-smarten Geräten, aber durch die hö- gekündigt, die den Sprachassistenten eingebaut hat here Marktverbreitung sind auch diese gefallen und [4]. Auch die Autohersteller selber integrieren Alexa so gibt es z.B. per Alexa steuerbare Glühbirnen schon in ihre Infotainment-Systeme. Ford und Seat bieten für unter 10 €. entsprechend ausgestattete Autos bereits seit 2017 Auf die Spitze treiben es Nissan und Ford, bei denen auf dem US-Markt an. BMW und Toyota haben ange- mittels Alexa der Benzinstand abgefragt, das Licht im kündigt, dieses Jahr nachzuziehen [5]. Auto ein und ausgeschaltet, oder der Motor gestartet Die Frage die sich nun unweigerlich stellt, ist: „Was und gestoppt werden kann (wohlgemerkt auch aus kann ich damit tun?”. der Ferne, nicht nur, wenn man selbst im Auto sitzt) Um den Lautsprecher zu aktivieren sagt man zuerst [6][7]. Und wenn man glaubt, das ganze kann nicht immer den Namen des Assistenten und stellt da- überboten werden: Auf Kickstarter gibt es eine Kam- nach die gewünschte Frage. Für Faktenfragen sagt pagne für eine beheizbare Jacke, die mittels Alexa an- man z.B. „Alexa, was ist die Hauptstadt von Tuvalu?”. und ausgeschaltet werden kann [8]. Der Lautsprecher antwortet mit: „Die Hauptstadt von Tuvalu ist Funafuti.” Dabei wurde nach dem Ak- tivierungswort „Alexa” automatisch die Aufnahme gestartet. Nach dem Ende des Satzes wurde diese Audioaufnahme in die Amazon Cloud geladen, dort analysiert und im Anschluss die Antwort (als Text) zurückgeschickt. Der lokale Lautsprecher hat diese Antwort dann vorgelesen. Wenn Sie dieses Beispiel selbst testen möchten, ge- nügt ein Amazon Account und ein Smartphone. Ins- tallieren Sie unter Android die Amazon Alexa-App [2] oder unter iOS die App „Amazon Music” [3]. Abbildung 1: Echo-Familie (Echo Dot, Echo, Echo Plus) Eine der am häufigsten genutzten Funktionen ist na- im Größenvergleich zu einer Computermaus. türlich auch das Abspielen von Musik [1]. Amazon macht hier natürlich Werbung für den hauseigenen Neben Hardware kann das System auch mit Program- Dienst „Amazon Music”, mit einem Echo-Lautspre- men (den sogenannten Skills) erweitert werden. cher können Sie aber auch kostenlos über das Ra- Diese Skills können mittels Sprache oder über die dionetzwerk TuneIn auf Streams von Radiostationen Alexa-App aktiviert werden. Möchte man den Skill zugreifen. Sagen Sie dazu einfach „Alexa, spiele Surf „Fernsehprogramm” installieren, genügt ein „Alexa, Radio” und Alexa spielt den entsprechenden Stream aktiviere den Skill Fernsehprogramm”. Im Anschluss ab. ist dieser sofort verfügbar und man kann ihm Fra- Alexa kann natürlich eine schier unendliche Menge gen stellen wie „Alexa, frage Fernsehprogramm, was von Fragen beantworten und Aktionen ausführen. Sei heute Abend läuft”. Im Moment sind laut Amazon es das Wetter („Alexa, wie wird das Wetter heute?”), über 30000 solcher Skills verfügbar, egal ob man die Nachrichten („Alexa, was sind die Nachrichten?”), seine Gitarre stimmen möchte („Alexa, aktiviere Gi- ein Timer („Alexa, stelle Teetimer auf 5 Minuten”) tarrenstimmer”) oder über die neuesten Weinfeste oder die Einkaufsliste („Alexa, setze Nudeln auf meine informiert sein will („Alexa, aktiviere Weinfestka- Einkaufsliste”) – auf alles hat Alexa bereits die Ant- lender”). In der Amazon-Suche [9] erhält man einen wort eingebaut. Dabei wird das System seitens Ama- Überblick über verfügbare Skills. Da die Skills nicht zon ständig erweitert – der neueste Clou sind (Video)- tatsächlich auf dem Gerät installiert werden, sondern gespräche zwischen Alexa-fähigen Geräten. lediglich in der Cloud aktiviert sind, ist die Anzahl der Und wenn dies alles nicht reicht – Amazons System aktiven Skills theoretisch nicht limitiert. Ebenso ist www.b-i-t-online.de 21 (2018) Nr. 2 online Bibliothek. Information. Technologie.
130 FACHBEITRÄGE Dierolf | Skarupianski ein aktivierter Skill auf allen Alexa-Geräten desselben Neuigkeiten zur UB umfasst. Accounts verfügbar. In Österreich hat sich die FH Burgenland mit dem Thema „Alexa Skill” beschäftigt und bietet den Skill Warum beschäftigt sich eine Bibliothek mit „Bücherregal” an – allerdings auch nur im Dev-Mo- dem Thema Sprachassistenten? dus und somit nicht sichtbar für alle Nutzer. Das Thema wurde in erster Linie unter technischen Wie im Fall der UB Bamberg wird hier nach dem Star- Gesichtspunkten an der KIT-Bibliothek Ende 2017 in ten des Skills nicht nur erklärt, was der Skill kann, Angriff genommen. Aber natürlich sollen auch mög- sondern es wird dem Benutzer die Frage gestellt, für liche Einsatzszenarien evaluiert werden. Dazu im Fol- welches Thema er sich interessiert. Das ist insofern genden ein paar Beispiele. sehr praktisch, da man nur den Namen des Themas Die KIT-Bibliothek ist seit April 2006 eine 24/7-Biblio- nennen muss, um eine Antwort zu erhalten. Der Nut- thek. Täglich besuchen knapp 3000 Personen die KIT- zer kann den Skill also auch nutzen, ohne die Art und Bibliothek. Bei so vielen Menschen wird natürlich die Weise zu kennen, wie man mit dem Skill sprechen Auskunft rege genutzt, um auf allerlei Fragen Antwor- muss, um verstanden zu werden. Dieses Thema „was ten zu erhalten. Die Auskunft ist werktags bis 19 Uhr muss ich tun, damit mich Alexa versteht?” wird im und am Samstag bis 12.30 Uhr besetzt. Zu allen an- kommenden Kapitel genauer betrachtet. deren Zeiten ist lediglich Wachpersonal der Campus- sicherheit anwesend. Dieses auch häufig wechselnde Wie funktioniert Spracheingabe bei Alexa? Personal kann nicht in allen Fällen adäquat Auskunft Jeder Skill besitzt neben dem eigentlichen Namen auf Fragen geben. noch einen Aufrufnamen („invocation name”). Der Daher ist ein naheliegendes Szenario für den Einsatz Aufrufname muss aus zwei Wörtern bestehen (Aus- von Sprachassistenten die Beantwortung von Fak- nahmen sind nur für Markennamen und zusammen- tenfragen. Der Einsatz einer Alexa-Box scheidet aus gesetzte Namen erlaubt) und wird benutzt um den Datenschutzgründen natürlich aus (aber dazu später Skill zu aktivieren oder zu starten. Ein Skill kann z.B. mehr). Alexa kann jedoch auch direkt vom Smartphone den Namen „Virtuelle Buchsuche mit Buchguru” ha- aus genutzt werden, um Fragen nach Räumlichkeiten ben, wird aber mit „buch guru” aufgerufen. „wo befindet sich das Medienzentrum”, „wo finde ich Die Funktionen, die ein Skill zur Verfügung stellt wer- Bücher zum Thema …” zu beantworten. Weitere ggfs. den „Intents” (Absichten) genannt. Für jede Funk- für manche Nutzer relevante Fakten sind Öffnungszei- tion, die ein Skill zur Verfügung stellen soll, muss ein ten oder die Nennung von Telefonnummern, Räume Intent definiert werden (z.B. ein Intent für die Suche, von Fachreferenten oder Direktion etc. einer für die Auskunft, etc.). Schließlich müssen zu Auch die sprachgesteuerte Nutzung dynamischer jedem Intent passende Beispieläußerungen (im Alexa- Services wie dem Seatfinder zur Ermittlung freier Ar- Jargon heißen die Äußerungen „Utterances”) ange- beitsplätze ist sicherlich eine nützliche Angelegenheit geben werden. für manche Menschen. Auf die Frage „wo kann ich Der Buchguru hat z.B. einen Intent Buchsuche. Nun lernen” kann der Skill die maschinenlesbaren Schnitt- gibt man einen Beispielsatz an, was der Benutzer sa- stellen des Seatfinders verwenden, um Auskunft über gen würde, wenn er diesen Intent ausführen will. Soll freie Lernräume zu geben. Dies wurde bereits für den der Skill z.B. auf „Alexa frage buch guru nach Neu- Skill „KIT-Bibliothek” implementiert. erscheinungen” reagieren, würde der Beispielsatz Als ein mögliches Szenario, bei dem Alexa sogar sinn- „nach Neuerscheinungen” lauten. voll zu Hause via Alexa-Box genutzt werden könnte, Damit Alexa weiß, welcher Intent gemeint ist, sollte wäre die Beantwortung von Fragen nach der Rück- man möglichst viele Variationen angeben. Immer- gabe von Büchern mit ggfs. durchzuführender Einzel- hin kann der Skill nicht nur mit dem Schlüsselwort oder Pauschalverlängerung. Bis zur Klärung der Frage „frage”, sondern auch mit „sage”, „lade”, ”starte”, nach dem Datenschutz ist die Kontoverknüpfung bis- „öffne” und noch weiteren Möglichkeiten eingebun- her allerdings nur angedacht, jedoch noch nicht im- den werden. So wären für die Neuerscheinungen auch plementiert worden. folgende Beispiele möglich: „Alexa, starte buch guru Die UB Bamberg hat für ihren Skill „Unibib” diese und suche nach Neuerscheinungen”, „Alexa rufe bei Verbindung von Amazon-Konto und Bibliothekskonto buch guru die Neuerscheinungen ab” sowie „Alexa, sogar schon implementiert. Allerdings ist dieser Skill was sind die Neuerscheinungen von buch guru”. noch nicht für die Öffentlichkeit sichtbar, da auch hier Dazu würde man passende Utterances erstellen: „su- noch nicht sicher ist, was rechtlich erlaubt ist. Sie bie- che nach Neuerscheinungen” bzw. nur „Neuerschei- ten auch den umfangreichsten Skill an, der auch die nungen”. online Bibliothek. Information. Technologie. 21 (2018) Nr. 2 www.b-i-t-online.de
Dierolf | Skarupianski FACHBEITRÄGE 131 Abbildung 2: Alexa Developer Konsole mit bereits erstellten Intents (Absichten) Abbildung 3: Mögliche Bei- spielsätze für die Lokalisierung eines Gerätes oder Ortes innerhalb der Bibliothek Je komplizierter der Intent ist, desto komplizierter kön- zurück. Wenn kein vorgegebener Typ (Nummer, Daten, nen auch die Beispielsätze werden. Möchte man den Regionen, Vornamen, etc..) passt, kann man auch ei- Neuerscheinungen-Intent um eine Datumsfunktion er- gene definieren (z.B. für Buchgenres). Dabei sind die weitern, muss man nicht alle Möglichkeiten eintippen Slots nur als mögliche Beispiele zu sehen, d.h. sie soll- (z.B. Neuerscheinungen diese Woche, Neuerscheinun- ten z.B. zwar möglichst viele Buchgenres angeben, es gen nächste Woche, Neuerscheinungen gestern), son- müssen aber nicht alle angegeben werden. dern kann hier Variablen einsetzen (diese werden bei Alexa „Slots” genannt). So genügt die Angabe eines Ein leichtgewichtiger Ansatz Slots in Klammern z.B. „Neuerscheinungen für {ER- Die KIT-Bibliothek hat mit einem leichtgewichtigen SCHEINUNGS_DATUM}” dem Slot ERSCHEINUNGS_ Ansatz einen Prototypen eines Skills entwickelt. Für DATUM kann man dann entweder einen vordefinierten diesen war es nötig einen kostenlosen Developer-Ac- Typ (Datum) zuweisen oder einen eigenen Typ definie- count bei Amazon anzulegen. Unterstützt wird man ren. Beim Datum würde man den vorhandenen Typ von einer umfangreichen Dokumentation, vielen Vi- AMAZON.DATE auswählen und Amazon erkennt auto- deos, Beispielen und kostenlosen Webinaren. Dabei matisch das Datum und liefert es an den Entwickler muss jedoch beachtet werden, dass fast alle Medien www.b-i-t-online.de 21 (2018) Nr. 2 online Bibliothek. Information. Technologie.
132 FACHBEITRÄGE Dierolf | Skarupianski auf Englisch sind und vorrangig die Amazon-Dienste miersprache auf dem eigenen Server). Da die KIT- benutzen. Die Entwicklung findet in der sog. „Alexa Bibliothek Webservices erfolgreich mit PHP einsetzt, Skill Kit Developerkonsole” statt. Dies ist eine Samm- wurde dieser Weg gewählt. lung von Online-Tools, die beim Erstellen eines Skills Amazon verschickt seine Anfragen in einem bestimm- unterstützen. ten JSON-Format und erwartet auch eine entspre- Bereits beim Einrichtn des Namens gab es das erste chende JSON-Antwort. Aus diesem Grund wurde ein Problem, da Amazon das Wort KIT nicht als Abkür- kleines externes PHP-Framework eingesetzt, um die zung einzelner Buchstaben (kah-iih-tee) sondern als Anfragen zu parsen und Antworten zu verschicken ein Wort (KIT wie in Fugenkit) ansieht. Hier wurde [10]. Mit diesen Voraussetzungen können nun die also der Skillname „KIT-Bibliothek” und der Rufname gestellten Fragen beantwortet werden. Wichtig dabei „k. i. t. bibliothek” benutzt. ist, dass Amazon nur den Intent und die Slots an den Als Funktionen wurde die Abfrage des Seatfinders (ei- Entwickler sendet, aber nicht den genauen Satz, den nes Systems zur Lokalisierung von freien Arbeitsplät- der Benutzer gesagt hat. Man erhält also keine Audio- zen in Bibliotheken), die Lokalisierung von Orten („Wo Datei sondern wirklich nur JSON-Text. finde ich”), das Zählen aller Medien und die Abfrage Sagt der Benutzer z.B. „Alexa, frage k. i. t. Bib- der aktuellen Veranstaltungen gewählt. liothek wo das Medienzentrum ist”, schickt der Abbildung 4: Mögliche Werte für den Typ BIB_PLACE (inklusive Synonyme) Das Anlegen der Intents und die Konfiguration erfolgt Amazonserver an den eigenen Server eine An- bequem über die Webtools. frage mit dem Inhalt {Intent: LocationInfoIntent, Vor allem bei den Beispielsätzen muss man beachten, Slot{bibplace:medienzentrum}}. Der Inhalt wäre auf wie viele mögliche Arten eine Frage gestellt wer- gleich, wenn der Nutzer: „Alexa, wo ist das Medien- den kann. „Wo ist der Scanner”, „Wo sind die Scan- zentrum von k. i. t. bibliothek” gesagt hätte. ner”, „Wo finde ich Scanner”, „Wo gibt es scanner” Auf diese Frage erstellt der Server dann eine Text- sind nur einige Beispiele. Antwort „Das Medienzentrum ist im dritten Oberge- Die Variablen (sog. „Slots”) bestehen immer aus ei- schoß Altbau.”. Diese Antwort landet bei Amazon, nem Typen, dem Werte zugewiesen werden. Abbil- wird dann zum Benutzer weitergeschickt und das dung 3 zeigt mögliche Werte für den Typ BIB_PLACE, Echo-Gerät liest dieselbe vor. Hat der Benutzer ein der dem Slot {bibplace} zugewiesen ist. Gerät mit Display, kann man mit der Antwort auch Sind alle Intents erstellt und mit Beispielsätzen verse- einen Text mitschicken (dieser muss nicht unbedingt hen, muss noch angegeben werden, wo sich der Code dem gesprochenen Text entsprechen). Dabei soll die befindet, der auf den Skill antworten soll. Antwort nach dem voice first Prinzip sein: Das wich- Dazu kann man entweder die von Amazon betrie- tigste ist die gesprochene Antwort, der Text ist nur bene Cloudlösung AWS Lambda benutzen (mit Java-, eine Begleitung derselben. Aus diesem Grund darf Node.js-, C#- und Python Unterstützung) oder einen der angezeigte Text auch keine Links zu anderen Web- eigenen Webservice betreiben (in beliebiger Program- seiten erhalten, oder gar andere Apps öffnen. online Bibliothek. Information. Technologie. 21 (2018) Nr. 2 www.b-i-t-online.de
Dierolf | Skarupianski FACHBEITRÄGE 133 Testen und Veröffentlichen eines Skills Ist die App genug getestet, kann man diese für den Re- Abbildung 5: Während der Entwicklung der Antworten für die In- view Prozess freigeben. Dazu muss man drei Beispiel- Beispielfrage tents stellt sich natürlich die Frage wie diese getestet sätze angeben, auf die Alexa antwortet und (im Falle nach dem Me- dienzentrum in werden können. eines eigenen Webservers) mehrere Sicherheitsfea- der Developer Zum einen bietet Amazon selber in der Developer- tures wie z.B. eine Signaturprüfung implementieren. Konsole Konsole ein Tool an, in das man entweder per an- Dafür gibt es aber bereits fertige Skripte [11]. geschlossenem Mikrofon oder Texteingabe den Skill Amazon überprüft den Skill innerhalb von fünf Werk- testen kann. Man schreibt z.B. „alexa frage k. i. t. tagen und gibt detaillierte Rückmeldung, wenn das bibliothek wo das medienzentrum ist” und erhält die Review nicht geklappt hat. War das Review erfolg- Antwort gesprochen mit passender Anzeige (falls eine mitgeschickt wird). Hier lauert schon eine der ersten Fallen der Sprache- ingabe: Was eingetippt wird, ist nicht immer das, was man sagt. Hätte man im oberen Satz hinter das Wort Alexa ein Komma gesetzt, lautet die Antwort „Das weiß ich leider nicht”. Um einen Test auf „richtigen” Alexa Geräten durch- zuführen, ist es möglich, bis zu 500 Benutzer (bzw. deren Amazon Account Email Adressen) anzugeben, die den Skill noch während der Entwicklung auf den eigenen Geräten testen können. Vor allem während dieser Tests auf realen Geräten kamen einige Unzulänglichkeiten zu Tage. Eines der größten Probleme stellte nicht die Erkennung der In- tents sondern das des eigentlichen Skill-Namens dar. Während der Satz „Alexa, wo kann ich lernen von k. i. t. Bibliothek” relativ gut verstanden wurde, gab es mit „ Alexa, frage k. i. t. bibliothek wo ich lernen kann” in fast 50% der Fälle Probleme. Dies führte dann beim Testen zu so absurden (für Alexa aber syntaktisch kor- rekten) Sätzen wie „Alexa, sag k. i. t. bibliothek wo das medienzentrum ist”. Ähnliche Probleme mit der Einbindung sind uns auch von der Universitätsbiblio- thek Bamberg bekannt. Leider erhält man hier oft keine genaue Rückmeldung Abbildung 6: von Amazon (Alexa antwortet nur mit einem „Das Der fertige weiß ich leider nicht”) und man kann dann nur mut- Skill im maßen, was genau schief gegangen ist. Alexa-Store www.b-i-t-online.de 21 (2018) Nr. 2 online Bibliothek. Information. Technologie.
134 FACHBEITRÄGE Dierolf | Skarupianski reich, erfolgt die sofortige Verfügbarkeit für alle Alexa zon zwar mit vielen Tools und guter Dokumentation fähigen Geräte. unterstützt, wieso Alexa plötzlich etwas anderes ver- steht, bleibt aber oft ihr Geheimnis. Für die Entwick- „Wer ist Alice?“ – Erfahrungen mit der lung ist dies natürlich hinderlich, da man nie weiß, Spracheingabe ob der Fehler bei der KI oder beim Entwickler selbst Noch liegen wenig Erfahrungen mit der Sprachein- liegt. Dabei ist das „Internet of Voice” noch ein re- gabe außer den selbst gewonnenen vor, da der Skill lativ neuer Trend und es fehlen entsprechende Lite- noch nicht beworben wurde. ratur und Erfahrungen mit Sprachinterfaces. Ebenso Wenn man mit dem Thema beginnt, hat man in der müssen wir noch unsere Sprache umständlich an die Regel eher zu große Erwartungen. Man denkt, dass Syntax der Systeme anpassen, vielleicht wird das in die KI im Hintergrund Fragen unabhängig davon ver- Zukunft schon anders herum sein. Wir sind schon auf steht, wie sie formuliert werden. Dem ist bei weitem die nächste Generation der Geräte gespannt. (noch) nicht so. Einzelne Wörter werden ohne An- Was die weitere Entwicklung des eigenen Skills be- lernphase i.d.R. sehr gut erkannt. Nicht so gängige trifft, so werden an der KIT-Bibliothek weiterhin häu- Begriffe und somit meistens auch alle Abkürzungen fig gestellte Fragen von Nutzern gesammelt. Fragen, müssen wie oben beschrieben der KI beigebracht die einfach zu verstehen und hoffentlich auch einfach werden. Ein witziges Beispiel ist der Begriff des Le- zu beantworten sind, sollen dann vom Skill verarbei- sesaals, der in Bibliotheken oft als „LS” abgekürzt tet werden können. Die Suche nach der „Killer”-An- wird. Obwohl dem Skill „KIT-Bibliothek” die Abkürzun- wendung für einen Skill im Bibliotheksumfeld dürfte gen wie LSM (Medienzentrum), LST (Technik), LSW weiterhin spannend sein. ❙ (Wirtschaft) „beigebracht” wurden, funktionierte die Erkennung beim Testen oft nicht. Ein Blick in die aus- Links & Literatur führlichen Anfragedaten, die man intern in so einem Fall im JSON-Format erhält, führte dann zumindest [1] The smart audio report https://bit.ly/kit_skill_1 [2] Amazon Alexa Android Apps bei Google Play zu einer Erklärung. LS klingt schnell ausgesprochen https://bit.ly/kit_skill_2 für einen Menschen aus dem anglo-amerikanischen [3] iTunes – Amazon Music App https://bit.ly/kit_skill_3 Sprachraum wie der Vorname „Alice” und auf die [4] mVoice G2: World‘s First „Watch“ with Voice Frage wo sich „Alice” befindet hatte unser Skill keine https://bit.ly/kit_skill_4 Antwort parat. Hier merkt man der KI von Alexa dann [5] Alexa in the car: Which vehicles will get Alexa this doch sehr ihre Herkunft an. year? https://bit.ly/kit_skill_5 [6] NissanConnect | Amazon Alexa Fazit https://bit.ly/kit_skill_6 Derzeit in Klärung befindet sich die Frage an die am [7] Alexa in the Car: Ford, Amazon to Provide Access https://bit.ly/kit_skill_7 KIT bestellte datenschutzbeauftrage Person, ob es [8] The First Intelligent Heated Jacket sich bei Sprachsamples um personenbezogene Daten https://bit.ly/kit_skill_8 handelt. Das würde den Einsatz einer im Bereich ei- [9] Amazon Alexa Skill Suche https://bit.ly/kit_skill_9 ner Bibliothek aufgestellten Alexa-Box definitiv verbie- [10] GitHub – Amazon Alexa PHP Library ten. Selbst dann, wenn man – und das ist mit einem https://bit.ly/kit_skill_10 Alexa-Business-Account für wenige Euro pro Monat [11] GitHub – Validator for incoming Amazon Alexa requests https://bit.ly/kit_skill_11 technisch möglich – eine solche Box so konfiguriert, dass sie nur den eigenen Skill versteht. Allerdings ist das Thema Sprachassistenz generell ein heißes Eisen und öffentliche Einrichtungen wie Bib- liotheken tun vermutlich gut daran, hier kein Öl ins Dipl.-Inform. Uwe Dierolf Feuer zu gießen. Denn zu Sprachassistenz gibt es Leiter der IT-Abteilung meist nur zwei Positionen – die einen mögen es und M. Sc. Michael Skarupianski haben keine Probleme damit, sich in jedes Zimmer Mitarbeiter der IT-Abteilung ein solches Gerät zu stellen und die anderen fühlen Anfragen bitte an sich schon bei dem Gedanken unwohl, dass sie beim alexa@bibliothek.kit.edu Karlsruhe Institut für Technologie (KIT) Besuch von Freunden inzwischen nicht mehr wissen, KIT-Bibliothek wer sonst noch so mithört, unabhängig davon, ob die Straße am Forum 2 Gastgeber das Gerät deaktiviert haben oder nicht. 76131 Karlsruhe Bei der technischen Umsetzung wird man von Ama- online Bibliothek. Information. Technologie. 21 (2018) Nr. 2 www.b-i-t-online.de
Sie können auch lesen