Informationsintegration in mehrsprachigen Textchats am Beispiel des Skype Translators im Sprachenpaar Katalanisch-Deutsch
←
→
Transkription von Seiteninhalten
Wenn Ihr Browser die Seite nicht korrekt rendert, bitte, lesen Sie den Inhalt der Seite unten
I NSTITUT FÜR A NGEWANDTE L INGUISTIK UND T RANSLATOLOGIE U NIVERSITÄT L EIPZIG Informationsintegration in mehrsprachigen Textchats am Beispiel des Skype Translators im Sprachenpaar Katalanisch-Deutsch Thesenpapier zur Dissertation von Felix Hoberg felix.hoberg@uni-leipzig.de Stand: 23. Februar 2021 1 Abstract Die vorliegende Arbeit widmet sich die Informationsintegration in maschinell übersetzten, mehr- sprachigen Textchats am Beispiel des Skype Translators im Sprachenpaar Katalanisch-Deutsch. Der Untersuchung von Textchats dieser Konfiguration wurde sich bislang nur wenig zugewendet. Deshalb wird zunächst der grundlegend explorativ ausgerichteten Forschungsfrage nachgegangen, wie Perso- nen eine maschinell übersetzte Textchat-Kommunikation wahrnehmen, wenn sie nicht der Sprache des Gegenübers mächtig sind. Damit einher geht auch die Untersuchung der Informationsextraktion und -verarbeitung zwischen Nachrichten, die in der eigenen Sprache verfasst wurden, und der Ausgabe der Maschinellen Übersetzung. Zur Erfassung des Nutzungsverhalten im Umgang mit Skype und dem Skype Translator wurde mit einer deutschlandweit an Studierende gesendeten Online-Umfrage gearbeitet. In einer zweiteiligen, naturalistisch orientierten Pilotstudie unter Einsatz des Eye-Trackers wurde das Kommunikationsver- halten von Studierenden mit deutscher Muttersprache einerseits in maschinell vom Skype Translator übersetzten Chats mit katalanischen Muttersprachler·innen und andererseits, als Referenz, in mono- lingualen, rein deutschsprachigen Chats ohne Skype Translator untersucht. Bei den Teilnehmer·innen an diesen Studien handelt es sich um zwei unabhängige Gruppen. Beide wurden ebenfalls mit Fragebögen zum Nutzungsverhalten und zu den Eindrücken des Skype Translators erfasst. Das sicher überraschendste Ergebnis der Studie ist, dass die Versuchspersonen einen substanziellen Teil der Chatkommunikation auf der MÜ-Ausgabe in beiden beteiligten Sprachen verbringen. Die Untersuchung der Sakkaden und Regressionen deutet auf einen sprunghaften Wechsel zwischen Originalnachricht und MÜ hin. Der Schwerpunkt der Aufmerksamkeit liegt dabei konsequent auf den neusten Nachrichten. Es ist daher anzunehmen, dass die Versuchspersonen die MÜ-Ausgabe aktiv in die Kommunikation miteinbeziehen und wesentliche Informationen zwischen Original und MÜ abzugleichen versuchen. 1
2 Hintergrund Seit ungefähr 2010 lassen sich innerhalb des ohnehin exponentiell wachsenden Forschungsgebietes der digitalen Datenverarbeitung noch stärker herausragende Innovationen und Leistungszugewin- ne beobachten. Dank mobiler Endgeräte sind Milliarden Menschen mit dem Internet verbunden und können hierüber Informationen zu nahezu jedem Lebensbereich abrufen und beitragen. Nicht erst innerhalb des o. g. genannten Zeitraums hat sich das Feld der Mensch-Maschine-Interaktion ausgeweitet. Eine Unterform davon ist die sog. Usability, sprich: die Nutzerfreundlichkeit, bei der ebenfalls die Interaktion von Mensch und Maschine in Hinblick auf den erfolgreichen Austausch von Informationen hin untersucht wird. Bereits in den 1990er Jahren wurde mit dem Projekt Verbmobil (vgl. Wahlster, 2000) der Versuch gestartet, maschinelle Übersetzung im Rahmen der computervermittelten Kommunikation nutzbar zu machen. Die Kommunikationssoftware Skype ist ebenfalls schon seit 2003 auf dem Markt. Weltweit bekannt ist das Programm vor allem für die Möglichkeit, Echtzeit-Videochats zu führen. Auch wenn es eine explizit beworbene Business-Version mit entsprechenden Sonderfunktionen gibt, wird Skype hauptsächlich von Privatanwender·innen genutzt. Mit der Einführung des Skype Translators 2015 hat Skype den Versuch gestartet, die Kommunikation über Sprachgrenzen hinweg vollautomatisch und in Echtzeit zu ermöglichen. Aktuell werden mehr als 60 Sprachen im Textchat sowie 11 Sprachen für die Übersetzung von gesprochener Sprache in Voice- und Videochats angeboten. Skype steht heutzutage jedoch in starker Konkurrenz zu einer Vielzahl an weltweit agierenden Diensten, die ihren Nutzer·innen eine maschi- nelle Übersetzungsausgabe zur Verfügung stellen (z. B. Facebook, Instagram). Zugleich jedoch ist Skype nach bestem Wissensstand die derzeit einzige Chatanwendung, die maschinelle Übersetzung für die Echtzeitkommunikation anbietet. Die Funktion befindet sich allerdings im stetigen Wandel. Bereits die Version, die dieser Arbeit zugrunde liegt, ist eine andere, als die aktuell für die Endnutzer·innen verfügbare. Zu Beginn der Ausarbeitung war sie nur für Windows 7 und 10 verfügbar und auch dort nur in der jeweils aktuellsten Version der Software. Gegenwärtig jedoch ist der Skype Translator bei Skype auf Windows, Linux und MacOS sowie in der Smartphone-App enthalten. Skype for Business unterstützt den Skype Translator bislang hingegen nicht. Mit Blick auf das gesamte Leistungsportfolio von Skype lassen sich gerade in jüngster Zeit Dienst- leister·innen beobachten, die die Videofunktion zur Fernberatung ihrer Kund·innen einsetzen (s. z. B. Leipziger Wohnungsbaugesellschaft (LWB)). Gegenwärtig ist Skype neben dem ebenfalls aus den USA stammenden Konkurrenten Zoom auch medial präsent. Im Zuge der durch die weltweite Corona- Pandemie bestehenden Kontakt- und Reisebeschränkungen und dem entsprechend sich verändernden Kommunikationsverhalten kommt es vor, dass ein offizielles Interview im Fernsehen per Videochat durchgeführt wird. Skype ist dabei eine häufig genutzte Anwendung. 3 Methodik Die Arbeit umfasst zwei Erhebungsteile: Als Hinführung und Orientierung wurde zunächst in einer deutschlandweit an Studierende versendeten Online-Umfrage das generelle Nutzungsverhalten von Skype sowie Kenntnisse im Umgang mit dem Skype Translator abgefragt. Dann folgte eine Eye-Tracking-basierte Pilotstudie am Skype Translator, die das zentrale Element dieser Arbeit darstellt. Diese Pilotstudie bestand ebenfalls aus zwei Teilen. Ein Teil sah die Textchat- 2
Kommunikation von deutschen Muttersprachler·innen mit anderen deutschen Muttersprachler·innen über Skype unter Einsatz des Eye-Trackers, aber ohne Verwendung des Skype Translators, vor. Mit die- ser Studienvariante sollten okulometrische und linguistische, einsprachige Daten gesammelt werden, die der zweiten Studienvariante als Referenzmaterial dienen. In diesem Studienteil kommunizierten deutsche Muttersprachler·innen unter Einsatz des Eye-Trackers über Skype und mit aktiviertem Skype Translator mit katalanischen Muttersprachler·innen in ihrer jeweiligen Muttersprache. Im Rahmen der Analyse wurden folgende Indikatoren untersucht: Fixationsanzahl, Dauer der ersten Fixation, Regressionen, Dauer des ersten Durchlaufs durch ein AOI, Gesamtverweildauer in einem AOI, Pupillengröße, Sakkadenanzahl, -richtung, -amplitude sowie -dauer. Die Bildschirmmitschnitte wurden mit Areas of Interest (AOI) entsprechend der präsentierten Chatnachrichten (jeweils deutsches und katalanisches Original und MÜ) annotiert. Die Annotation erfolgte dabei mit dynamischen AOI, die sich mit der Position der Nachrichten am Bildschirm verschieben. Die Reihenfolge der Nachrichten ist dabei stets im Hinterkopf zu behalten: Auf die original deutschsprachige Nachricht folgt die MÜ ins Katalanische. Die Reaktion des Gegenübers erfolgt zunächst im Original auf Katalanisch, bevor die MÜ ins Deutsche eingeblendet wird. Die Auswertung der Eye-Tracking-Daten erfolgte sowohl visuell, in absoluten Zahlen und statistisch auf Grundlage von nicht-parametrischen Tests. Diese wurden mit der Statistiksoftware R durchgeführt. Die Chatverläufe, die sich aus den beiden Studienteilen ergaben, sind als Textdateien vorhanden und werden in der Arbeit nur angerissen, können jedoch für weiterführende Forschung korpusbasiert aufbereitet und untersucht werden. 4 Thesen 4.1 In dem von der Maschinellen Übersetzung vermittelten Chat finden sich Elemente der Nähe- und Distanzkommunikation. Die Angaben der Versuchspersonen in den studienbegleitenden Fragebögen lassen den Schluss zu, dass die von einem MÜ-System vermittelte Chatsituation eindeutig Elemente der Nähe- und Distanz- kommunikation aufweist, wie sie Koch u. a. (2011) in ihrem Modell darstellen. Einerseits betonen die Proband·innen die Unverfänglichkeit und Kurzlebigkeit der Chatsituation, was für einen gewissen Grad an Vertrautheit steht. Andererseits unterstreichen Sie weiterhin die bestehende Anonymität einer Textchat-Kommunikation, deren Mauern ein MÜ-System nicht niederreißen kann, sondern eher noch verstärkt. Besonders wird dies in den Angaben der Proband·innen deutlich, die unsicher im Umgang mit dem Gegenüber sind, zugleich jedoch nicht auf den zwischengeschalteten Skype Translator eingehen. Trotz der bestehenden Möglichkeit, die Person zu biographischen Angaben zu befragen, ist die Chatsituation also weiterhin als unpersönlich gekennzeichnet. Die Versuchspersonen verweisen auf die nicht vorhandene Vertrautheit zwischen ihnen und dem Gegenüber, was teilweise dem Skype Translator angelastet wird. Es sind zudem Grundzüge des Filter- und des Kanalreduktions- modells wiedererkennbar, wie sie von Walther (1996), Trepte u. a. (2012) und Döring (2013) beschrieben werden und nach denen computervermittelte Kommunikation mit dem Verlust von Informationen und Aktionsmöglichkeiten einhergeht. Auch auf Grundlage der visualisierten Eye-Tracking-Daten (Heatmap, Gaze Plots u. a.) wird ein weiteres Merkmal der computervermittelten Kommunikation erkenntlich: Die Versuchspersonen richten ihre Aufmerksamkeit beinahe über die gesamte Dauer der Chatsituation auf den Bereich des Bildschirms, an dem die neuen Nachrichten eingeblendet werden. In diesem Zusammenhang ist auffällig, dass die Proband·innen zu keiner Zeit willentlich durch den 3
Chatverlauf scrollten, um ältere Nachrichten außerhalb der Bildschirmanzeige zu betrachten. Davon zeugt die Durchsicht der Bildschirmmitschnitte während der Datenaufbereitung. Der Fokus auf den aktuellsten Nachrichten spiegelt somit eine möglichst synchrone Kommunikation wider. 4.2 Den Proband·innen gelingt es, ein Gespräch mit einer Person, die nicht dieselbe Sprache wie sie spricht, zu führen und bei dem sie sich auf die Ausgabe des Skype Translators verlassen müssen. Die Mehrheit der Versuchspersonen gibt sich zufrieden mit dem Verlauf der computervermittelten Kommunikation unter Beteiligung des Skype Translators. Mehrfach klingt in den Aussagen unter- schwellig positive Überraschung über die maschinelle Übersetzung heraus, auch wenn zugleich betont wird, dass die unterschiedlichen, bekannten Probleme der Maschinellen Übersetzung auch im Rahmen des Gesprächs entdeckt wurden, durch Rückfragen jedoch gelöst werden konnten. So gibt die Mehrheit der Proband·innen an, nicht das Gefühl zu haben, dass Ihnen im Rückblick Informationen fehlen. Zugleich drücken die Proband·innen ihre Verwirrung über den erstmaligen Kontakt mit dem Design des Skype Translators aus. Da alle Nachrichten, sowohl die maschinelle Übersetzung ins Deut- sche und Katalanische als auch das katalanische Original, linksbündig, hingegen die ausgehenden Nachrichten der Studienteilnehmer·innen rechtsbündig angezeigt werden, wirkt der Aufbau mit Blick auf die Informationsverarbeitung zunächst unübersichtlich. Auch hierin lassen sich erneut Elemente der o. g. Kommunikationsmodelle erkennen. Die Versuchspersonen reagieren auf die fehlenden Kom- munikationselemente (z. B. para- und non-verbale) indem sie auf die verbleibenden ausweichen. In diesem Fall gewinnt die Kommunikationssituation im Vergleich zu bestehenden Untersuchungen an Textchats sogar ein Element hinzu: das der Maschinellen Übersetzung. 4.3 Die Versuchspersonen im Setting Katalanisch-Deutsch nutzen das Vorhandensein der MÜ-Ausgabe für ein sprunghaftes Leseverhalten, wohingegen die Personen im monolingualen Setting den Fokus der Aufmerksamkeit primär auf die Nachrichten des Gegenübers legen. Die Untersuchung der einzelnen Indikatoren ergibt, dass ein sprunghaftes, vergleichendes Leseverhal- ten zwischen den einzelnen Nachrichtenarten besteht. Die Versuchspersonen orientieren sich offenbar an allen Chatbeiträgen, auch wenn sie der anderen Sprache nicht mächtig sind. Weiterhin deuten die einzelnen Indikatoren der Eye-Tracking-Studie darauf hin, dass die Versuchspersonen kognitiv stärker gefordert sind und ihre Aufmerksamkeit dementsprechend breiter verteilen (müssen), um den vor- handenen vier verschiedenen Nachrichtenarten gerecht zu werden. Darüber hinaus ist festzustellen, dass die Proband·innen im Setting Katalanisch-Deutsch ihre Aufmerksamkeit auf alle zur Verfügung stehenden Beitragsarten verteilen, was auch durch die Angaben im begleitenden Fragebogen gestützt wird. Die Versuchspersonen gaben dort an, mit Interesse zwischen den Originalnachrichten sowie der MÜ-Ausgabe zu wechseln. Die Versuchspersonen im einsprachigen Studienteil hingegen orien- tieren sich schwerpunktmäßig an den Beiträgen des Gegenübers, sprich: den eingehenden, für sie unbekannten Nachrichten. Davon zeugen beispielsweise die hohe Anzahl an Fixationen oder auch an eingehenden Regressionen auf die entsprechenden Beiträge. Auch die zeitlichen Indikatoren der Gesamtverweildauer und der Dauer des ersten Durchlaufs deuten in diese Richtung. 4
4.4 Der Informationsaustausch erfolgt auf Grundlage aller vier zur Verfügung stehen- den Nachrichtenarten. Die Eye-Mind-Hypothese von Carpenter (1988) geht von der Annahme aus, dass die Augen auf den Bereich gerichtet sind, den das Gehirn gerade verarbeitet. Mit Rückgriff auf diese Hypothese deuten die Eye-Tracking-Daten darauf hin, dass die Versuchspersonen für den Informationsautausch in der Chatkommunikation alle zur Verfügung stehenden Nachrichtenarten, sprich: sowohl jeweils deutsch- als auch katalanischsprachige Originalnachrichten und deren MÜ, verwenden. Die eigenen Nachrich- ten der Versuchspersonen können sowohl in der Eingabemaske als auch innerhalb des Chat-Layouts betrachtet werden. Dadurch fällt ihnen die geringste Beachtung zu, worauf alle untersuchten Indikato- ren der Eye-Tracking-Studie hindeuten. Die eigenen Nachrichten weisen die geringste Fixationsanzahl auf. Auch die Durchlaufdauer, Gesamtverweildauer sowie die Pupillengröße sind geringer als auf den weiteren Nachrichtenkategorien, was für eine niedrigere kognitive Auslastung spricht. Die Unter- suchung der Regressionen deutet allerdings auch darauf hin, dass ausgehend von den nachfolgenden maschinell übersetzten Nachrichten ins Katalanische durchschnittlich mindestens ein Rücksprung in die einzelnen deutschen Originalnachrichten ausgeführt wird. In die gleiche Richtung weist auch die Differenz zwischen der selektiven regressiven Durchlaufdauer und der regressiven Durchlaufdauer. Während erstere nur die Fixationsdauer ab erstmaligen Betreten bis zum Verlassen hin zu einem AOI mit höherer Ordnungszahl bemisst, umfasst zweitere auch alle Rücksprünge zu vorausgehenden AOI in dieser Zwischenzeit. So kommt es, dass die selektive regressive Durchlaufdauer im Falle der maschinell übersetzten Nachrichten deutlich geringer ist als das Gesamtmaß. Daraus ist zu schließen, dass die Versuchspersonen häufig und lange auf die der MÜ-Ausgabe vorausgehenden Originalnach- richten zurückgreifen. Der Schwerpunkt der Aufmerksamkeit lässt sich daher auf Grundlage der absoluten Zahlen, der statistischen Untersuchung als auch der visuellen Inspektion auf dem Bereich der eingehenden Nachrichten des Gegenübers sowie der MÜ verorten. 4.5 Die katalanischsprachigen Nachrichten, sowohl Original als auch MÜ, werden von den deutschsprachigen Proband·innen vergleichend zur Informationssicherung in- nerhalb des Chatverlaufs verwendet. Eskenazi u. a. (vgl. 2017) und Inhoff u. a. (vgl. 2019) nutzen Regressionen zur Untersuchung der Informationsverarbeitung während unterschiedlicher Leseaufgaben. In Anlehnung an diese Studien bieten die Regressionen innerhalb der einzelnen Chatnachrichten verlässliche Anhaltspunkte zur Analyse des Leseverhaltens in mehrsprachigen, maschinell übersetzten Chats. Der Stellenwert der Regressionen für die Orientierung der Versuchspersonen wird besonders bei der Untersuchung der katalanischsprachigen Nachrichten deutlich. Bei den eingehenden Regressionen sind es die original ka- talanischsprachigen Nachrichten, in die – abgesehen von der Eingabemaske, die die Versuchspersonen ohnehin zwingend zum Verfassen neuer Nachrichten betrachten müssen, – die meisten Regressionen fallen. Im Falle der Regressionen aus einem AOI gehen von der deutschen und der katalanischen MÜ die meisten Regressionen aus. Da diese beiden Nachrichtenkategorien in chronologischer Reihenfolge (s. o.) jeweils nach den katalanischen bzw. deutschen Originalnachrichten eingeblendet werden, ist es naheliegend, dass die Versuchspersonen die katalanischen Nachrichten in die Kommunikation miteinbeziehen. Auch die Untersuchung der regressiven Durchlaufdauer im Vergleich mit der Ge- samtverweildauer pro AOI lässt erkennen, dass die Versuchspersonen im mehrsprachigen Chat einen substanziellen Teil der Zeit auf den Vergleich zwischen MÜ und Originalnachricht aufwenden. So ist die absolute und durchschnittliche regressive Durchlaufdauer der MÜ sowohl wesentlich länger als 5
die der Originalbeiträge als auch länger als die entsprechende Gesamtverweildauer pro AOI-Kategorie. Es wird ersichtlich, dass die Versuchspersonen offenbar die maschinell übersetzten Nachrichten be- trachten, dann jedoch zu den vorausgehenden Originalnachrichten zurückspringen, bevor sie dem linearen Chatverlauf hin zu aktuellen Nachrichten folgen. 5 Desiderata und Weiterführung Es wäre wünschenswert, die Studie im gleichen Design, allerdings mit Sprachen zu wiederholen, die kein gemeinsames Schriftsystem teilen. Die Auswertung und Analyse der zur Verfügung stehenden Daten zeigt, dass sich die Versuchspersonen während der Chatkommunikation zwar einerseits auf die MÜ stützen, zugleich jedoch wenige schwerwiegende (Verständigungs-)Probleme auftreten. Dies mag in großen Teilen sicherlich der Tatsache geschuldet sein, dass das Katalanische und das Deutsche ein gemeinsames Schriftsystem teilen. Daher besteht das Forschungsinteresse, mehrsprachige, compu- tervermittelte Kommunikation unter Beteiligung von Sprachen wie dem Russischen, Griechischen oder Chinesischen zu untersuchen, um so eine größere Hürde zu schaffen, die die Versuchspersonen bei der Informationsverarbeitung überwinden müssen. Weiterhin könnte durch die Studienwieder- holung in diesem Format auch deutlicher untersucht werden, wie die Versuchsteilnehmer·innen die Kommunikationssituation strukturieren, sprich: ob sie eher punktuell einzelne Bereiche der Chatbei- träge vergleichen oder die gesamte MÜ-Ausgabe dem entsprechenden Original gegenüberstellen. Außerdem erscheint es sinnvoll, die Zusammenstellung der Versuchspersonen zu verändern. Für die vorliegende Arbeit wurde auf Studierende zurückgegriffen. Diese sind üblicherweise Anfang 20 und somit nativ mit vergleichbarer Technologie aufgewachsen. Außerdem weisen sie bereits ein formell höheres Bildungsniveau auf, mit dem oft ohnehin Fremdsprachenkenntnisse verbunden sind. Deshalb könnte eine Studienwiederholung mit Personen durchgeführt werden, die entweder nicht aus dem akademischen Bereich stammen, oder nicht in der selben Altersgruppe zu verorten sind, oder nicht das gleiche formelle Bildungsniveau aufweisen. Über die Variation dieser Parameter ließen sich somit sicherlich auch weitere Erkenntnisse zu der Informationsverarbeitung in mehrsprachigen Chats gewinnen. Literatur Carpenter, R. H. S. (1988). Movements of the eyes, 2nd rev. & enlarged ed. Movements of the eyes, 2nd rev. & enlarged ed. Pages: 593. London, England: Pion Limited. 593 S. ISBN: 0-85086-109-8 (Hardcover). Döring, Nicola (2013). „C 5 Modelle der Computervermittelten Kommunikation“. In: Grundlagen der praktischen Information und Dokumentation. Handbuch zur Einführung in die Informationswissenschaft und-praxis. De Gruyter, Berlin, S. 425–430. Eskenazi, Michael A. und Jocelyn R. Folk (Aug. 2017). „Regressions during reading: The cost depends on the cause“. In: Psychonomic Bulletin & Review 24.4, S. 1211–1216. ISSN: 1069-9384, 1531-5320. DOI: 10.3758/s13423-016-1200-9. URL: http://link.springer.com/10.3758/s13423-0 16-1200-9 (besucht am 23. 02. 2021). Inhoff, Albrecht W., Andrew Kim und Ralph Radach (9. Juli 2019). „Regressions during Reading“. In: Vision 3.3, S. 35. ISSN: 2411-5150. DOI: 10.3390/vision3030035. URL: https://www.mdpi.c om/2411-5150/3/3/35 (besucht am 23. 02. 2021). Koch, Peter und Wulf Oesterreicher (2011). Gesprochene Sprache in der Romania: Französisch, Italienisch, Spanisch. 2., aktualisierte und erw. Aufl. Romanistische Arbeitshefte 31. Berlin ; New York: De Gruyter. 329 S. ISBN: 978-3-11-025261-3. 6
Trepte, Sabine und Leonard Reinecke (2012). Medienpsychologie. OCLC: 863824312. Stuttgart: Kohlham- mer Verlag. ISBN: 978-3-17-023544-1. URL: http://site.ebrary.com/id/10837240 (besucht am 23. 02. 2021). Wahlster, Wolfgang, Hrsg. (2000). Verbmobil: Foundations of Speech-to-Speech Translation. Bearb. von S. Amarel u. a. Artificial Intelligence. Berlin, Heidelberg: Springer Berlin Heidelberg. ISBN: 978-3- 642-08730-1 978-3-662-04230-4. DOI: 10.1007/978-3-662-04230-4. URL: http://link.spr inger.com/10.1007/978-3-662-04230-4 (besucht am 23. 02. 2021). Walther, Joseph B (1996). „Computer-mediated communication: Impersonal, interpersonal, and hy- perpersonal interaction“. In: Communication research 23.1. Publisher: Sage Publications London, S. 3–43. 7
Sie können auch lesen