Maschinell zur Übersetzung - cognitas

Die Seite wird erstellt Ansgar-Maximilian Münch
 
WEITER LESEN
Maschinell zur Übersetzung - cognitas
12   Schwerpunkt

            Maschinell zur
            Übersetzung

                             02/20
Maschinell zur Übersetzung - cognitas
Schwerpunkt          13

                          Für Mensch und
                             Maschine
      Maschinelle Systeme sollen die Übersetzung vereinfachen und bessere Resultate erzielen.
Gerade Technische Dokumentation eignet sich dafür, da sie einen hohen Grad an Wiederholungen hat.
    Allerdings können redaktionelle Schreibregeln der Maschinellen Übersetzung im Weg stehen.
                                                                   text Michael Born

In vielen Technischen Redaktionen beste­             Stellen, an denen Leserinnen und Leser klei­            ser soll sofort erkennbar sein, worum es in
hen Regelwerke für das Verfassen Techni­             nere Logiklücken oder Fehler in der Sprache             einem Kapitel geht, ohne dass er überflüssi­
scher Dokumentation, meist als Redakti­              kompensieren können, zum Beispiel durch                 ge Informationen bekommt, die ihn über­
onsleitfäden. Oft stehen dort Hinweise zum           das eigene Wissen, ist die Maschine einge­              fordern oder vom Wesentlichen ablenken.
übersetzungsgerechten Schreiben. Es wird             schränkter. Die Maschine, egal ob CAT oder              Zudem soll die Überschrift eine klare Ab­
etwa definiert, wie Anweisungen, Über­               Maschinelle Übersetzung (MÜ), arbeitet le­              grenzung zum beschreibenden und anwei­
schriften oder Aufzählungen zu verfassen             diglich nach einem festgelegten Muster und              senden Text haben.
sind. Oder es wird darauf hingewiesen, dass          greift meist auf einen vorher definierten bi­              Obwohl die Regeln zum Verfassen einer
bestimmte grammatikalische und stilisti­             lingualen Datensatz zurück. Abweichungen                Überschrift logisch sind und damit auch
sche Formulierungen wie Passivkonstruk­              und Schreibfehler werden als etwas Neues                von Maschinen verstanden werden sollten,
tionen, Konjunktiv oder bestimmte Abkür­             erkannt anstatt als eine Variation der Spra­            kann es bei der Anwendung eines maschi­
zungen zu unterlassen sind. Grundlage für            che oder als ein Fehler.                                nellen Übersetzungssystems zu Problemen
diese Regeln bilden häufig Richtlinien wie               Zudem unterscheiden sich die maschi­                kommen. Ein Beispiel für ein solches Prob­
die Publikation der tekom zum regelbasier­           nellen Systeme wie SMT, RBMT oder NMT                   lem findet sich in Überschriften, die aus der
ten Schreiben sowie Regeln für kontrollier­          (tab. 01, s. 14) durch das Verfahren, wie mit           Standardstruktur „Subjekt + Verb“ bestehen
te oder vereinfachte Sprache [1]. Die Regel­         Daten umgegangen wird, sowie die Bestim­                wie etwa „Windows installieren“. Aus Sicht
werke sollen einer Technischen Redakteurin           mung des Datenbestands durch generische                 des Lesers oder Übersetzers ruft dieser Satz
oder einem Redakteur dabei helfen, einen             (allgemeine) oder domainspezifische (the­               keine Verständnis- oder Übersetzungspro­
Text zu erstellen, der einfach zu verstehen          menbezogene) Informationen. Durch die                   bleme hervor. Botschaft und Anwendung
und zu übersetzen ist. Letzlich ist es das Ziel,     unterschiedliche Art und Weise, wie ma­                 sind im Text deutlich erkennbar. Die Ma­
sicherzustellen, dass ein Leser Technik an­          schinelle Übersetzungssysteme und Men­                  schinelle Übersetzung hingegen übersetzt
wenden kann. Die maschinelle Verarbei­               schen mit technischen Texten umgehen, ist               diese Art von Überschrift möglicherwei­
tung eines Textes spielt aktuell eine Neben­         es notwendig, sich die bestehenden Regel­               se ähnlich wie eine Anweisung. Die Folgen
rolle. Die Herausforderung für die Zukunft           werke für Technische Dokumentation noch                 sind neben unschönen Formulierungen in
ist, dass Texte nicht nur von einem Men­             einmal anzusehen. Es gilt zu prüfen, ob das             der Zielsprache auch eine falsche Rücküber­
schen, sondern auch von einem maschinel­             jeweilige Regelwerk auch für das Verfassen              setzung.
len Übersetzungssystem ohne Schwierigkeit            von Texten angewandt werden kann, die                      Für eine Maschinelle Übersetzung sollte
verstanden werden können.                            maschinell übersetzt werden sollen.                     daher die Nominalisierung bei einer Über­
    Bereits die Anwendung von Werk­                                                                          schrift verwendet werden. Durch diese Maß­
zeugen für Computer-Aided-Translation                Passen die Überschriften?                               nahme wird die englische Übersetzung in Ta­
(CAT) und der Einsatz von Übersetzungs­              In einer Technischen Dokumentation sol­                 belle 02, Seite 14 (hier mit DeepL und Google
speichern machen deutlich, dass bestimm­             len Überschriften kurz, prägnant und ein­               übersetzt) im Vergleich zur „Subjekt+Verb“-
te sprachliche Strukturen, Inkonsistenzen            heitlich sein sowie Redundanzen vermei­                 Struktur genauer. Die Rückübersetzung des
und Mehrdeutigkeiten zu einer schlechteren           den. Zudem sollten sie aufgabenorientiert               MT-Satzes zeigt deutlich, dass eine Ver­
Verständlichkeit und Anwendbarkeit einer             formuliert sein und wenn möglich auf No­                wechslung mit einer Anweisung nicht mehr
Technischen Dokumentation führen. An                 minalisierungen verzichten [1]. Für den Le­             möglich ist.
                                                                                                                Nicht nur die Art, wie Überschriften for­
                                                                                                             muliert werden, sondern auch der Inhalt der
                         Michael Born arbeitet seit Juli 2016 als Über­set­z­ungsmanager bei der cognitas.   Überschrift sollte bei der MÜ-Anwendung
                         Gesellschaft für Technik-Dokumentation mbH. Neben der Steuerung von Überset-        bedacht werden. So können Überschriften,
                         zungsprojekten kümmert er sich um die Betreuung der japanischen Kunden, berät
                                                                                                             die nur aus einem Wort bestehen, schnell
                         die Redakteure bei sprachlichen Fragen und rund um die Entwicklung und konzep-
                         tionelle Weiterentwicklung von Übersetzungsprozessen. Sein aktueller Schwerpunkt
                                                                                                             von MÜ falsch übersetzt werden, da die kon­
                         ist die Einführung von Maschineller Übersetzung in mehreren Kundenprojekten.        krete Bedeutung des Wortes in den meisten
                         michael.born@cognitas.de, www.cognitas.de                                           Fällen kontextabhängig ist. Sichtbar wird
                                                                                                             dies besonders dann, wenn Überschriften >

02/20
Maschinell zur Übersetzung - cognitas
14     Schwerpunkt

                                                                                                                  schenüberschriften fehlt für die Maschinel­
                                                                                                                  le Übersetzung der eindeutige Bezug in ei­
       Überblick über die Verfahren                                                                               nigen Überschriften. Je nachdem, in welche

       Maschineller Übersetzung
                                                                                                                  Sprache die Überschriften übersetzt werden,
                                                                                                                  kann es vorkommen, dass falsche gramma­
                                                                                                                  tische Formen oder Begriffe verwendet wer­
        Technologie       Beschreibung                                                                            den. Letztlich ist auch die Regel zur Vermei­
        Statistical       SMT ist die älteste Form der Maschinellen Übersetzung und bildet damit die              dung von Redundanzen kritisch [1]. Nicht
        Machine           Grundlage für viele andere Varianten der Maschinellen Übersetzung.                      nur die MÜ hat Probleme, Bezüge zwischen
        Translation       Statistische Maschinelle Übersetzung verwendet statistische Analysen und Vor-           scheinbar redundanzfreien Überschriften
        (SMT)             hersage-Algorithmen, um zu bestimmen, welche Übersetzung eines Zeichens,                herzustellen. Das kann auch einem Mensch
                          Wortes, einer Phrase oder eines Satzes am wahrscheinlichsten ist. Für das Training      passieren, wenn er den kompletten Zusam­
                          eines SMT wird ein bilingualer Korpus verwendet, der im Idealfall auf einen Anwen-      menhang nicht auf einmal sieht.
                          dungsfall abgestimmt ist und dann auch die besten Ergebnisse liefert. Für das Trai-
                          ning werden mind. 100 Millionen Wörter benötigt und eine Million Sätze. Jedoch          Und die Handlungsanweisungen?
                          gilt hier: Je mehr Input vorhanden ist, desto höher ist die Genauigkeit der SMT.
                                                                                                                  Handlungsanweisungen und Beschreibun­
        Rule-based        RBMT basiert auf einem Satz an Regeln, die die Grammatik einer Sprache darstel-         gen sollen in einer Technischen Dokumen­
        Machine           len. Zusätzlich werden Wörterbücher für allgemeines Vokabular und Fachwörter-
                                                                                                                  tation so verfasst werden, dass der Akteur
        Translation       bücher für spezielleres Vokabular verwendet. Die MT-Engine analysiert die gram-
                                                                                                                  deutlich erkennbar ist. In vielen Redak­
        (RBMT)            matischen Bestandteile des Ausgangstexts, übersetzt diese mit Hilfe hinterlegter
                                                                                                                  tionsleitfäden und auch Richtlinien zum
                          Wörterbücher und fügt die übersetzten Bestandteile nach den grammatischen
                          Regeln der Zielsprache wieder zusammen.
                                                                                                                  verständlichen Schreiben wird deshalb auf
                                                                                                                  die Verwendung von Aktiv oder imperati­
        Neuronal          NMT basiert auf einem künstlichen neuronalen Netzwerk. Es lernt, Muster in Texten
                                                                                                                  vischem Infinitiv hingewiesen. Dennoch
        Machine           zu erkennen. Die MT-Engine generiert Übersetzungen, vergleicht diese wiederholt
                                                                                                                  werden Sätze auch im Passiv formuliert. Aus
        Translation       mit Referenzmaterial und „lernt“ somit, zu übersetzen. Grundlage dafür ist ein Re-
        (NMT)             gelsatz, der auf statischen und phrasenbasierten Auswertungen beruhen kann.             Sicht der Technischen Redakteurin oder des
                          Im Vergleich zum SMT kann das NMT bereits mit weniger Wörtern trainiert werden,         Redakteurs müssen durch Passivkonstruk­
                          um gute Ergebnisse zu erzielen.                                                         tionen nicht zwangsläufig Probleme ent­
                                                                                                                  stehen. Die Konstruktionen können in der
       tab. 01 quelle Michael Born
                                                                                                                  deutschen Sprache grundsätzlich funktio­
                                                                                                                  nieren und die Aussage des Akteurs bleibt
     > redundanzfrei verfasst werden. Das tekom-            Kontext zu erkennen, so dass ein Wort als             erhalten. Dennoch „drückt“ sich die Pas­
       Regelwerk schlägt für eine redundanzfreie            alleinstehende Sinn­einheit betrachtet wird.          sivkonstruktion vor einer Aussage über den
       Gestaltung vor, auf unnötige Wiederholun­            Bei Wörtern, die je nach Verwendung un­               Handelnden.
       gen in den Zwischenüberschriften zu ver­             terschiedliche Formen haben können, kann                  Natürlich können Definitionen in Style-
       zichten. Im Alltag kann eine redundanzfreie          es zu Fehlern kommen wie: „Leiter“ als Wort           Guides für die Übersetzung, etwa „Hand­
       Konstruktion funktionieren und zu einem              für eine Führungsebene, einen Gegenstand              lungsanweisungen im Passiv sind im Ak­
       besseren Leseverständnis führen. Jedoch              oder ein leitendes Bauteil.                           tiv zu übersetzen“, oder durch Rückfragen
       ist die Wiederholung des Bezugs zum ei­                  Zudem müssen Wörter, deren Singular               des Übersetzers das Problem lösen. Jedoch
       gentlichen Objekt für die MÜ und auch für            und Plural identisch sind (zum Beispiel „Pa­          funktioniert dies nur, wenn ein Mensch den
       den Leser zwingend erforderlich. Denn in             rameter“ oder „Reinigungsmittel“), durch              Satz übersetzt. Bei der Maschinellen Über­
       vielen Sprachen ist es nur so möglich, die           Bezugswörter oder Artikel genauer defi­               setzung wird ein Passivsatz selbst dann in
       Bedeutung zu erhalten, ohne an Verständ­             niert werden, auch wenn der Stil darunter             der gleichen grammatischen Form über­
       lichkeit einzubüßen. Einträge mit nur ei­            leidet. Betrachtet man das Beispiel in Tabel­         nommen, wenn eigentlich eine aktive An­
       nem Wort lassen der MÜ viel Interpretati­            le 03, wird die Problematik deutlich. Durch           weisung gemeint ist. Die Folge ist eine fal­
       onsspielraum. Sie ist nicht in der Lage, den         das Weglassen von „Steuerung“ in den Zwi­             sche Übersetzung oder weiterhin ungewisse

        Beispiel                                          DeepL (DE-EN/EN-DE)                                   Google (DE-EN/EN-DE)
        Windows installieren                              Install Windows / Windows installieren                Install Windows / Installieren Sie Windows
        Installation von Windows                          Installing Windows / Installation von Windows         Windows installation / Windows-Installation
       tab. 02 quelle Michael Born

        tekom-Regel                                                                   Regel für Maschinelle Übersetzung
        Steuerung                                                                     Steuerung
        1.1 Parameter der Steuerung (Plural oder Singular? Was für ein Parameter?)    1.1 Die Parameter der Steuerung
        1.2 Programmierung der Steuerung                                              1.2 Programmierung der Steuerung
        1.2.1 Bibliotheken der Steuerung einbinden (Was für eine Bibliothek?)         1.2.1 Bibliotheken der Steuerung einbinden
        1.2.2 Menüsteuerung der Steuerung abbilden                                    1.2.2 Menüsteuerung der Steuerung abbilden
       tab. 03 quelle Michael Born

                                                                                                                                                              02/20
Schwerpunkt      15

 Beispiel                                        DeepL (DE-EN)                                       Google (DE-EN)
 Nach der Installation erfolgt der Neustart      After the installation the computer is restarted.   After the installation, the computer is restarted.
 des Rechners.
 Den Rechner nach der Installation neustarten.   Restart the computer after installation.            Restart the computer after the installation.
tab. 04 quelle Michael Born

Aussage. Im Vergleich zu generischen MÜs           Anwendung optimiert und eingeschränkt               zu steuern. Bei jeder Einschränkung sollte
zeigt sich zudem: Sätze im Passiv, wenn die        werden. So lassen sich Redewendungen,               genau geprüft werden, ob diese sich wirklich
Maschinelle Übersetzung über keinen do­            einzelne Wörter und andere Satzstrukturen           eignet, die Ergebnisse zu verbessern. Nicht
mainspezifischen Datenbestand verfügt,             besser steuern. Es kann sinnvoll sein, sich         jede Festlegung macht das automatisch.
liefern vermehrt falsche Ergebnisse. Da­           bei zwei Phrasen, die synonym zueinander
her können die Richtlinien zur Formulie­           sind und in vielen Sprachen gleiche oder            Was passiert mit Abkürzungen?
rung von Anweisungen in der Technischen            ähnliche Übersetzungen liefern, auf eine            Viele Texte in der Technischen Dokumenta­
Dokumentation im Aktiv oder imperativi­            Version zu einigen. Beispiele zeigt Tabelle         tion verwenden Abkürzungen und Akrony­
schem Infinitiv auch in Bezug auf die Über­        05, Seite 16.                                       me, um Wörter, die öfter wiederholt werden,
setzung durch ein MT nur bestätigt werden              Durch die Definition von Sprachmus­             zu verkürzen und so den Text nicht unnö­
(tab. 04).                                         tern und Wörtern für das automatische               tig zu verlängern. Allerdings können Abkür­
    Neben der Definition der grammati­             Post-Editing (APE), eine Vorkorrektur der           zungen und Akronyme ein großes Problem
schen Formen und deren Anwendung ist es            übersetzten Texte unter anderem durch ein           für die Maschinelle Übersetzung darstel­
sinnvoll, auch die Verwendung von Formu­           Glossar, kann kontrolliert werden, welche           len. Das ist besonders dann der Fall, wenn
lierungen und Wörtern zu definieren, um            Übersetzungen im Zieltext genutzt werden            es sich um kundenspezifische Abkürzun­
die individuelle Sprache der Redakteure bes­       sollen. Dieser Vorgang läuft unabhängig von         gen oder Akronyme handelt. Je nachdem,
ser zu kontrollieren und Inkonsistenzen zu         der Maschinellen Übersetzung ab und kann            mit welcher Art von Datensatz mit der MÜ
vermeiden. Ähnlich wie bei Kontrollierter          selbst bei generischen MÜ-Inhalten dabei            gearbeitet wird, sind andere Interpretatio­
Sprache können Sprachmuster für die MÜ-            helfen, die Übersetzungsergebnisse besser           nen möglich. Regelwerke, wie etwa von der >

Wir
digitalisieren
Verstehen.

                                                                                                         Redaktionssystem TIM und
                                                                                               Informationsplattform Sherlock – die
                                                                                            Lösungen für Content Delivery and more

                                                                                             tekom-Frühjahrstagung 2020, Stand 24
                                                   sherlock                                          www.fischer-information.com
16     Schwerpunkt

        Beispiel                     DeepL (DE-EN)                  Google (DE-EN)                     „stromlos“, „freigegeben“ oder „aktiviert“
                                                                                                       bedeuten. Dem Fachanwender wird im
        Achten Sie darauf, …         Make sure…                     Be sure to …
                                                                                                       Kontext deutlich, welche Bedeutung ge­
                                     Ensure that …                  Take care …
                                                                                                       meint ist und dass es sich bei einer „frei­
                                     Pay attention …                Be sure …
                                                                                                       geschalteten Maschine“ nicht um eine
        Stellen Sie sicher, …        Make sure …                    Make sure …                        „aktivierte Maschine“ handelt. Bei der Ma­
                                     Ensure that …
                                                                                                       schinellen Übersetzung und auch durch ei­
                                     Be sure …
                                                                                                       nen Humanübersetzer können diese Wör­
       tab. 05 quelle Michael Born                                                                     ter zu einem falschen Ergebnis führen, wenn
                                                                                                       der Zusammenhang nicht ersichtlich ist. Ta­
                                                                                                       belle 07, Seite 18, zeigt dies anhand von Bei­
     > tekom, empfehlen deshalb nur bekannte Ab­       anderes Beispiel ist die Verwendung engli­      spielübersetzungen mit DeepL und Google.
       kürzungen zu verwenden oder Wörter sinn­        scher Akronyme, die zwar im Text einmalig       Beide MTs interpretieren den Zusammen­
       voll zu kürzen.                                 ausgeschrieben werden, zum Beispiel „In­        hang von „freigeschaltet“ anders. Die erste
           Bei der MÜ sollten Abkürzungen und          ternet of Things (IoT)“. Im späteren Textver­   richtige Übersetzung entsteht, neben meh­
       Akronyme möglichst komplett vermieden           lauf treten sie aber nur noch als Abkürzung     reren Fehlinterpretationen, durch die Bezie­
       werden. Es lässt sich nur schwer sicher­        auf. Ein themenfremder Leser oder eine Ma­      hung zu „Maschine“. Die Empfehlung wäre
       stellen, dass die MÜ eine Abkürzung rich­       schinelle Übersetzung können schnell den        hier, dass die Anwendung von Benennun­
       tig erkennt. Im Zweifel wird die Abkürzung      Bezug verlieren und ordnen der Abkürzung        gen, die mehrere Interpretationen zulassen,
       nicht übersetzt. Bei Akronymen, die auf         womöglich keine oder eine falsche Bedeu­        genauer gesteuert werden muss.
       sprachspezifischen Wörtern basieren, wie        tung zu.                                            Wenn also ein Wort bereits eine Be­
       etwa „HW“ für „Heißwasser“ oder „Hard­              Ähnlich verhält es sich mit Abkürzungen     deutung hat, aber in einem anderen Kon­
       ware“ oder „KW“ für „Kaltwasser“ oder           wie „Mod.“ für Modus, Module oder Modi­         text eine andere Bedeutung haben kann, so
       „Kalenderwoche“, würde die unveränder­          fikation. Im Zweifelsfall werden sie von der    sollte für den anderen Kontext eine andere
       te Übernahme in die Zielsprache den Le­         Maschinellen Übersetzung falsch oder gar        Benennung gefunden oder die Bedeutung
       ser verwirren. Schließlich versteht er keine    nicht erkannt und gelangen in einer Form        umschrieben werden. Wenn die MÜ eine
       Abkürzungen, die nicht aus seiner Sprache       in die Übersetzung, die niemand will. Bei       Glossarfunktion oder ein automatisches
       stammen. Oder er verbindet die Abkürzung        kundenspezifischen Abkürzungen und Ak­          Post-Editing hat, ist die Anpassung umso
       falsch wie Hardware statt Heißwasser. Ein       ronymen ist bei generischen MÜs ebenso          notwendiger. Die Maschine tauscht in die­
                                                       keine Garantie gegeben, dass die Überset­       sem Fall häufig nur Wort A durch die Über­
                                                       zung gelingt.                                   setzung A aus und missachtet den Kontext.
                                                           Daher ist es wichtig, mit Abkürzungen       Zudem können je nach Art der MÜ (gene­
                                                       oder Akronymen, wenn diese unbedingt            risch oder domainspezifisch) leichtere oder
                                                       benötigt werden, sparsam umzugehen. Es          strengere Vorgaben nötig sein. Es sollte
                                                       gilt, genau zu definieren, welche die Techni­   aber bedacht werden, dass die Anwendung
                                                       sche Redaktion verwenden darf und welche        nicht immer MÜ-übergreifend möglich sein
                                                       nicht. Die Entscheidung sollte auch anhand      könnte.
                                                       des Datenbestandes der Maschinellen Über­
                                                       setzung getroffen werden (tab. 06).             Sind die Texte fehlerfrei?
                                                                                                       Rechtschreibung und Interpunktion sind in
                                                       Wie viele Bedeutungen?                          vielen Redaktionsleitfäden bereits zur Genü­
                                                       In vielen Sprachen ist die richtige Benen­      ge behandelt worden. Orthografische Kor­
                                                       nung wichtig, damit der Leser des Textes        rektheit hingegen bekommt bei der Maschi­
                                                       auf Anhieb versteht, was gemeint ist. Jedoch    nellen Übersetzung nochmals eine höhere
                                                       kann ein Wort in einer Sprache mehrere Be­      Bedeutung. Eine fehlerhafte Interpunktion
                                                       deutungen haben, die erst durch den jeweili­    kann bewirken, dass ein Satz nicht richtig
                                                       gen Kontext konkretisiert werden. Oft wird      von der MÜ gelesen werden kann. Ein Bei­
                                                       diese Variation innerhalb der Technischen       spiel sind fehlende Kommas bei der Tren­
                                                       Redaktion durch vorgeschriebene Termino­        nung einzelner Satzteile. Die MÜ erschließt
                                                       logie verhindert. Dort wird darauf geachtet,    sich in so einem Fall eine eigene Interpreta­
                                                       dass ein Wort nur eine Bedeutung haben          tion und ordnet die einzelnen Textteile ent­
                                                       kann oder sollte. Auch die tekom empfiehlt      sprechend zu. Das kann dazu führen, dass
                                                       dieses Vorgehen [1]. Dabei geschieht die        Nebensätze nicht richtig erkannt und Satz­
                                                       eindeutige Definition der Benennungen nur       teile zusammengezogen werden. Als Folge
                                                       auf Kunden- oder Projektebene. Das führt        wird ein falscher Zusammenhang der Satz­
                                                       dazu, dass dem in anderen Kontexten bereits     teile ermittelt.
                                                       definierten Wort eine andere Bedeutung zu­          Dies ist auch der Fall, wenn die Satzzei­
                                                       kommen kann.                                    chen nicht nur im Satz falsch gesetzt wer­
                                                          Das Wort „freigeschaltet“ zeigt die Pro­     den, sondern auch am Satzende. Bei Sätzen
                                                       blematik. Je nach Bezug des Wortes in           mit ähnlichen Strukturen, die zum Beispiel
                                                       der Technischen Dokumentation kann es           auch in Überschriften vorkommen können

                                                                                                                                                02/20
Schwerpunkt           17

 Abkürzung (DE)       Bedeutung                 Google (EN)     DeepL (EN)                       figsten vorkommt und statistisch am wahr­
                                                                                                 scheinlichsten das richtige Ergebnis liefert.
 hW bzw. HW           Heißwasser, Hauptwagen,   HW, Hardware,   HW, LC, TC, UH, SW, UW, UC,
                                                                                                     Ähnlich verhält es sich auch bei fehlen­
                      Heizwerk, Hektowatt,      FW, hW          Hardware, hW …
                      Handelsware
                                                                                                 den Bindestrichen, etwa bei „ein und aus­
                                                                                                 schalten“. Ein Mensch erkennt hier die Be­
 Mod.                 Modus, Modul,             Mod.            Mod, Mod., Modification
                                                                                                 deutung „einschalten und ausschalten“. Für
                      Modifikation
                                                                                                 ein Übersetzungssystem kann der fehlende
                                                                                                 Bindestrich hinter „ein“ dazu führen, dass
tab. 06 quelle Michael Born                                                                      das Wortfragment nicht zusammen mit
                                                                                                 „-schalten“ erkannt wird und somit nur als
                                                                                                 „ein“ in einem beliebigen Kontext gedeutet
(Subjekt + Verb), ist es möglich, dass Sätze      zung durch einen Menschen erfolgt. Die Ge­     wird (tab. 08, s. 18). Damit die MÜ sol­
nicht als solche übersetzt werden, wenn der       fahr von Übersetzungsfehlern ist gering. Die   che Sätze versteht, müssen Worteinheiten
abschließende Punkt fehlt.                        MÜ geht die Wörter, Zeichen oder Phrasen       entweder zusammen oder mit Bindestrich
   Normalerweise werden solche Fehler             jedoch gerade bei statistischen Verfahren      geschrieben werden, wobei die Variante
spätestens bei der Übersetzung erkannt, hin­      nacheinander durch und wählt die Option,       „einschalten und ausschalten“ eindeutiger
terfragt und korrigiert, solange die Überset­     die im Datensatz in dieser Folge am häu­       wäre.                                         >

                 en
         Besuch der
               auf
       Sie uns hjahrs-
             Frü
      tekom- 2020
         tagung rg an
                bu
        in Würz 11
            Stand

                   AUTOMATISIERUNG IST ALLES!
                   In der eigenen Redaktion – Außerhalb der Redaktion – Mit anderen Systemen
                   Mit dem Workflow Designer und der Workflow Automation Library für SCHEMA ST4
18     Schwerpunkt

        Benennung (DE)                     Bedeutung                            Google (EN)                             DeepL (EN)
        Freigeschaltet                     stromlos, aktiviert, freigegeben     activated                               activated
                                                                                enabled                                 enabled
                                                                                unlocked                                unlocked
                                                                                                                        switched on
                                                                                                                        released
        Freigeschaltete Maschine           stromlos                             unlocked machine (falsch)               unlocked machine (falsch)
                                                                                                                        activated machine (falsch)
                                                                                                                        disconnected machine (richtig)
                                                                                                                        connected machine (falsch)
                                                                                                                        released machine (falsch)
       tab. 07 quelle Michael Born

        Beispiel                       Google (DE-EN)                          Beispiel                     DeepL (DE-EN)             Google (DE-EN)
        Öffnet die Sicht, in der der   Opens the view in which the             Ansicht Öffnen               Open view                 Open view
        Benutzer die erforderlichen    user can the necessary drives           Ansicht „Öffnen“             Open View                 View “Open”
        Antriebe ein und ausschalten   on and off. (ungenau)
        kann.                                                                 tab. 09 quelle Michael Born

        Öffnet die Sicht, in der der   Opens the view in which the
        Benutzer die erforderlichen    user can switch the required
        Antriebe ein- und              drives on and off. (genauer)
        ausschalten kann.
       tab. 08 quelle Michael Born

     > Je klarer die Bezüge sind, umso höher ist die    nungen bzw. Tags agiert die MÜ ähnlich wie           Auch wenn das Regelwerk der tekom die
       Wahrscheinlichkeit, dass MÜ die Informa­         ein CAT-Tool. Das heißt, dass die MÜ nur             Auszeichnung von GUI in Überschriften
       tion richtig erkennt. Ansonsten werden die       Auszeichnungen erkennen kann, die ihr be­            durch Anführungszeichen ablehnt, sollte
       Wörter so übersetzt, wie sie im Datenbe­         reits geläufig sind.                                 diese Maßnahme bei Maschineller Überset­
       stand gefunden und entsprechend interpre­            Unbekannte Auszeichnungen hingegen               zung überlegt werden. So lässt sich in Über­
       tiert werden können. Doch selbst wenn die        sorgen für eine falsche Interpretation von Zu­       schriften der Bezug zu einem GUI besser
       korrekte Schreibweise beachtet wird, beste­      sammenhängen, da Sätze entweder getrennt             erkennen, selbst wenn die sonstigen Aus­
       hen weiterhin Risiken. Je nach Umfang des        gelesen oder Auszeichnungen ignoriert wer­           zeichnungs-Tags nicht bekannt sind. Bei der
       Datenbestandes und der Anzahl an Erwäh­          den. In Tabelle 09 kann durch die fehlende           Endkontrolle müssen maximal die Tags von
       nungen bestimmter Konstruktionen pas­            Auszeichnung das Wort „Öffnen“ fälschlich            Hand an die richtige Stelle im Satz verscho­
       siert es, dass Kombinationen aus Wörtern         zusammen mit „Ansicht“ gelesen werden.               ben werden (tab. 09 und 10, s. 20).
       noch nicht vorliegen. Wenn sie nicht rich­       So handelt es sich nicht um die Ansicht mit
       tig erkannt werden, sollte man prüfen, ob es     dem Namen „Öffnen“, sondern eine Anwei­              Was ist zu tun?
       sich um Wortneuschöpfungen handelt, die          sung zum Öffnen der Ansicht.                         Die Liste möglicher Probleme, die bei Tech­
       in den Datenbestand aufgenommen werden               Werden Auszeichnungen nicht von der              nischer Dokumentation und Maschineller
       müssen. Alternativ kann es sich um Kombi­        MÜ erkannt, dann zeigt sich das auch dar­            Übersetzung auftauchen können, lässt sich
       nationen handeln, die etablierte Varianten       an, dass Tags an den Anfang oder das Ende            weiter ausführen. Denn es wird immer eine
       ersetzen. Möglicherweise müssen die Kom­         des Satzes verschoben werden (tab. 10, s. 20).       Thematik geben, die Schwierigkeiten berei­
       binationen verboten werden, um die Quali­        Die MÜ ignoriert die Auszeichnungen und              tet und besser abgestimmt werden könnte.
       tät zu halten.                                   übersetzt die entsprechenden Stellen so, als         Es zeigt sich aber auch, dass Regeln für die
                                                        handle es sich um „normale“, nicht ausge­            Maschinelle Übersetzung nicht von heute
       Sind Auszeichnungen verständlich?                zeichnete Wörter. So ist die richtige Erken­         auf morgen erstellt, geschweige denn uni­
       Unabhängig davon, ob ein TMX-Editor, Ad­         nung von Auszeichnungen in der Software-             versal festgelegt werden können. Viele Re­
       obe FrameMaker, Madcap Flare oder ein an­        dokumentation wichtig, da zitierte Begriffe          geln, die für das verständliche Schreiben
       deres Autorensystem verwendet wird: Texte        der Softwareoberfläche (GUI) schnell mit             definiert wurden und sich vorrangig an die
       werden ausgezeichnet, um Sätze oder Wör­         allgemeinen Begriffen verwechselt werden             Leserin oder den Leser wenden, können teil­
       ter hervorzuheben. Der Redaktionsleitfaden       können. In diesem Fall sollte geprüft werden,        weise auch für die Maschinelle Übersetzung
       oder auch die tekom-Publikation stellt Re­       welche Auszeichnungen von der Maschinel­             gelten. Doch sprachliche Sonderfälle, die ein
       geln zur Auszeichnung von Texten bereit.         len Übersetzung erkannt werden können und            Mensch ohne Probleme versteht, sind bei
       Jedoch sollten für die Maschinelle Überset­      welche nicht. Dadurch lässt sich der Umfang          der Maschinellen Übersetzung unvorherge­
       zung einige Regeln erweitert werden. Sys­        an Auszeichnungen ermitteln, die zu verwen­          sehene Hürden. Für die Maschinelle Über­
       teme für die Maschinelle Übersetzung sind        den oder auszuschließen sind. Eine andere            setzung sollte in der Technischen Dokumen­
       heute schon so mächtig und können viel­          Möglichkeit wäre die Kennzeichnung, zum              tation von Fall zu Fall überlegt werden, ob
       seitig eingesetzt werden. Beim Lesen eines       Beispiel mit Anführungszeichen zur Unter­            für bestehende Regeln eine Gültigkeit gege­
       Textes und der darin enthaltenen Auszeich­       stützung der Tag-Auszeichnung.                       ben wird oder eine Anpassung oder Neufor­ >

                                                                                                                                                         02/20
20     Schwerpunkt

        Beispiel                                                            SDL Beglobal
        Den Hauptschalter USV in Position                        Turn the UPS main switch to the OFF position,
        OFF drehen, mit einem Vorhängeschloss sichern und ein    lock it with a padlock and attach a sign.
        Hinweisschild anbringen.
       tab. 10 quelle Michael Born

     > mulierung nötig ist. Durch die Fortschritte     Wird aber der Aufwand gescheut, inkonsis­       ßeren Regelwerken ist grundsätzlich zu prü­
       bei der Neuronalen Maschinellen Überset­        tente oder missverständliche Ausdrücke in       fen, ob eine Anpassung erfolgen sollte oder
       zung und Künstlicher Intelligenz könnte         der Technischen Dokumentation zu redu­          nicht. Schließlich werden dadurch andere
       man meinen, die Anpassung von Regeln sei        zieren, wird sich die Qualität der Überset­     Regeln beeinflusst oder eine Verbesserung
       nicht nötig. Schließlich werden die Systeme     zungen verschlechtern. Das kann ebenso bei      verfehlt.
       mit größeren generischen und angepassten        der Übersetzung mit einem Translation-Me­          Gerade der Anspruch, bestehende und
       Datensätzen trainiert, wodurch verständli­      mory-System passieren.                          neue Regeln zu prüfen und zu validieren,
       che und richtige Übersetzungen entstehen           Es gilt immer zu prüfen, ob eine Regel­      macht es interessant, sich mit den Entwick­
       könnten. Doch der Eindruck trügt. Überset­      anpassung für jede Textart sinnvoll ist.        lungen bei der Maschinellen Übersetzung
       zungsfehler in der Zielsprache werden meist     Einzelne Regeln werden unabhängig von           zu beschäftigen. Es gilt zu analysieren, wie
       erst von Muttersprachlern erkannt und auch      Fachgebiet, Textart oder Adressat in ver­       sich einzelne Systeme bei verschiedenen
       nur dann, wenn die auszuführende Hand­          schiedenen Bereichen anwendbar sein und         Textarten verhalten. Das Ziel ist, dass in
       lung keinen Sinn ergibt.                        zur Übersetzungsqualität beitragen. Es ist      Zukunft Texte möglich sind, die sowohl für
           Weil in der Maschinellen Übersetzung        aber auch möglich, dass bestehende Regeln       den Menschen als auch für die Maschine ge­
       große Datensätze genutzt werden und             für Maschinelle Übersetzungssysteme nicht       schrieben werden können.
       Künstliche Intelligenz zum Einsatz kommt,       genutzt werden können, da die Bedeutung
                                                                                                       literatur zum beitrag
       ist es wichtig zu prüfen, wie das Überset­      des Ausgangstextes zu sehr verfälscht wird.     [1] tekom (Hrsg.) (2013): Regelbasiertes Schreiben –
       zungssystem mit den vorhandenen und zu­         Oder ein Text benötigt mehr sprachliche             Deutsch für die Technische Kommunikation.
       künftigen Daten effizient umgehen kann.         Freiheiten, etwa für das Marketing. Bei grö­        2. erweiterte Auflage
Sie können auch lesen