Maschinell zur Übersetzung - cognitas
←
→
Transkription von Seiteninhalten
Wenn Ihr Browser die Seite nicht korrekt rendert, bitte, lesen Sie den Inhalt der Seite unten
Schwerpunkt 13 Für Mensch und Maschine Maschinelle Systeme sollen die Übersetzung vereinfachen und bessere Resultate erzielen. Gerade Technische Dokumentation eignet sich dafür, da sie einen hohen Grad an Wiederholungen hat. Allerdings können redaktionelle Schreibregeln der Maschinellen Übersetzung im Weg stehen. text Michael Born In vielen Technischen Redaktionen beste Stellen, an denen Leserinnen und Leser klei ser soll sofort erkennbar sein, worum es in hen Regelwerke für das Verfassen Techni nere Logiklücken oder Fehler in der Sprache einem Kapitel geht, ohne dass er überflüssi scher Dokumentation, meist als Redakti kompensieren können, zum Beispiel durch ge Informationen bekommt, die ihn über onsleitfäden. Oft stehen dort Hinweise zum das eigene Wissen, ist die Maschine einge fordern oder vom Wesentlichen ablenken. übersetzungsgerechten Schreiben. Es wird schränkter. Die Maschine, egal ob CAT oder Zudem soll die Überschrift eine klare Ab etwa definiert, wie Anweisungen, Über Maschinelle Übersetzung (MÜ), arbeitet le grenzung zum beschreibenden und anwei schriften oder Aufzählungen zu verfassen diglich nach einem festgelegten Muster und senden Text haben. sind. Oder es wird darauf hingewiesen, dass greift meist auf einen vorher definierten bi Obwohl die Regeln zum Verfassen einer bestimmte grammatikalische und stilisti lingualen Datensatz zurück. Abweichungen Überschrift logisch sind und damit auch sche Formulierungen wie Passivkonstruk und Schreibfehler werden als etwas Neues von Maschinen verstanden werden sollten, tionen, Konjunktiv oder bestimmte Abkür erkannt anstatt als eine Variation der Spra kann es bei der Anwendung eines maschi zungen zu unterlassen sind. Grundlage für che oder als ein Fehler. nellen Übersetzungssystems zu Problemen diese Regeln bilden häufig Richtlinien wie Zudem unterscheiden sich die maschi kommen. Ein Beispiel für ein solches Prob die Publikation der tekom zum regelbasier nellen Systeme wie SMT, RBMT oder NMT lem findet sich in Überschriften, die aus der ten Schreiben sowie Regeln für kontrollier (tab. 01, s. 14) durch das Verfahren, wie mit Standardstruktur „Subjekt + Verb“ bestehen te oder vereinfachte Sprache [1]. Die Regel Daten umgegangen wird, sowie die Bestim wie etwa „Windows installieren“. Aus Sicht werke sollen einer Technischen Redakteurin mung des Datenbestands durch generische des Lesers oder Übersetzers ruft dieser Satz oder einem Redakteur dabei helfen, einen (allgemeine) oder domainspezifische (the keine Verständnis- oder Übersetzungspro Text zu erstellen, der einfach zu verstehen menbezogene) Informationen. Durch die bleme hervor. Botschaft und Anwendung und zu übersetzen ist. Letzlich ist es das Ziel, unterschiedliche Art und Weise, wie ma sind im Text deutlich erkennbar. Die Ma sicherzustellen, dass ein Leser Technik an schinelle Übersetzungssysteme und Men schinelle Übersetzung hingegen übersetzt wenden kann. Die maschinelle Verarbei schen mit technischen Texten umgehen, ist diese Art von Überschrift möglicherwei tung eines Textes spielt aktuell eine Neben es notwendig, sich die bestehenden Regel se ähnlich wie eine Anweisung. Die Folgen rolle. Die Herausforderung für die Zukunft werke für Technische Dokumentation noch sind neben unschönen Formulierungen in ist, dass Texte nicht nur von einem Men einmal anzusehen. Es gilt zu prüfen, ob das der Zielsprache auch eine falsche Rücküber schen, sondern auch von einem maschinel jeweilige Regelwerk auch für das Verfassen setzung. len Übersetzungssystem ohne Schwierigkeit von Texten angewandt werden kann, die Für eine Maschinelle Übersetzung sollte verstanden werden können. maschinell übersetzt werden sollen. daher die Nominalisierung bei einer Über Bereits die Anwendung von Werk schrift verwendet werden. Durch diese Maß zeugen für Computer-Aided-Translation Passen die Überschriften? nahme wird die englische Übersetzung in Ta (CAT) und der Einsatz von Übersetzungs In einer Technischen Dokumentation sol belle 02, Seite 14 (hier mit DeepL und Google speichern machen deutlich, dass bestimm len Überschriften kurz, prägnant und ein übersetzt) im Vergleich zur „Subjekt+Verb“- te sprachliche Strukturen, Inkonsistenzen heitlich sein sowie Redundanzen vermei Struktur genauer. Die Rückübersetzung des und Mehrdeutigkeiten zu einer schlechteren den. Zudem sollten sie aufgabenorientiert MT-Satzes zeigt deutlich, dass eine Ver Verständlichkeit und Anwendbarkeit einer formuliert sein und wenn möglich auf No wechslung mit einer Anweisung nicht mehr Technischen Dokumentation führen. An minalisierungen verzichten [1]. Für den Le möglich ist. Nicht nur die Art, wie Überschriften for muliert werden, sondern auch der Inhalt der Michael Born arbeitet seit Juli 2016 als Übersetzungsmanager bei der cognitas. Überschrift sollte bei der MÜ-Anwendung Gesellschaft für Technik-Dokumentation mbH. Neben der Steuerung von Überset- bedacht werden. So können Überschriften, zungsprojekten kümmert er sich um die Betreuung der japanischen Kunden, berät die nur aus einem Wort bestehen, schnell die Redakteure bei sprachlichen Fragen und rund um die Entwicklung und konzep- tionelle Weiterentwicklung von Übersetzungsprozessen. Sein aktueller Schwerpunkt von MÜ falsch übersetzt werden, da die kon ist die Einführung von Maschineller Übersetzung in mehreren Kundenprojekten. krete Bedeutung des Wortes in den meisten michael.born@cognitas.de, www.cognitas.de Fällen kontextabhängig ist. Sichtbar wird dies besonders dann, wenn Überschriften > 02/20
14 Schwerpunkt schenüberschriften fehlt für die Maschinel le Übersetzung der eindeutige Bezug in ei Überblick über die Verfahren nigen Überschriften. Je nachdem, in welche Maschineller Übersetzung Sprache die Überschriften übersetzt werden, kann es vorkommen, dass falsche gramma tische Formen oder Begriffe verwendet wer Technologie Beschreibung den. Letztlich ist auch die Regel zur Vermei Statistical SMT ist die älteste Form der Maschinellen Übersetzung und bildet damit die dung von Redundanzen kritisch [1]. Nicht Machine Grundlage für viele andere Varianten der Maschinellen Übersetzung. nur die MÜ hat Probleme, Bezüge zwischen Translation Statistische Maschinelle Übersetzung verwendet statistische Analysen und Vor- scheinbar redundanzfreien Überschriften (SMT) hersage-Algorithmen, um zu bestimmen, welche Übersetzung eines Zeichens, herzustellen. Das kann auch einem Mensch Wortes, einer Phrase oder eines Satzes am wahrscheinlichsten ist. Für das Training passieren, wenn er den kompletten Zusam eines SMT wird ein bilingualer Korpus verwendet, der im Idealfall auf einen Anwen- menhang nicht auf einmal sieht. dungsfall abgestimmt ist und dann auch die besten Ergebnisse liefert. Für das Trai- ning werden mind. 100 Millionen Wörter benötigt und eine Million Sätze. Jedoch Und die Handlungsanweisungen? gilt hier: Je mehr Input vorhanden ist, desto höher ist die Genauigkeit der SMT. Handlungsanweisungen und Beschreibun Rule-based RBMT basiert auf einem Satz an Regeln, die die Grammatik einer Sprache darstel- gen sollen in einer Technischen Dokumen Machine len. Zusätzlich werden Wörterbücher für allgemeines Vokabular und Fachwörter- tation so verfasst werden, dass der Akteur Translation bücher für spezielleres Vokabular verwendet. Die MT-Engine analysiert die gram- deutlich erkennbar ist. In vielen Redak (RBMT) matischen Bestandteile des Ausgangstexts, übersetzt diese mit Hilfe hinterlegter tionsleitfäden und auch Richtlinien zum Wörterbücher und fügt die übersetzten Bestandteile nach den grammatischen Regeln der Zielsprache wieder zusammen. verständlichen Schreiben wird deshalb auf die Verwendung von Aktiv oder imperati Neuronal NMT basiert auf einem künstlichen neuronalen Netzwerk. Es lernt, Muster in Texten vischem Infinitiv hingewiesen. Dennoch Machine zu erkennen. Die MT-Engine generiert Übersetzungen, vergleicht diese wiederholt werden Sätze auch im Passiv formuliert. Aus Translation mit Referenzmaterial und „lernt“ somit, zu übersetzen. Grundlage dafür ist ein Re- (NMT) gelsatz, der auf statischen und phrasenbasierten Auswertungen beruhen kann. Sicht der Technischen Redakteurin oder des Im Vergleich zum SMT kann das NMT bereits mit weniger Wörtern trainiert werden, Redakteurs müssen durch Passivkonstruk um gute Ergebnisse zu erzielen. tionen nicht zwangsläufig Probleme ent stehen. Die Konstruktionen können in der tab. 01 quelle Michael Born deutschen Sprache grundsätzlich funktio nieren und die Aussage des Akteurs bleibt > redundanzfrei verfasst werden. Das tekom- Kontext zu erkennen, so dass ein Wort als erhalten. Dennoch „drückt“ sich die Pas Regelwerk schlägt für eine redundanzfreie alleinstehende Sinneinheit betrachtet wird. sivkonstruktion vor einer Aussage über den Gestaltung vor, auf unnötige Wiederholun Bei Wörtern, die je nach Verwendung un Handelnden. gen in den Zwischenüberschriften zu ver terschiedliche Formen haben können, kann Natürlich können Definitionen in Style- zichten. Im Alltag kann eine redundanzfreie es zu Fehlern kommen wie: „Leiter“ als Wort Guides für die Übersetzung, etwa „Hand Konstruktion funktionieren und zu einem für eine Führungsebene, einen Gegenstand lungsanweisungen im Passiv sind im Ak besseren Leseverständnis führen. Jedoch oder ein leitendes Bauteil. tiv zu übersetzen“, oder durch Rückfragen ist die Wiederholung des Bezugs zum ei Zudem müssen Wörter, deren Singular des Übersetzers das Problem lösen. Jedoch gentlichen Objekt für die MÜ und auch für und Plural identisch sind (zum Beispiel „Pa funktioniert dies nur, wenn ein Mensch den den Leser zwingend erforderlich. Denn in rameter“ oder „Reinigungsmittel“), durch Satz übersetzt. Bei der Maschinellen Über vielen Sprachen ist es nur so möglich, die Bezugswörter oder Artikel genauer defi setzung wird ein Passivsatz selbst dann in Bedeutung zu erhalten, ohne an Verständ niert werden, auch wenn der Stil darunter der gleichen grammatischen Form über lichkeit einzubüßen. Einträge mit nur ei leidet. Betrachtet man das Beispiel in Tabel nommen, wenn eigentlich eine aktive An nem Wort lassen der MÜ viel Interpretati le 03, wird die Problematik deutlich. Durch weisung gemeint ist. Die Folge ist eine fal onsspielraum. Sie ist nicht in der Lage, den das Weglassen von „Steuerung“ in den Zwi sche Übersetzung oder weiterhin ungewisse Beispiel DeepL (DE-EN/EN-DE) Google (DE-EN/EN-DE) Windows installieren Install Windows / Windows installieren Install Windows / Installieren Sie Windows Installation von Windows Installing Windows / Installation von Windows Windows installation / Windows-Installation tab. 02 quelle Michael Born tekom-Regel Regel für Maschinelle Übersetzung Steuerung Steuerung 1.1 Parameter der Steuerung (Plural oder Singular? Was für ein Parameter?) 1.1 Die Parameter der Steuerung 1.2 Programmierung der Steuerung 1.2 Programmierung der Steuerung 1.2.1 Bibliotheken der Steuerung einbinden (Was für eine Bibliothek?) 1.2.1 Bibliotheken der Steuerung einbinden 1.2.2 Menüsteuerung der Steuerung abbilden 1.2.2 Menüsteuerung der Steuerung abbilden tab. 03 quelle Michael Born 02/20
Schwerpunkt 15 Beispiel DeepL (DE-EN) Google (DE-EN) Nach der Installation erfolgt der Neustart After the installation the computer is restarted. After the installation, the computer is restarted. des Rechners. Den Rechner nach der Installation neustarten. Restart the computer after installation. Restart the computer after the installation. tab. 04 quelle Michael Born Aussage. Im Vergleich zu generischen MÜs Anwendung optimiert und eingeschränkt zu steuern. Bei jeder Einschränkung sollte zeigt sich zudem: Sätze im Passiv, wenn die werden. So lassen sich Redewendungen, genau geprüft werden, ob diese sich wirklich Maschinelle Übersetzung über keinen do einzelne Wörter und andere Satzstrukturen eignet, die Ergebnisse zu verbessern. Nicht mainspezifischen Datenbestand verfügt, besser steuern. Es kann sinnvoll sein, sich jede Festlegung macht das automatisch. liefern vermehrt falsche Ergebnisse. Da bei zwei Phrasen, die synonym zueinander her können die Richtlinien zur Formulie sind und in vielen Sprachen gleiche oder Was passiert mit Abkürzungen? rung von Anweisungen in der Technischen ähnliche Übersetzungen liefern, auf eine Viele Texte in der Technischen Dokumenta Dokumentation im Aktiv oder imperativi Version zu einigen. Beispiele zeigt Tabelle tion verwenden Abkürzungen und Akrony schem Infinitiv auch in Bezug auf die Über 05, Seite 16. me, um Wörter, die öfter wiederholt werden, setzung durch ein MT nur bestätigt werden Durch die Definition von Sprachmus zu verkürzen und so den Text nicht unnö (tab. 04). tern und Wörtern für das automatische tig zu verlängern. Allerdings können Abkür Neben der Definition der grammati Post-Editing (APE), eine Vorkorrektur der zungen und Akronyme ein großes Problem schen Formen und deren Anwendung ist es übersetzten Texte unter anderem durch ein für die Maschinelle Übersetzung darstel sinnvoll, auch die Verwendung von Formu Glossar, kann kontrolliert werden, welche len. Das ist besonders dann der Fall, wenn lierungen und Wörtern zu definieren, um Übersetzungen im Zieltext genutzt werden es sich um kundenspezifische Abkürzun die individuelle Sprache der Redakteure bes sollen. Dieser Vorgang läuft unabhängig von gen oder Akronyme handelt. Je nachdem, ser zu kontrollieren und Inkonsistenzen zu der Maschinellen Übersetzung ab und kann mit welcher Art von Datensatz mit der MÜ vermeiden. Ähnlich wie bei Kontrollierter selbst bei generischen MÜ-Inhalten dabei gearbeitet wird, sind andere Interpretatio Sprache können Sprachmuster für die MÜ- helfen, die Übersetzungsergebnisse besser nen möglich. Regelwerke, wie etwa von der > Wir digitalisieren Verstehen. Redaktionssystem TIM und Informationsplattform Sherlock – die Lösungen für Content Delivery and more tekom-Frühjahrstagung 2020, Stand 24 sherlock www.fischer-information.com
16 Schwerpunkt Beispiel DeepL (DE-EN) Google (DE-EN) „stromlos“, „freigegeben“ oder „aktiviert“ bedeuten. Dem Fachanwender wird im Achten Sie darauf, … Make sure… Be sure to … Kontext deutlich, welche Bedeutung ge Ensure that … Take care … meint ist und dass es sich bei einer „frei Pay attention … Be sure … geschalteten Maschine“ nicht um eine Stellen Sie sicher, … Make sure … Make sure … „aktivierte Maschine“ handelt. Bei der Ma Ensure that … schinellen Übersetzung und auch durch ei Be sure … nen Humanübersetzer können diese Wör tab. 05 quelle Michael Born ter zu einem falschen Ergebnis führen, wenn der Zusammenhang nicht ersichtlich ist. Ta belle 07, Seite 18, zeigt dies anhand von Bei > tekom, empfehlen deshalb nur bekannte Ab anderes Beispiel ist die Verwendung engli spielübersetzungen mit DeepL und Google. kürzungen zu verwenden oder Wörter sinn scher Akronyme, die zwar im Text einmalig Beide MTs interpretieren den Zusammen voll zu kürzen. ausgeschrieben werden, zum Beispiel „In hang von „freigeschaltet“ anders. Die erste Bei der MÜ sollten Abkürzungen und ternet of Things (IoT)“. Im späteren Textver richtige Übersetzung entsteht, neben meh Akronyme möglichst komplett vermieden lauf treten sie aber nur noch als Abkürzung reren Fehlinterpretationen, durch die Bezie werden. Es lässt sich nur schwer sicher auf. Ein themenfremder Leser oder eine Ma hung zu „Maschine“. Die Empfehlung wäre stellen, dass die MÜ eine Abkürzung rich schinelle Übersetzung können schnell den hier, dass die Anwendung von Benennun tig erkennt. Im Zweifel wird die Abkürzung Bezug verlieren und ordnen der Abkürzung gen, die mehrere Interpretationen zulassen, nicht übersetzt. Bei Akronymen, die auf womöglich keine oder eine falsche Bedeu genauer gesteuert werden muss. sprachspezifischen Wörtern basieren, wie tung zu. Wenn also ein Wort bereits eine Be etwa „HW“ für „Heißwasser“ oder „Hard Ähnlich verhält es sich mit Abkürzungen deutung hat, aber in einem anderen Kon ware“ oder „KW“ für „Kaltwasser“ oder wie „Mod.“ für Modus, Module oder Modi text eine andere Bedeutung haben kann, so „Kalenderwoche“, würde die unveränder fikation. Im Zweifelsfall werden sie von der sollte für den anderen Kontext eine andere te Übernahme in die Zielsprache den Le Maschinellen Übersetzung falsch oder gar Benennung gefunden oder die Bedeutung ser verwirren. Schließlich versteht er keine nicht erkannt und gelangen in einer Form umschrieben werden. Wenn die MÜ eine Abkürzungen, die nicht aus seiner Sprache in die Übersetzung, die niemand will. Bei Glossarfunktion oder ein automatisches stammen. Oder er verbindet die Abkürzung kundenspezifischen Abkürzungen und Ak Post-Editing hat, ist die Anpassung umso falsch wie Hardware statt Heißwasser. Ein ronymen ist bei generischen MÜs ebenso notwendiger. Die Maschine tauscht in die keine Garantie gegeben, dass die Überset sem Fall häufig nur Wort A durch die Über zung gelingt. setzung A aus und missachtet den Kontext. Daher ist es wichtig, mit Abkürzungen Zudem können je nach Art der MÜ (gene oder Akronymen, wenn diese unbedingt risch oder domainspezifisch) leichtere oder benötigt werden, sparsam umzugehen. Es strengere Vorgaben nötig sein. Es sollte gilt, genau zu definieren, welche die Techni aber bedacht werden, dass die Anwendung sche Redaktion verwenden darf und welche nicht immer MÜ-übergreifend möglich sein nicht. Die Entscheidung sollte auch anhand könnte. des Datenbestandes der Maschinellen Über setzung getroffen werden (tab. 06). Sind die Texte fehlerfrei? Rechtschreibung und Interpunktion sind in Wie viele Bedeutungen? vielen Redaktionsleitfäden bereits zur Genü In vielen Sprachen ist die richtige Benen ge behandelt worden. Orthografische Kor nung wichtig, damit der Leser des Textes rektheit hingegen bekommt bei der Maschi auf Anhieb versteht, was gemeint ist. Jedoch nellen Übersetzung nochmals eine höhere kann ein Wort in einer Sprache mehrere Be Bedeutung. Eine fehlerhafte Interpunktion deutungen haben, die erst durch den jeweili kann bewirken, dass ein Satz nicht richtig gen Kontext konkretisiert werden. Oft wird von der MÜ gelesen werden kann. Ein Bei diese Variation innerhalb der Technischen spiel sind fehlende Kommas bei der Tren Redaktion durch vorgeschriebene Termino nung einzelner Satzteile. Die MÜ erschließt logie verhindert. Dort wird darauf geachtet, sich in so einem Fall eine eigene Interpreta dass ein Wort nur eine Bedeutung haben tion und ordnet die einzelnen Textteile ent kann oder sollte. Auch die tekom empfiehlt sprechend zu. Das kann dazu führen, dass dieses Vorgehen [1]. Dabei geschieht die Nebensätze nicht richtig erkannt und Satz eindeutige Definition der Benennungen nur teile zusammengezogen werden. Als Folge auf Kunden- oder Projektebene. Das führt wird ein falscher Zusammenhang der Satz dazu, dass dem in anderen Kontexten bereits teile ermittelt. definierten Wort eine andere Bedeutung zu Dies ist auch der Fall, wenn die Satzzei kommen kann. chen nicht nur im Satz falsch gesetzt wer Das Wort „freigeschaltet“ zeigt die Pro den, sondern auch am Satzende. Bei Sätzen blematik. Je nach Bezug des Wortes in mit ähnlichen Strukturen, die zum Beispiel der Technischen Dokumentation kann es auch in Überschriften vorkommen können 02/20
Schwerpunkt 17 Abkürzung (DE) Bedeutung Google (EN) DeepL (EN) figsten vorkommt und statistisch am wahr scheinlichsten das richtige Ergebnis liefert. hW bzw. HW Heißwasser, Hauptwagen, HW, Hardware, HW, LC, TC, UH, SW, UW, UC, Ähnlich verhält es sich auch bei fehlen Heizwerk, Hektowatt, FW, hW Hardware, hW … Handelsware den Bindestrichen, etwa bei „ein und aus schalten“. Ein Mensch erkennt hier die Be Mod. Modus, Modul, Mod. Mod, Mod., Modification deutung „einschalten und ausschalten“. Für Modifikation ein Übersetzungssystem kann der fehlende Bindestrich hinter „ein“ dazu führen, dass tab. 06 quelle Michael Born das Wortfragment nicht zusammen mit „-schalten“ erkannt wird und somit nur als „ein“ in einem beliebigen Kontext gedeutet (Subjekt + Verb), ist es möglich, dass Sätze zung durch einen Menschen erfolgt. Die Ge wird (tab. 08, s. 18). Damit die MÜ sol nicht als solche übersetzt werden, wenn der fahr von Übersetzungsfehlern ist gering. Die che Sätze versteht, müssen Worteinheiten abschließende Punkt fehlt. MÜ geht die Wörter, Zeichen oder Phrasen entweder zusammen oder mit Bindestrich Normalerweise werden solche Fehler jedoch gerade bei statistischen Verfahren geschrieben werden, wobei die Variante spätestens bei der Übersetzung erkannt, hin nacheinander durch und wählt die Option, „einschalten und ausschalten“ eindeutiger terfragt und korrigiert, solange die Überset die im Datensatz in dieser Folge am häu wäre. > en Besuch der auf Sie uns hjahrs- Frü tekom- 2020 tagung rg an bu in Würz 11 Stand AUTOMATISIERUNG IST ALLES! In der eigenen Redaktion – Außerhalb der Redaktion – Mit anderen Systemen Mit dem Workflow Designer und der Workflow Automation Library für SCHEMA ST4
18 Schwerpunkt Benennung (DE) Bedeutung Google (EN) DeepL (EN) Freigeschaltet stromlos, aktiviert, freigegeben activated activated enabled enabled unlocked unlocked switched on released Freigeschaltete Maschine stromlos unlocked machine (falsch) unlocked machine (falsch) activated machine (falsch) disconnected machine (richtig) connected machine (falsch) released machine (falsch) tab. 07 quelle Michael Born Beispiel Google (DE-EN) Beispiel DeepL (DE-EN) Google (DE-EN) Öffnet die Sicht, in der der Opens the view in which the Ansicht Öffnen Open view Open view Benutzer die erforderlichen user can the necessary drives Ansicht „Öffnen“ Open View View “Open” Antriebe ein und ausschalten on and off. (ungenau) kann. tab. 09 quelle Michael Born Öffnet die Sicht, in der der Opens the view in which the Benutzer die erforderlichen user can switch the required Antriebe ein- und drives on and off. (genauer) ausschalten kann. tab. 08 quelle Michael Born > Je klarer die Bezüge sind, umso höher ist die nungen bzw. Tags agiert die MÜ ähnlich wie Auch wenn das Regelwerk der tekom die Wahrscheinlichkeit, dass MÜ die Informa ein CAT-Tool. Das heißt, dass die MÜ nur Auszeichnung von GUI in Überschriften tion richtig erkennt. Ansonsten werden die Auszeichnungen erkennen kann, die ihr be durch Anführungszeichen ablehnt, sollte Wörter so übersetzt, wie sie im Datenbe reits geläufig sind. diese Maßnahme bei Maschineller Überset stand gefunden und entsprechend interpre Unbekannte Auszeichnungen hingegen zung überlegt werden. So lässt sich in Über tiert werden können. Doch selbst wenn die sorgen für eine falsche Interpretation von Zu schriften der Bezug zu einem GUI besser korrekte Schreibweise beachtet wird, beste sammenhängen, da Sätze entweder getrennt erkennen, selbst wenn die sonstigen Aus hen weiterhin Risiken. Je nach Umfang des gelesen oder Auszeichnungen ignoriert wer zeichnungs-Tags nicht bekannt sind. Bei der Datenbestandes und der Anzahl an Erwäh den. In Tabelle 09 kann durch die fehlende Endkontrolle müssen maximal die Tags von nungen bestimmter Konstruktionen pas Auszeichnung das Wort „Öffnen“ fälschlich Hand an die richtige Stelle im Satz verscho siert es, dass Kombinationen aus Wörtern zusammen mit „Ansicht“ gelesen werden. ben werden (tab. 09 und 10, s. 20). noch nicht vorliegen. Wenn sie nicht rich So handelt es sich nicht um die Ansicht mit tig erkannt werden, sollte man prüfen, ob es dem Namen „Öffnen“, sondern eine Anwei Was ist zu tun? sich um Wortneuschöpfungen handelt, die sung zum Öffnen der Ansicht. Die Liste möglicher Probleme, die bei Tech in den Datenbestand aufgenommen werden Werden Auszeichnungen nicht von der nischer Dokumentation und Maschineller müssen. Alternativ kann es sich um Kombi MÜ erkannt, dann zeigt sich das auch dar Übersetzung auftauchen können, lässt sich nationen handeln, die etablierte Varianten an, dass Tags an den Anfang oder das Ende weiter ausführen. Denn es wird immer eine ersetzen. Möglicherweise müssen die Kom des Satzes verschoben werden (tab. 10, s. 20). Thematik geben, die Schwierigkeiten berei binationen verboten werden, um die Quali Die MÜ ignoriert die Auszeichnungen und tet und besser abgestimmt werden könnte. tät zu halten. übersetzt die entsprechenden Stellen so, als Es zeigt sich aber auch, dass Regeln für die handle es sich um „normale“, nicht ausge Maschinelle Übersetzung nicht von heute Sind Auszeichnungen verständlich? zeichnete Wörter. So ist die richtige Erken auf morgen erstellt, geschweige denn uni Unabhängig davon, ob ein TMX-Editor, Ad nung von Auszeichnungen in der Software- versal festgelegt werden können. Viele Re obe FrameMaker, Madcap Flare oder ein an dokumentation wichtig, da zitierte Begriffe geln, die für das verständliche Schreiben deres Autorensystem verwendet wird: Texte der Softwareoberfläche (GUI) schnell mit definiert wurden und sich vorrangig an die werden ausgezeichnet, um Sätze oder Wör allgemeinen Begriffen verwechselt werden Leserin oder den Leser wenden, können teil ter hervorzuheben. Der Redaktionsleitfaden können. In diesem Fall sollte geprüft werden, weise auch für die Maschinelle Übersetzung oder auch die tekom-Publikation stellt Re welche Auszeichnungen von der Maschinel gelten. Doch sprachliche Sonderfälle, die ein geln zur Auszeichnung von Texten bereit. len Übersetzung erkannt werden können und Mensch ohne Probleme versteht, sind bei Jedoch sollten für die Maschinelle Überset welche nicht. Dadurch lässt sich der Umfang der Maschinellen Übersetzung unvorherge zung einige Regeln erweitert werden. Sys an Auszeichnungen ermitteln, die zu verwen sehene Hürden. Für die Maschinelle Über teme für die Maschinelle Übersetzung sind den oder auszuschließen sind. Eine andere setzung sollte in der Technischen Dokumen heute schon so mächtig und können viel Möglichkeit wäre die Kennzeichnung, zum tation von Fall zu Fall überlegt werden, ob seitig eingesetzt werden. Beim Lesen eines Beispiel mit Anführungszeichen zur Unter für bestehende Regeln eine Gültigkeit gege Textes und der darin enthaltenen Auszeich stützung der Tag-Auszeichnung. ben wird oder eine Anpassung oder Neufor > 02/20
20 Schwerpunkt Beispiel SDL Beglobal Den Hauptschalter USV in Position Turn the UPS main switch to the OFF position, OFF drehen, mit einem Vorhängeschloss sichern und ein lock it with a padlock and attach a sign. Hinweisschild anbringen. tab. 10 quelle Michael Born > mulierung nötig ist. Durch die Fortschritte Wird aber der Aufwand gescheut, inkonsis ßeren Regelwerken ist grundsätzlich zu prü bei der Neuronalen Maschinellen Überset tente oder missverständliche Ausdrücke in fen, ob eine Anpassung erfolgen sollte oder zung und Künstlicher Intelligenz könnte der Technischen Dokumentation zu redu nicht. Schließlich werden dadurch andere man meinen, die Anpassung von Regeln sei zieren, wird sich die Qualität der Überset Regeln beeinflusst oder eine Verbesserung nicht nötig. Schließlich werden die Systeme zungen verschlechtern. Das kann ebenso bei verfehlt. mit größeren generischen und angepassten der Übersetzung mit einem Translation-Me Gerade der Anspruch, bestehende und Datensätzen trainiert, wodurch verständli mory-System passieren. neue Regeln zu prüfen und zu validieren, che und richtige Übersetzungen entstehen Es gilt immer zu prüfen, ob eine Regel macht es interessant, sich mit den Entwick könnten. Doch der Eindruck trügt. Überset anpassung für jede Textart sinnvoll ist. lungen bei der Maschinellen Übersetzung zungsfehler in der Zielsprache werden meist Einzelne Regeln werden unabhängig von zu beschäftigen. Es gilt zu analysieren, wie erst von Muttersprachlern erkannt und auch Fachgebiet, Textart oder Adressat in ver sich einzelne Systeme bei verschiedenen nur dann, wenn die auszuführende Hand schiedenen Bereichen anwendbar sein und Textarten verhalten. Das Ziel ist, dass in lung keinen Sinn ergibt. zur Übersetzungsqualität beitragen. Es ist Zukunft Texte möglich sind, die sowohl für Weil in der Maschinellen Übersetzung aber auch möglich, dass bestehende Regeln den Menschen als auch für die Maschine ge große Datensätze genutzt werden und für Maschinelle Übersetzungssysteme nicht schrieben werden können. Künstliche Intelligenz zum Einsatz kommt, genutzt werden können, da die Bedeutung literatur zum beitrag ist es wichtig zu prüfen, wie das Überset des Ausgangstextes zu sehr verfälscht wird. [1] tekom (Hrsg.) (2013): Regelbasiertes Schreiben – zungssystem mit den vorhandenen und zu Oder ein Text benötigt mehr sprachliche Deutsch für die Technische Kommunikation. künftigen Daten effizient umgehen kann. Freiheiten, etwa für das Marketing. Bei grö 2. erweiterte Auflage
Sie können auch lesen