MT im Übersetzungsprozess mit zusätzlichem Kunden-Mehrwert - Szenario für einen sanften Einstieg
←
→
Transkription von Seiteninhalten
Wenn Ihr Browser die Seite nicht korrekt rendert, bitte, lesen Sie den Inhalt der Seite unten
Inhalt unseres Vortrags Kurzvorstellung Maschinelle Übersetzung – Einsatzzwecke, Anspruch und Wirklichkeit Herausforderungen für einen (deutschen) Übersetzungsdienstleister Best Practices und zeitlicher Ablauf einer MT- Einführung Zusätzlicher Mehrwert durch MT-Einsatz
Kurzvorstellung - Christine Bruckner Diplom-Übersetzerin, Aufbaustudium Computerlinguistik Langjährige Erfahrung im Bereich CAT, MT, Terminologiesysteme in Sprachendiensten Seit 2014: Leiterin Technical Services bei [itl]
Kurzvorstellung – CrossLang Unabhängige Berater und Systemintegratoren Spezialisiert auf Übersetzungstechnologie Seit 2002 in Gent, Belgien Unternehmensberatung Lösungen Sprach-Audits Translation Management-Systeme Pilotprojekte und Proof of Concept Terminologie-Management Programm-Management Maschinelle Übersetzung (MT) 6 18.11.2015
Maschinelle Übersetzung - Definition Machine translation (MT) is the application of computers to the task of translating texts from one natural language to another. One of the very earliest pursuits in computer science, MT has proved to be an elusive goal, but today a reasonable number of systems are available which produce output which, if not perfect, is of sufficient quality to be useful in a number of specific domains. (http://www.eamt.org/mt.php) „klassische“ regelbasierten MT-Systeme (RBMT) statistische maschinelle Übersetzungssysteme (SMT)
Maschinelle Übersetzung – Typische Einsatzzwecke Inhaltserschließung fremdsprachiger Texte (Gisting) interne mehrsprachige Kommunikation Veröffentlichung von Inhalten in anderen Sprachen: Temporäre/benutzergenerierte Inhalte Support-Seiten, Blogs, Chats, usw. Inhalte mit hoher Außenwirkung Marketing-Broschüren; Produktkataloge, Betriebsanleitungen, usw. Unterschiede in Anforderungen an Verwendbarkeit Qualität des MT-Outputs
Maschinelle Übersetzung – Fakten und Prognosen Verstärktes Interesse an / Zugänglichkeit von MT durch Globalisierung Big Data Open-Source-/Do-it-Yourself-Lösungen Cloud-basierte MT-Lösungen MT-Förderung durch (zwischen-)staatliche Programme Prognose: MT-Markt wird $983,3 Millionen bis 2022 erreichen Großer Marktanteil für Elektronik- und Automobilbranche prognostiziert Steigender Marktanteil für Gesundheitsbereich in den nächsten 6 Jahren
Mehrsprachige Kommunikation in der heutigen Zeit Vielzahl an Sprachen, ständig steigendes ↔ Knappheit an Budget, Ressourcen und Zeit Volumen an Daten und Inhalten
Die MT-Realität auf dem deutschen Markt Beobachtungen aus LSP-Sicht: wenig Interesse bei Kunden aus dem Bereich mittelständischer und großer Unternehmen im deutschsprachigen Markt Kaum Fallbeispiele für MT-Einsatz bei deutschen LSPs
1 Vielfalt Viele Branchen Viele Fachgebiete (Domains) Viele Sprachpaare Viele Content-Typen Viele Projekttypen
2 MT-Verkaufsargumente Große Versprechungen von statistischer maschineller Übersetzung (SMT) "Moses-Hype" Do-it-Yourself-Lösungen
3 Mangel an Transparenz Kostenmodell Wissen
Qualität Zwecktauglichkeit (fit for purpose) Anwendungsszenario
Wenn es MT ist, dann muss es schlecht sein? Vorbehalte gegenüber MT Unbekanntem wird misstraut Einfach ein weiteres Tool Kommunikation Abrechnungsmodelle für Post-Editing
MT-Stolpersteine auf deutschem Markt mangelnde Kenntnisse über Chancen und Risiken bei MT-Einsatz Unklarkeiten bei Abrechnungsmodellen Skepsis und Ablehnung vieler Übersetzer gegenüber MT/Post- Editing Fehlen von kommerziellen MT-Lösungen für DE→alle kundenrelevante Zielsprachen mangelnde Verfügbarkeit von kunden-/domänenspezifischen zweisprachigen Daten mit Ausgangssprache Deutsch oft: Fehlen von validierten Kunden-Terminologiebeständen oft: unzureichende sprachliche Eignung der zu übersetzenden Quelldaten
Deutscher Beispielskunde – Ausgangssituation für MT-Einsatz Quellsprachen-Problematik Quellsprache für Übersetzung üblicherweise Deutsch In einigen Fällen Quellsprache Englisch: durch Nicht-Muttersprachler erstellt, keine Autorenunterstützung im Einsatz Autorenunterstützungs-Tool bei “echten” deutschen Texten (noch nicht umfassend eingesetzt/befüllt) Zielsprachen für (publikationsreife) Übersetzung Prio 1: EN/DE, FR, IT , ES, CS, PL, RU, NL, SE Prio 2: PT, SL, HU, CN, TR, RO, SK, FI Terminologie Listen vorhanden; noch nicht vom Kunden validiert Vorhandene Translation Memories Aktuelle TMs mit 2.000 – 20.000 Übersetzungseinheiten Alte Referenz-TMs vorhanden; schlechte Qualität
Deutscher Beispielskunde – Anforderungen an die MT-Lösung MT-Anwendungsszenarien: 1. Integration in TM-Tool-basierten Übersetzungs-Workflow bei LSP 2. “Gisting” für Unternehmensmitarbeiter Wichtigste Sprachen: Englisch, Deutsch Anforderungen an die technische Lösung: Performanz und Sicherheit: Hosting auf deutschem Server Skalierbarkeit; künftige Nutzung an anderen Kundenstandorten Anpassbarkeit der MT-Engines
Herausforderungen für einen Übersetzungsdienstleister Welche MT-Technologie? Wer passt wie und womit die MT-Engines an? Wie integrieren wir MT in den Übersetzungs-Workflow? Wie bringen wir MT unseren Übersetzern bei? Kostenersparnis Welche Investitionen kommen auf uns/den Kunden zu? Welche Einsparungen und Produktivitätssteigerungen sind realistisch? Produktivität … Qualität “For most [LSPs], the successful implementation of MT represents a huge leap and long-term investment in resources and expertise before return on investment becomes apparent.” (GALAxy Newsletter Q2 2015) Kooperation zwischen LSP und MT-Beratungs- und Integrationspartner
MT-Erfolgsfaktoren Qualität Integration ROI
MT-Erfolgsfaktoren und MT-Ansatz Evaluierung ROI Auswahl Linguistische Performanz • Kontinuierliche Projekt- Parameter Optimierung Anpassung • Skalierbarkeit Parameter Text- Linguistisches Engineering Engineering • Sprach- spezifische • Gezielte Verbesserung Roll-out & Integration en je nach Anpassungen Content-Typ Nutzer-Anleitung und Wissenstransfer Akzeptanz • Programm- • Change Management • Schulungen Management • nutzer- Training orientierte Evaluierung Linguistische Business Kontinuierliche Expertise Expertise Integration Optimierung; Wartung Operative Parameter
„In-Kontext“-Evaluierung 1. Linguistische Qualität Qualität 3. 2. Produktivität Verwendbarkeit 24 18.11.2015
Evaluierungsparameter für MT-Output 1. Linguistische Qualität Qualität 3. 2. Produktivität Verwendbarkeit
Ziele der MT-Evaluierung Allgemeine Ziele: Bezogen auf Beispielskunde: Ermitteln der produktivsten MT-Engine Für Sprachrichtung Englisch→Deutsch Regelbasiertes MT-System 1 Statistisches MT-System Regelbasiertes MT-System 2 Ermitteln der produktivsten Ressourcen 3 Evaluierer, davon 2 „echte“ Übersetzer Ermitteln von objektiven Kriterien für Höhe des Abzugs für MT-Segmente in TM-Analyse Preismodelle Bezahlung für „No-Matches“ Ermitteln von relevantem Material für Feedback von Übersetzern bezüglich: Post-Editing-Schulungen Bereitschaft zu Post-Editing Einschätzung des Nachbearbeitungsaufwands
Projektparameter für Beispielskunde Umfang des Evaluierungs-Datensets: 5155 Wörter Neuübersetzung (35%) 100 % Matches (5%) Regelbasiertes MT-System 1 - Post-Editing (20 %) Statistisches MT-System - Post-Editing (20 %) Regelbasiertes MT-System 2 - Post-Editing (20 %)
Produktivitätsergebnisse (Wörter pro Stunde) 2500 2000 1500 1000 500 0 Full matchvonreview Überarbeitung 100 %-Matches Systran RBMT-1 MT post-editing Post-Editing SDL SMT-1 BeGlobal MT post-editing Post-Editing Lucy RBMT-2 MT post-editing Post-Editing Translation from scratch Neuübersetzung Informant 1 Informant 2 Informant 3
Produktivität – Steigerungen/Verschlechterungen 100% 80% 60% 56% 54% 40% 29% 25% 20% 0% RBMT-1 Post-Editing SMT-1 Post-Editing RBMT-2 Post-Editing Systran MT post-editing SDL BeGlobal MT post-editing Lucy MT post-editing -8% -7% -9% -20% -16% -23% -40% Informant 1 Informant 2 Informant 3
Zwei MT-Anwendungsszenarien in der Pilotphase Plugin für TM-Tools Web-Portal für Gisting
Zusätzlicher Kunden-Mehrwert durch MT-Einsatz Einführung bzw. Optimierung von Terminologieprozessen beim Kunden Einführung von Terminologielösung/-gremien verstärktes Bewusstsein über die Notwendigkeit konsistenter und übersetzungsgerechter Quelltexte beim Kunden Einführung von Autorenunterstützungs-Tools Konsolidierung vorhandener Datenbestände in TM- und CMS- Systemen Einsatz der MT-Lösung auch auf Kundenseite für unternehmensinterne Kommunikationszwecke möglich
Empfehlungen Erst testen, dann implementieren Konkreten Anwendungsfall/konkretes Sprachpaar als Ausgangspunkt nehmen Klein anfangen und in kleinen Schritten wachsen Gute Kommunikation und Einbeziehen aller Beteiligten ist enorm wichtig
Danke für Ihre Aufmerksamkeit! https://www.youtube.com/watch?v=wIK0JKTQcI8 christine.bruckner@itl.eu heidi.depraetere@crosslang.com
Ihre Meinung ist uns wichtig! Sagen Sie uns bitte, wie Ihnen der Vortrag gefallen hat. Wir freuen uns auf Ihr Feedback per Smartphone oder Tablet unter http://LOC22.honestly.de oder scannen Sie den QR-Code Das Bewertungstool steht Ihnen auch noch nach der Tagung zur Verfügung!
Sie können auch lesen