Der Trend

Unternehmen und Lieferanten sind permanent auf der Suche nach Möglichkeiten, noch schneller, noch effizienter, noch kostengünstiger zu produzieren. Maschinelle Übersetzungsprogramme (MÜ-Programme), die in früheren Jahren fast ausschließlich regelbasiert waren, haben lange ein Schattendasein gefristet. Erst mit der Verbreitung statistischer Verfahren nahm die Qualität maschinell erstellter Übersetzungen deutlich zu und brachte MÜ als Produktionsalternative auf den Plan. Bis heute ist MÜ als selbstständiges Produktionsverfahren für die Übersetzung technischer Dokumentation noch verhältnismäßig wenig verbreitet. Es wird entweder zu Informationszwecken für den internen Gebrauch oder in Verbindung mit Post-Editing für die Veröffentlichung gewisser Informationen (z. B. im Bereich technischer Support oder bei stark standardisierten Informationen) verwendet.

MÜ im CAT-Tool

Relativ neu ist aber die Integration von MÜ in Translation-Memory-Systeme. Maschinelles Übersetzen ist dadurch kein separater Prozess mehr, sondern erfolgt zeitgleich mit der Humanübersetzung im Übersetzungseditor. Sobald das Translation-Memory keinen passenden Vorschlag für eine Übersetzung findet, springt das integrierte maschinelle Übersetzungssystem ein und unterbreitet dem Übersetzer einen Vorschlag. Diesen Vorschlag kann der Übersetzer übernehmen oder ändern und anschließend bestätigen. Inzwischen bieten fast alle bekannten Translation-Memory-Systeme die Integration von Modulen für maschinelles Übersetzen an. Das fängt bei führenden Technologien wie SDL Studio an und endet bei kostenlosen Programmen wie Wordfast Anywhere. Die integrierten maschinellen Übersetzungsmodule sind teils eigene Entwicklungen (Beispiel SDL Language Cloud), teils öffentliche Technologien wie Google Translate.

HÜ und MÜ verwischen

Die frühere klare Trennung zwischen humanem und maschinellem Übersetzen ist nun nicht mehr vorhanden. Zwar sind maschinell vorgeschlagene Segmente in der Regel mit einem entsprechenden Attribut versehen, aber sie werden aufgrund des enormen Zeitdrucks oft nicht gleich vom Übersetzer oder Lektor als solche erkannt und behandelt. Dieser schleichenden Verbreitung von maschinell übersetzten oder angepassten Segmenten in Übersetzungen wurde bisher noch wenig Beachtung geschenkt, obwohl sie auf mittlere Sicht Folgen für die Qualität der Übersetzungen und Translation-Memorys hat.

Das Problem mit der Vertraulichkeit

Es ist also an der Zeit, Strategien für den Umgang mit maschinell übersetzten Segmenten zu entwickeln. Zuerst einmal geht es um die Vertraulichkeit der Daten. Kein Unternehmen kann ein Interesse daran haben, dass vertrauliche Informationen einfach an öffentliche Maschinen wie Google geschickt werden. Dies sollte auf jeden Fall im Vertrag zwischen Übersetzer und Auftraggeber geregelt sein.

Andere Fehlerarten

Der nächste Punkt betrifft die Art von Fehlern, die ein maschinelles Übersetzungsprogramm macht. Auch Maschinen machen Fehler, aber sie unterscheiden sich von den Fehlern, die ein Übersetzer macht. Die maschinellen Fehler betreffen folgende Aspekte:

Stil: Die meisten angewandten MÜ-Programme sind schwerpunktmäßig statistisch basiert, auch wenn sie einige Regeln verwenden, um die Ergebnisse aus der Statistik zu optimieren. Das führt dazu, dass der Satzbau sich sehr stark am Original anlehnt. Die Übersetzungen sind nicht immer falsch, klingen aber sehr wörtlich. Beispiel:

Deutsch Humanübersetzung Maschinelle Übersetzung
In der Datei %1 im Verzeichnis %2 werden die folgenden Schlüssel benötigt: The following keys are required in the file %1 in the directory %2: in the file %1 in the directory %2 the following keys will be required:

Kontexterkennung: Sprachen sind nicht exakt und lassen noch viel Raum für Interpretationen. Besonders bei Verben und Wörtern der Alltagssprache spielt der Zusammenhang eine große Rolle. Der Mensch erkennt diesen Zusammenhang mühelos, aber MÜ-Programme haben immer wieder ihre Schwierigkeiten damit:

Deutsch Humanübersetzung Maschinelle Übersetzung
Markieren Sie den Parameter %1. Select the parameter %1. highlight the parameter %1.

Vollständigkeit und Grammatik: Bei statistischen Verfahren zerlegen MÜ-Programme Sätze in Wortgruppen. Für jede Wortgruppe sucht das Programm den besten Match in seiner indizierten zweisprachigen Datenbank. Es kommt durchaus vor, dass der statistisch bessere Match zusätzliche Wörter enthält bzw. dass Wörter fehlen und unter Umständen auch grammatikalisch mit den anderen gefundenen Wortgruppen nicht übereinstimmen. Dies aufzuspüren ist besonders schwer, weil die fehlenden bzw. zusätzlichen Wörter nicht sofort auffallen. Beispiel:

Deutsch Humanübersetzung Maschinelle Übersetzung
NC-Programme anpassen Adjusting NC programs NC programs
Legt den Umgang mit einem bereits vorhandenen Fragebogen des Kunden fest. Defines the handling of an already existing customer questionnaire. Specifies how to deal with an already existing questionnaires from the customer.
Englisch Humanübersetzung Maschinelle Übersetzung
After receiving a written notice of non-conformity an initial reaction from the supplier is expected within 2 working days. Nach Erhalt einer schriftlichen Mängelrüge wird vom Lieferanten eine erste Reaktion innerhalb von 2 Arbeitstagen erwartet. Nach Erhalt einer schriftlichen Mitteilung der Nichtkonformität eine erste Reaktion vom Lieferanten wird voraussichtlich innerhalb von 2 Werktagen.

Terminologie: Man könnte zwar davon ausgehen, dass Programme bei der Verwendung einer vorgegebenen Fachterminologie besser abschneiden als ein Mensch, aber leider ist auch das nicht immer der Fall. Da statistische Verfahren die Häufigkeit der Verwendung einer bestimmten Übersetzung in den Vordergrund stellen, kann es durchaus passieren, dass in der Übersetzung ein anderer Fachbegriff vorkommt.

Deutsch Humanübersetzung Maschinelle Übersetzung
Jedes Teil wird über Messtaster in der Maschine gemessen. Every part is measured via touch probes in the machine. Each part is via the measuring probe in the machine are measured.
Messung über Messtaster in der Maschine Measuring operation via touch probes in the machine Measurement with probe in the machine
Einrichten der Messtaster Setup of the touch probes Set the probe

Andere Fehlergüte

Wie einfach ist es, diese Fehler aufzuspüren? Qualitätssicherungstools können sie nur eingeschränkt erkennen. Solche Programme haben sich auf formelle Vergleiche (z. B. Vergleich der Zahlen oder bestimmter Fachbegriffe in der Ausgangs- und Zielsprache) spezialisiert. Wir haben es bei MÜ mit einer andersartigen „Fehlergüte“ zu tun. Da viele MÜ-Fehler aber nur durch genaues Durchlesen der Texte in beiden Sprachen zu erkennen sind, hat man im Grunde keine Arbeit gespart, sondern die Arbeit vom Übersetzer auf den Lektor verlagert. Dazu kommt noch eine größere Gefahr, da MÜ-Fehler oft Sinnfehler sind. Das klingt nach einem Eigentor.

Konsequenzen für Translation Memorys

Diese Entwicklung könnte man als schleichenden Prozess der „Entmenschlichung“ des Übersetzens bezeichnen. Das bedeutet, dass der Anteil an maschinell erzeugten Übersetzungen in Translation-Memorys tendenziell zunehmen wird. Es ist daher wichtig, dass Auftraggeber und Übersetzer sich darüber Gedanken machen, mit welchen Attributen diese Segmente in TMs und in Projekten gekennzeichnet werden und wie man sie effizient lektorieren kann. Hier sind Firmen und Dienstleister im Vorteil, die von Anfang an den möglichen Einsatz von Mischverfahren mit MÜ-Komponente planen, etwa durch für MÜ optimierte Ausgangstexte oder durch gezielte Prüfverfahren für maschinell übersetze Segmente.

Dieser Artikel von Dr. François Massion erschien in der „D.O.G.news 3/16; Nachdruck mit freundlicher Genehmigung der D.O.G. GmbH

Sie arbeiten selbst als Übersetzer/in mit CAT-Tools und würden MÜ gerne in Ihrem Arbeitsalltag sinnvoll einsetzen? Oder Sie fragen sich, wie Post-Editing eigentlich in der Praxis abläuft? Dann werfen Sie einen Blick auf den ATICOM-Workshop Post-Editing, MÜ, Apps am Beispiel Studio 2017.