Lange Zeit waren übersetzende oder gar dolmetschende Maschinen Wissenschaftsfiktion, um nicht zu sagen Science Fiction. In den letzten Jahren hat es jedoch einen Quantensprung gegeben, der maschinelle Übersetzung zu einer echten Alternative werden lässt. Während man zu Beginn der MÜ-Entwicklung versuchte, dem Computer die Regeln der menschlichen Sprache beizubringen, verlegte man sich später darauf, vorhandene Übersetzungen statistisch auszuwerten und so zuzuordnen, welche Wörter oder Wortgruppen in Ausgangs- und Zielsprache wie häufig vorkommen bzw. „in der Nähe zueinander“ stehen. Erst mit dem Einsatz künstlicher neuronaler Netze, die der Funktionsweise (und Art zu lernen) des menschlichen Gehirns deutlich näher kommen als binär funktionierende herkömmliche Rechner, konnte man in den letzten Jahren so verblüffend gute Ergebnisse erzielen, wie wir sie heute teilweise von GoogleTranslate oder DeepL kennen. So ist nach jahrzehntelanger Forschung und Entwicklung zum ersten Mal die maschinelle Übersetzung eine echte Option. Damit stellt sich für den unbedarften Nutzer natürlich die Frage: Wann lasse ich wie gewohnt einen Menschen meine Texte übersetzen, wann tut es vielleicht auch der Computer? In diesem Beitrag sollen die wichtigsten Vor- und Nachteile beider Möglichkeiten genannt werden, um die Entscheidung ein wenig zu erleichtern.
Inhalt
Inhaltlich halte ich es durchaus für möglich, dass maschinelle Übersetzer und Dolmetscher irgendwann einmal so gut oder gar besser sind als die menschlichen Kollegen. Schließlich wird der Wissensbestand eines einzelnen Menschen immer auf einem relativ kleinen, beschränkten Ausschnitt des Weltwissens beruhen – egal wie viel wir im Leben lernen oder erfahren. Und wenn jemals ein Weg gefunden wird, semantische Strukturen (also Bedeutungswissen etwa in Form von Ontologien) quasi sinnvoll und vollständig (!) maschinell abzubilden und zu speichern, und wenn auch Rechenkapazitäten kein knappes Gut mehr sind, dann kann sich ein Computer so immens große Mengen von Informationen „reinziehen“ und zu seinem Wissen machen (die Frage, was genau wir unter Wissen verstehen, lasse ich dabei außen vor), wie es kein Mensch in einer handelsüblichen Lebenszeit jemals könnte. Schon jetzt kann man sehen, dass Computerdolmetscher selbst mündlich vorgetragene Sachverhalte „verstehen“ und in einer anderen Sprache wiedergeben können (Wann kommst Du am Flughafen an?). Bei komplexen Sachverhalten wird die Fehlerquote vor allem im mündlichen, aber auch im schriftlichen Verständnis jedoch schnell höher. Manche Sachverhalte, etwa unübersetzbare Rechtsbegriffe oder auch Kulturspezifika wie Ostalgie, Sandmännchen, Mainzelmännchen, Schwarzbrot oder Schunkeln, kommen in der Übersetzung ohne eine Erläuterung oft gar nicht aus.
Beim Abwägen des Für und Wider stellen sich dem Nutzer hier also die Frage, wie kritisch der Inhalt ist: Brauche ich nur ein grobes Verständnis eines Textes bzw. möchte ich selbst nur so einigermaßen verstanden werden und kann Missverständnisse problemlos korrigieren? Oder sind strategische Inhalte im Spiel bzw. wären Missverständnisse und Falschübersetzungen fatal?
Tempo
Der menschliche Übersetzer nimmt sich, wenn er die Bedeutung einer Textstelle nicht versteht, natürlich die Zeit zu recherchieren, was genau gemeint ist. Dabei ist ihm seit vielen Jahren der Computer zum unverzichtbaren Assistenten geworden, der Informationen, Terminologie usw. unendlich viel schneller und umfangreicher verfügbar macht, als es im Papierzeitalter je möglich gewesen wäre. Auch Simultandolmetscher machen sich dies zunutze. Wenn sie auch unter der kognitiven Belastung häufig keine Kapazitäten zum Nachschlagen haben, so besteht die Chance, per Computer eine Information binnen Sekunden aufzuspüren, doch deutlich eher, als das zu Zeiten von Papiernachschlagewerken der Fall war.
Anders ist die Lage beim schriftlichen Übersetzen: Maschinelle Übersetzungen auch ellenlanger Texte erledigt der Computer binnen Sekunden. Ein menschlicher Übersetzer hingegen bringt einschließlich der Prüfung von Terminologie, dem Feilen an Formulierungen und dem abschließenden Gegenlesen gut und gerne eine Zeitstunde mit der Übersetzung einer „normalen“ Seite Fachtext zu. Vom Schlusslektorat durch den zweiten Übersetzer (Vier-Augen-Prinzip) ganz zu schweigen.
Kontext
In einer Sache sind die Übersetzungssysteme der „neuronalen Generation“ dem Menschen sehr ähnlich: Sie brauchen Kontext, um richtig übersetzen zu können. Nackte Wortlisten ohne Zusammenhang eignen sich für menschliche und maschinelle Übersetzung gleichermaßen nicht. Hier ein paar Beispiele:
Deutscher Ausgangssatz | Englische Übersetzung von DeepL: | Englische Übersetzung von Google Translate:
|
Die Auflagen für die Liegestühle waren sehr teuer. | The pads for the deckchairs were very expensive.
|
The cushions for the deck chairs were very expensive. |
Die Auflagen für die Stühle waren sehr teuer. | The supports for the chairs were very expensive. | The pads for the chairs were very expensive. |
Interessant: Je spezifischer das Möbelstück (Stuhl – Liegestuhl), desto richtiger die Übersetzung des benachbarten Wortes (pad – support). | ||
Die Betriebsgenehmigung Ihrer Tankstelle ist an Auflagen gebunden. | The operating licence of your petrol station is subject to conditions. | Your petrol station’s operating license is subject to certain conditions. |
Nicht schlecht! | ||
Ich habe heute alle Geschäfte abgeklappert. | I’ve been looking all over the businesses today. | I did all the business today.
|
Informelle Sprache ist noch schwierig … |
Formalität
Das Verstehen gesprochener Sprache mit seinen unzähligen Normabweichungen und Strukturbrüchen ist für einen Computer eine ungleich größere Herausforderung als für das menschliche Gehirn, das deutlich robuster im Umgang mit unvollkommenen Mustern ist. Halbfertige Sätze, Genuscheltes, Sprachfehler, falsche Grammatik, spontan erfundene Wörter usw. sind für uns Menschen normalerweise kein Problem. Gleiches gilt für Schriftliches. Je eindeutiger und schematischer der Text und je weniger neuartige Begriffe, die noch kein Wörterbuch kennt, desto weniger Raum gibt es für Missverständnisse. Eine Gebrauchsanweisung im Stil von Stecken Sie den roten Dübel in die blaue Öffnung ist einfach eindeutiger und auch in jedem Sprachraum einigermaßen gleich verständlich, anders als Man hat schon Pferde vor der Apotheke kotzen sehen. Feste und altbekannte Redewendungen wie Ich verstehe nur Bahnhof sind zwar durch einen entsprechenden Wörterbucheintrag auch maschinell zu übersetzen. Aber was ist mit den unzähligen Neuschöpfungen, die die Sprache täglich hervorbringt? Und erst in der gesprochenen Sprache: Würde eine Maschine beispielsweise das Binnen-I in SteuerzahlerInnen hören, wenn die Sprecherin durch einen stimmlosen Glottisschlag eine Pause vor dem I markiert?
Nicht umsonst gibt es spezielle Regeln und Schulungen für das übersetzungsfreundliche Verfassen von Texten. Als Faustregel könnte man formulieren: Je weniger kreativ & innovativ, desto maschinenverständlicher.
Zwischenmenschliches und Nicht Gesagtes
Was der gute alte Friedemann Schulz von Thun schon 1981 über die zwischenmenschliche Kommunikation geschrieben hat, kann auch heute noch helfen zu verstehen, worauf es in verschiedenen Kommunikationssituationen ankommt. Wir vermitteln beim Kommunizieren:
- eine Sachinformation (worüber ich informiere) – blau
- eine Selbstkundgabe (was ich von mir zu erkennen gebe) – grün,
- einen Beziehungshinweis (was ich von dir halte und wie ich zu dir stehe) – gelb,
- einen Appell (was ich bei dir erreichen möchte) – rot.
Quelle Abbildung: Schulz von Thun Institut
Ob wir wollen oder nicht, wir hören mit diesen vier Ohren und reden mit diesen vier Schnäbeln, wie Schulz von Thun es nennt.
Ein Satz wie Kommst Du an die Butter? wird ein Mensch relativ wahrscheinlich als Handlungsaufforderung (rot) verstehen, auch wenn es sich um einen Fragesatz und nicht um einen Befehlssatz handelt. Kommst Du auch noch mal? kann je nach Situation, Betonung und Gesichtsausdruck ein Vorwurf (gelb) sein oder eine einfache Bitte um eine Auskunft (blau). Und wenn man sich für den reinen Informationsaustausch die maschinengemittelte Kommunikation vielleicht vorstellen kann, so ist doch die interessantere Frage, ob ein Computerübersetzer oder -dolmetscher Gefühle und Intentionen „verstehen“ und vermitteln kann. Auch hier muss man als Nutzer unterscheiden: Was ist der Zweck meines Textes, meines Gesprächs, meines Events? Sollen Informationen vermittelt werden? Soll Vertrauen aufgebaut werden? Möchte ich womöglich etwas über mein Gegenüber erfahren, zwischen den Zeilen lesen, vermitteln, verhandeln, sei es im Gespräch oder per E-Mail?
Interessant finde ich gerade in Zeiten von Corona zu beobachten, wie viele Treffen aus der Not heraus nicht mehr physisch, sondern virtuell per Internet stattfinden (und ebenso gedolmetscht werden). Der Tenor ist fast immer der gleiche: Toll, wie effizient man per Computer arbeiten kann, wie viel man erledigt bekommt. Aber hoffentlich können wir uns bald wieder persönlich sehen!
Terminologie, Stil und Einheitlichkeit
Wer einmal in einer gemischten WG (oder einer ebensolchen Ehe) aus Nord-/Süd-/West-/Ostdeutschen gelebt hat, weiß: Die richtige Bezeichnung gibt es nicht. Heißt es Reißzweck oder Heftzweck? Leintuch, Betttuch oder Bettlaken? Wischtuch, Putzlappen, Feudel oder Aufnehmer? Und wenn ja, welcher Begriff ist in welchem Zusammenhang richtig? Im Privaten sind dies kleine Gefechte um persönliche Vorlieben, aber wenn es um die Unternehmenssprache und die Corporate Identity geht, oder auch die Auffindbarkeit in einer Suchmaschine, dann ist die Auswahl von Terminologie und bestimmten Formulierungen strategisch. Denn dann geht es darum, das Bild einer Marke, eines Unternehmens oder eines Produktes nach außen zu transportieren – oder die Produkte eines Online-Shops optimal zu verschlagworten. Einen menschlichen Übersetzer weist man hierzu in die Unternehmenssprache ein, er verinnerlicht sie oder arbeitet sogar aktiv daran mit prägt so die Begrifflichkeiten und den Stil in seiner jeweiligen Sprache. Hierzu gehören auch so profane Fragen wie die, ob die Adressaten geduzt oder gesiezt werden, was je nach Sprachraum durchaus unterschiedlich sein kann. So ist die Unternehmenskommunikation „aus einem Guss“ sichergestellt. In der maschinellen Übersetzung darf man natürlich keine aktive Mitwirkung oder Beratung darüber erwarten, was die Zielgruppe gerne hört oder gut versteht. Die gewünschte Terminologie oder auch Satzbausteine kann man aber durchaus in ein MÜ-System „hineinfüttern“, wenn man damit langfristig arbeiten möchte. Tut man dies nicht, passiert es hingegen nicht selten, dass ein und derselbe Begriff im gleichen Text unterschiedlich übersetzt wird.
Sprachkombination
Ein ganz simpler Faktor in Sachen maschinelle Übersetzungsqualität ist übrigens die benötigte Sprachkombination: Alle Kombinationen mit Englisch (Deutsch-Englisch, Spanisch-Englisch etc.) sind in der Regel besser erforscht bzw. die neuronalen Maschinen besser „angelernt“, also mit mehr Datenmaterial gefüttert, als Kombinationen ohne Englisch wie etwa Deutsch-Französisch. Auch sind europäische Sprachkombinationen meist deutlich ausgereifter als solche mit asiatischen Sprachen.
Kombination Mensch und Maschine
Stellt sich nun die Frage, ob man auch im Übersetzen die offensichtlich ganz unterschiedlichen Stärken von Mensch und Maschine kombinieren kann, so wie es in anderen Berufen, etwa in der Medizin, ja auch ganz selbstverständlich der Fall ist: Der Computer liefert schnell und gezielt Informationen und bereitet sie auf, der Experte interpretiert und trifft die Entscheidungen. Tatsächlich ist es auch im Übersetzen schon seit Jahrzehnten so: Übersetzer verwenden den Computer nicht nur als bessere Schreibmaschine. Vielmehr sorgen so genannte Translation Memories (Übersetzungsspeichersysteme) dafür, dass sie gleiche oder ähnliche Textpassagen immer gleich übersetzen, die vom Kunden gewünschten Begriffe verwenden oder überhaupt beim Nachschlagen von Wörtern nicht unnötig viel Zeit verlieren. In diesem Fall hilft also der Computer dem Menschen, man spricht von Computer Aided Translation, CAT, oder auch im Dolmetschen von Computer Aided Interpretation, CAI, d.h. einer maschinellen Unterstützung des Simultandolmetschers, um seine kognitive Belastung etwa durch möglichst effiziente Terminologierecherche oder auch durch Unterstützung des Hörverstehens zu reduzieren.
© Ulla Amberg
Der umgekehrten Logik folgt das so genannte Post Editing, also die Nachbereitung von maschinell übersetzten Texten. Hierbei korrigiert der menschliche Übersetzer die Fehler des Computerübersetzers. Ob das wirtschaftlich Sinn ergibt oder ob der Übersetzer am Ende schneller selbst den Text übersetzt hätte, als jeden (auf den ersten Blick nicht erkennbaren) Verständnisfehler des Computers aufzuspüren, muss man von Fall zu Fall klären und im Zweifel ausprobieren.
Mehr und mehr greifen nun die beiden Ansätze ineinander. Möchte ein Unternehmen langfristig mit einem maschinellen Übersetzungssystem wie etwa IB Language Translator oder Amazon Translate zu arbeiten, so ist es auch möglich, dieses „anzulernen“, also etwa die bevorzugte Terminologie in das System einlesen zu lassen, so dass ein gewisser Mindeststandard gesichert ist und das menschliche Lektorat sich auf den Inhalt und ordentliche Formulierungen beschränken kann. Auch kann umgekehrt, wenn grundsätzlich die „Hoheit“ über die Übersetzung in Händen des menschlichen Übersetzers verbleiben soll, dieser Hand in Hand mit einer Übersetzungsmaschine arbeiten. So kann man das für den Menschen gedachte Translation-Memory-System mit maschineller Übersetzung kombinieren, so dass der Übersetzer Vorschläge von der MÜ bekommt und diese prüfen ggf. verbessern und übernehmen oder verwerfen kann.
Zusammenfassend lässt sich feststellen: Der Möglichkeiten gibt es viele, auch wenn die egg-laying wool-milk sow noch ein wenig auf sich warten lässt.