Ein Forscherteam bei Microsoft hat ein maschinelles Übersetzungssystem programmiert, das chinesische Nachrichten ins Englische überträgt und dabei genauso akkurat arbeitet wie ein menschlicher Übersetzer. Die Forscher haben ihr System mit 2000 Sätzen aus verschiedenen Nachrichtenquellen getestet; den Datensatz hatte eine Expertengruppe auf der WMT17-Konferenz veröffentlicht. Externe Sprachexperten bestätigten die Genauigkeit der maschinellen Übersetzung. Sie verglichen das maschinelle Ergebnis mit zwei unabhängig voneinander erstellen Texten von menschlichen Übersetzern.

In dieser Leistung sieht Microsoft einen "historischen Meilenstein", einen echten Durchbruch. Dass eine maschinelle Übersetzung der menschlichen gleichkommt, sei ein Traum, sagt Xuedong Huang, der bei Microsoft für die Bereiche Sprache, natürliche Sprache und maschinelle Übersetzung verantwortlich ist. "Wir wussten nur nicht, dass wir es so schnell schaffen würden." Huang freut sich, dass sich die Menschen künftig besser verstehen werden. Es sei sehr befriedend, Sprachbarrieren zu entfernen.

Übersetzung komplexer als Spracherkennung

Experten arbeiten seit Jahrzehnten an der maschinellen Übersetzung. Sie ist viel komplizierter als etwa die Spracherkennung, da es bei Übersetzungen viel mehr Nuancen gibt und oftmals kein Richtig oder Falsch. "Menschen können verschiedene Wörter benutzen, um genau dasselbe auszudrücken, aber man kann nicht unbedingt sagen, welches Wort besser ist", erklärt Dr. Ming Zhou vom Microsoft Research Lab Asia. Diese Komplexität sei ein herausforderndes Problem, dessen Lösung sich aber lohne.

Schwierig ist vor allem das tiefere Textverständnis, weshalb viele maschinelle Übersetzungen sehr holprig zu lesen und schwer zu verstehen sind. Das gilt vor allem für lange und komplexe Artikel. Die meiste Zeit dachten deshalb viele, dass eine menschliche Übersetzung niemals zu schlagen sei, schreibt Microsoft. KI-Systeme und neuronale Netze hätten nun aber wichtige Durchbrüche ermöglicht: Die Forscher sind endlich in der Lage, eine flüssige und natürlich klingende Übersetzung zu erzeugen, die auch den größeren Kontext beachtet.

Die Lernmethoden der KI

Die Forscher griffen auf verschiedene Lernmethoden zurück, um ihr System zu schulen, darunter etwa das Dual Learning for Maschine Translation. Es fungiert als eine Art Faktenprüfer. Eine weitere Methode sind die Deliberation Networks. Sie redigieren Übersetzungen wieder und wieder – genau wie Menschen es tun. Die Forscher brachten ihrem System bei, einen Satz wiederholt zu übersetzen und das Ergebnis dadurch immer mehr zu verfeinern. Um die Genauigkeit zu verbessern, setzten die Forscher auf ein Joint Training: Das System übersetzte englische Sätze ins Chinesische, um selbst neue Satzpaare zu erzeugen, die den Trainingsdatensatz erweiterten. Dieser "verläuft" in die andere Richtung: vom Chinesischen ins Englische. "Das gleiche Verfahren wird dann in die andere Richtung angewendet. Mit zunehmender Konvergenz verbessert sich die Performance beider Systeme", schreibt Microsoft. All das könne man im gesamten KI-Bereich einsetzen und nicht nur bei der maschninellen Übersetzung.

Trotz dieser Erfolge gibt es aber noch viele Herausforderungen zu meistern und Probleme zu lösen. Das Team will sein System jetzt mit echten Nachrichten testen, bevor es irgendwann in kommerziellen Microsoft-Produkten zum Einsatz kommt. Bereits jetzt können Sprachinteressierte eines der Übersetzungssysteme ("SV1") auf einer Website testen. Die hat manchmal kleine Hänger – schließlich ist das alles noch nicht fertig. Microsoft ist sich aber sicher: "Wir werden besser und besser." (dbe)