Wer sich im Ausland verständigen oder einfach eine Website in einer Fremdsprache verstehen will, greift gerne auf Übersetzungstools zurück. Doch nicht immer kommt dabei das gewünschte Ergebnis heraus. Bei der Übersetzung vom Deutschen ins Chinesische und von dort ins Spanische beispielsweise kann es passieren, dass der ursprüngliche Sinn eines Textes ein Stück weit verloren geht und Aussagen verfälscht werden. Der Grund liegt dabei an der Art und Weise, wie viele mehrsprachige Modelle die Übersetzung angehen.
Da die Trainingsdaten im Englischen am weitesten verbreitet sind, wird diese Sprache bei Übersetzungen oftmals dazwischengeschaltet. Das heißt die KI übersetzt vom Deutschen ins Englische, vom Englischen ins Chinesische, zurück ins Englische und dann erst ins Spanische. Diese englische Extrameile will Facebook mit einer neuen künstlichen Intelligenz umgehen.
Modell ist Open Source
M2M-100 heißt das mehrsprachige Modell, das zwischen einem beliebigen Paar aus 100 Sprachen übersetzt, ohne sich dabei auf englische Sprachdaten zu verlassen. Die KI ist also darauf trainiert, direkt von einer Sprache in die andere zu übersetzen. Das Modell wird insgesamt auf 2.200 verschiedene Sprachrichtungen trainiert. Das sind zehnmal mehr, als die bisherigen auf englisch ausgerichteten multilingualen Tools zu bieten haben.
„Der Einsatz von M2M-100 wird die Qualität der Übersetzungen für Milliarden von Menschen verbessern, insbesondere für diejenigen, die ressourcenarme Sprachen sprechen“, heißt es dazu in einem Blogpost von Facebooks KI-Abteilung. Nach eigenen Angaben arbeitet Facebook seit Jahren an einem derartigen Tool. Um zukünftig anderen Publishern dabei zu helfen, mehrsprachige Modelle zu reproduzieren und weiterzuentwickeln, ist das Modell als Open-Source-Variante verfügbar.