Im Februar hatte Meta verkündet, man wolle unter dem Titel „No language left behind“ ein Tool zur maschinellen Übersetzung entwickeln, das eine möglichst große sprachliche Vielfalt abbilden soll. Jetzt stellt das Unternehmen NLLB-200 vor, ein KI-Einzelmodell, das Übersetzungen in und aus 200 Sprachen ermöglichen soll.
„Viele dieser Sprachen – zum Beispiel Kikamba oder Laotisch – wurden zuvor nicht ausreichend oder überhaupt nicht unterstützt, selbst nicht von den besten aktuell verfügbaren Übersetzungstools“, so Meta in einer Pressemitteilung.
Meta entwickelt „Universal“-Übersetzer: Das steckt hinter NLLB-200
Während es für Sprachen wie Englisch, Deutsch oder Italienisch bereits gute maschinelle Übersetzungen gibt, werden viele andere Sprachen, beispielsweise aus dem afrikanischen oder asiatischen Raum, noch kaum oder fehlerhaft abgebildet. Diesen Zustand will Meta mit seiner Entwicklung ändern.
Völlig selbstlos ist das Unternehmen Mark Zuckerbergs aber natürlich nicht unterwegs: Das neue KI-Modell kommt künftig auf Facebook und Instagram für die verbesserte Übersetzung von Postings zum Einsatz – die damit eine größere Zielgruppe erreichen dürften.
Zuckerberg schreibt dazu auf seinem Facebook-Profil: „Um ein Gefühl für die Größenordnung zu vermitteln: Das 200-Sprachen-Modell hat über 50 Milliarden Parameter, und wir haben es mit unserem neuen Research Supercluster trainiert, einem der schnellsten KI-Supercomputer der Welt. Die hier erzielten Fortschritte werden täglich mehr als 25 Milliarden Übersetzungen in unseren Apps ermöglichen.“
Neben NLLB-200 stellt Meta außerdem Flores-200 vor, einen Evaluierungsdatensatz, der die Performance der Übersetzungs-KI für jede Sprache prüft. „NLLB-200 übertrifft den bisherigen Stand der Technik um durchschnittlich 44 Prozent“, heißt es vom Unternehmen.
Metas Übersetzungs-KI: Open Source und auch bei Wikipedia im Einsatz
Sowohl NLLB-200, als auch Flores-200, der Modelltrainingscode und der Code zum Nachbilden des Trainingsdatensatzes, stehen unter einer Open-Source-Lizenz zur Verfügung. „Außerdem stellt Meta AI Non-Profit-Organisationen Fördermittel in Höhe von 200.000 Dollar für die praktische Anwendung des NLLB-200-Modells zur Verfügung.“
Abseits von Facebook und Instagram kommt die Übersetzungs-KI im Zuge einer Kooperation auch auf Wikipedia zum Einsatz: Über das Content-Übersetzungstool der Wikimedia Foundation können Wikipedia-Redakteur:innen Artikel übersetzen „in mehr als 20 ressourcenarme Sprachen – Sprachen, für die es keine umfangreichen Datensätze gibt, um KI-Systeme zu trainieren“. So sollen die Texte einem breiteren Publikum zugänglich werden. Eine Demo der Übersetzungs-KI gibt es hier.