In „Per Anhalter durch die Galaxis“ beschreibt Autor Douglas Adams mit dem Babelfisch einen Übersetzungsfisch, den man sich ins Ohr setzen kann. Auf diesen fiktiven Universalübersetzer hat Meta bei der Präsentation seiner neuen Übersetzungs-KI SeamlessM4T jetzt Bezug genommen.
KI beherrscht fast 100 Sprachen
Dem Facebook-Mutterkonzern zufolge beherrscht die Software beinahe 100 Sprachen – und kann diese aus Texten oder Gesprochenem schriftlich übersetzen. Per Sprache können 36 verschiedene Sprachen (Text-to-Speech und Speech-to-Speech) als Übersetzung ausgegeben werden.
Laut Meta verrichtet das Tool auch dann seine Arbeit, wenn während der Aufnahme oder Eingabe der zu übersetzenden Inhalte die Sprache gewechselt wird.
Trainiert wurde die Übersetzungs-KI mit Audioaufnahmen im Umfang von vier Millionen Stunden, wie Spiegel Online schreibt. Das Material stammt laut dem entsprechenden Forschungspapier „aus einem öffentlich zugänglichen Speicher für Daten, die im Internet per Scraping gesammelt wurden“.
Woher hat Meta die Trainingsdaten?
Woher genau Meta die Daten hat, verriet der Konzern aber auch auf konkrete Nachfrage der Nachrichtenagentur Reuters nicht. Für die textbasierten Trainingsdaten griff Meta jedenfalls auf Wikipedia und andere Website zu.
Inwiefern Meta und andere Konzerne für das Training ihrer KI solche und andere Daten verwenden dürfen, ist hochumstritten. Darüber hinaus weist SeamlessM4T auch typische Bias-Probleme auf. So tendiere die KI-Software dazu, Begriffe in ihre männliche Form zu übersetzen.
KI-Tools für das Metaverse
Meta-Chef Mark Zuckerberg sieht die neue Übersetzungs-KI als Teil einer Tool-Sammlung, die Menschen bei der virtuellen Begegnung im Metaverse helfen soll.
Ähnlich wie Metas Sprachmodell Llama kann auch SeamlessM4T zu nichtkommerziellen Zwecken frei verwendet werden. Die Übersetzungs-KI kann hier in einer Demoversion ausprobiert werden.
Demo schlägt sich im Test gut
Dort kann man eine bis zu 15 Sekunden lange Audiodatei mit dem zu übersetzenden Inhalt auswählen. Anschließend kann man sich diesen Inhalt in bis zu drei Sprachen übersetzen lassen. Je nach Verfügbarkeit als Sprach- oder Textversion.
Im Kurztest hat das mit einfachen Sätzen – zumindest soweit sich das mit den Sprachkenntnissen des Verfassers dieses Textes überprüfen ließ – gut funktioniert. Die Spracherkennung war jedenfalls tadellos.