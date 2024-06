Der Google Übersetzer ist über die Jahre von einem fehlerhaften Online-Tool zu einem richtig hilfreichen Übersetzer gewachsen. Nun bekommt das Tool wieder neue Sprachen. Mithilfe von KI, um genauer zu sein Googles Palm-2-Sprachmodell, konnte das Unternehmen ganze 110 neue Sprachen in den Google Übersetzer integrieren. Es ist damit die bisher größte Erweiterung. Das gab Google in einem Blogbeitrag bekannt.

Diese Sprachen sind jetzt mit dabei

Zu den neuen Sprachen gehören unter anderem Afar, eine Sprache, die unter anderem in Eritrea gesprochen wird, Kantonesisch und Pandschabi. Insgesamt werden die neuen Sprachen von mehr als 614 Millionen Menschen gesprochen – rund 8 Prozent der Weltbevölkerung. Neben viel gesprochenen Sprachen werden auch Übersetzungen für kleine Gemeinschaften indigener Völker angeboten. Etwa ein Viertel der neuen Sprachen kommt aus Afrika, darunter Fon, Kikongo, Luo, Ga, Swati, Venda und Wolof.

Schon im Jahr 2022 fügte Google 24 neue Sprachen hinzu. Statt Palm 2 nutzt das Unternehmen die Zero-Shot-Maschinenübersetzung ein. Das Modell schafft es, Dinge in eine andere Sprache zu übersetzen, ohne jemals ein Beispiel zu sehen.

Das will Google noch erreichen

Insgesamt plant das Unternehmen, mit KI Übersetzungen für insgesamt 1.000 Sprachen zu unterstützen. Besonders Dialekte sollen noch hinzugefügt werden. „Unser Ansatz bestand darin, die am häufigsten verwendeten Varietäten einer jeden Sprache in den Vordergrund zu stellen. Romani ist zum Beispiel eine Sprache, die in ganz Europa viele Dialekte hat. Unsere Modelle produzieren einen Text, der dem Süd-Vlax-Romani, einer häufig verwendeten Onlinevariante, am nächsten kommt. Aber es mischt auch Elemente aus anderen Sprachen, wie Nord-Vlax und Balkan-Romani“, sagte Isaac Caswell, ein Software-Ingenieur bei Google, in dem Statement. Dabei soll auch wieder Palm 2 hilfreich sein. So sollen Sprachen mit vielen Ähnlichkeiten effizienter erlernt werden können.

