Verblüffend menschlich: OpenAI testet 8 neue Stimmen für ChatGPT – so klingen sie
Mit dem Advanced Voice Mode hatte OpenAI im Mai 2024 einen erweiterten Sprachmodus für seinen KI-Chatbot ChatGPT vorgestellt. Der soll noch menschlichere Gespräche führen – hat allerdings auch schon einige geradezu menschliche Schwächen offenbart.
Nutzer entdecken acht neue ChatGPT-Stimmen
Seit Ende Juli wird der Advanced Voice Mode ausgewählten ChatGPT-Pro-Nutzer:innen nach und nach zur Verfügung gestellt. Jetzt haben Nutzer:innen insgesamt acht neue Stimmen ausgemacht, die Open AI derzeit zu testen scheint.
Die neuen Stimmmodelle tragen die Namen Fathom, Glimmer, Harp, Maple, Orbit, Rainbow, Reef, Ridge und Vale. Der Tech-Experte Tibor Blaho hat per X längere Proben dieser acht neuen Stimmen veröffentlicht.
In diesen lesen die verschiedenen Stimmen jeweils einen Text. Sofort fällt auf, dass diese jetzt tierische Geräusche wie das Bellen von Hunden oder das Krächzen von Krähen imitieren können.
Neue Fähigkeiten für Stimmmodelle
Auch scheinen die Stimmmodelle bestimmte Wörter oder Satzteile besser zu interpretieren und entsprechend betonen und hervorheben zu können. Wer genau hinhört, kann auch einen britischen oder australischen Dialekt heraushören, wie Mashable schreibt.
Inwieweit das jetzt täuschend echt klingt oder doch noch deutlich erkennbar monoton, muss Jede:r für sich selbst beantworten. Nicht bestreitbar ist, dass es OpenAI gelungen ist, bei der Entwicklung menschlich klingender Voice-KI-Chatbots wieder einen Schritt voranzugehen.
Details zu neuen Stimmen fehlen
Ob die acht Stimmen für einen offiziellen Release und die Integration in den Voice-Modus von ChatGPT vorgesehen sind, ist derweil unklar. OpenAI hat sich noch nicht dazu geäußert. Möglich, dass es sich bei den Bell- und Krächzversuchen um interne Testfähigkeiten handelt, die erst nach weiteren Versuchen in einem Modell zum Einsatz kommen sollen.
Bisher können Nutzer:innen beim Sprachmodus von ChatGPT zwischen vier verschiedenen Stimmen wählen. Die sind allerdings noch ganz klar als eher monoton klingende Roboterstimmen zu erkennen.
Damit könnte es aber bald vorbei sein, wenn man sich die jetzt bekannt gewordenen Stimmen so anhört. Das bedeutet auf der anderen Seite noch größere Herausforderungen beim Erkennen von Deepfakes.