In dieser Episode unseres Podcasts sprechen wir über Stimmen, genauer gesagt über künstliche Stimmen und KI, die diese Stimmen erzeugen. Unsere Gesprächspartnerin ist Tatjana Anisimov. Sie ist Product Innovation Manager bei RTL Deutschland und beschäftigt sich in ihrer Arbeit mit Trends und Technologien, die für die journalistischen Produkte von ntv.de und rtl.de spannend sein könnten. Einer dieser Trends ist Text-to-Speech, also die Umwandlung eines schriftlichen Textes in eine Audiodatei.
Die Besonderheit des Projektes: Die Stimmen sind nicht komplett künstlich, sondern beruhen auf den Stimmen zwei bekannter RTL-Moderator:innen. Eine künstliche Intelligenz von Microsoft wurde mit mehreren Stunden Tonaufnahmen von Inken Wriedt und Maik Meuser trainiert und wird nun auf ntv.de dafür eingesetzt, eine Auswahl journalistischer Texte für die Nutzer:innen vorzulesen.
Tatjana erzählt uns, wie das Projekt entstanden ist und vor welchen Herausforderungen das Team steht. Außerdem sprechen wir mir ihr darüber, für welche Einsatzzwecke eine solche KI noch eingesetzt werden könnte und wo die Grenzen der Technologie liegen.
t3n Podcast abonnieren
Ihr könnt den t3n Podcast bequem in der Podcast-App eurer Wahl abonnieren. In der Regel findet ihr den Podcast, wenn ihr ihn dort einfach sucht. Ansonsten könnt ihr auch den RSS-Feed manuell in der App eingeben.