Auch abseits von Nachrichten und den allgegenwärtigen True-Crime-Formaten gibt es beinahe keinen Themenkomplex, an dem sich nicht bereits eine:r oder mehrere Podcast-Macher:innen abgearbeitet hätten. Geht es nach den Macher:innen der KI-App Bespoke, könnten Podcasts zukünftig sogar die kleinste Nische abdecken. Schlicht indem sich jeder einfach seinen eigenen Podcast generiert.
Bespoke funktioniert extrem simpel: Ihr gebt einfach in Textform an, zu welchem Thema ihr etwas hören möchtet, und wählt eine Zeitspanne zwischen einer und drei Minuten. Dann müsst ihr ein paar Minuten warten und könnt euch im Anschluss von einer äußerst realistisch klingenden Frauenstimme etwas zu dem gewählten Thema erzählen lassen.
Bespoke: Können die KI-Podcasts echte Aufnahmen ersetzen?
Natürlich ist ein maximal drei Minuten langer Podcast für die meisten Hörer:innen doch etwas kurz. Allerdings handelt es sich bei Bespoke auch erst mal vor allem um eine kostenfreie Demonstration der Technologie.
Zu einem späteren Zeitpunkt wollen die Macher:innen auch die Möglichkeit bieten, längere Podcasts generieren zu lassen. Mitentwickler:in Jasmine Wang stellt auf Product Hunt sogar die Möglichkeit in den Raum, die Podcast-Länge automatisch von freien Zeit-Slots im Kalender abhängig zu machen. Aufgrund der hohen Rechenleistung von KI-Systemen dürfte sowas dann aber wohl nur in einem kostenpflichtigen Modell funktionieren.
Unabhängig von der Länge bleibt aber ein weiteres Problem, dass auch die Macher von Bespoke so schnell wohl kaum lösen können: Große KI-Sprachmodelle neigen nach wie vor zum Halluzinieren – also dazu, sich Dinge auszudenken.
Solange dafür keine technische Lösung existiert, bleibt eine Podcast-KI wie Bespoke zwar eine nette Idee, ein Ersatz für von echten Menschen gemachte Podcasts ist es aber nicht. Zumindest wenn Hörer:innen auch sicher sein wollen, dass die getroffenen Aussagen auch stimmen.
Allerdings herrscht in der Fachwelt nach wie vor keine Einigkeit darüber, ob große Sprachmodelle überhaupt eines Tages dazu gebracht werden können, dass sie das „Flunkern“ einstellen.
Im Untertitel wird die Frage „aber reicht das“ gestellt, die sich sehr einfach beantworten lässt.
Ich bin immer wieder verwundert über Journalisten, die annehmen, dass die KI sich nicht weiterentwickeln würde. Wir stehen erst am Anfang der Entwicklung – ich vermute, dass in weniger als 100 Jahren jeder auf Knopfdruck generierte Podcast für einen menschlichen Hörer ungleich interessanter zu hören ist, als ein menschlich produzierter. Vermutlich wird man den Stil des Podcasts wählen können und noch viel mehr. Und von der zugrunde liegenden Recherche Fähigkeit und Wissensdatenbank braucht man gar nicht erst zu sprechen. Die KI ist nicht aufzuhalten, sie wird in jedem Bereich das menschliche Vermögen um Längen schlagen. Unglaublich, dass Journalisten den heutigen Stand als Maßstab bewerten!
ganz ihrer Meinung – bis auf die von ihnen genannte zeitspanne. Weniger als 10 Jahre scheint wahrscheinlicher.