Klare Ansage vom Youtube-CEO: Warum OpenAIs Sora nicht mit Clips der Plattform trainieren darf

In einem Interview mit dem Wall Street Journal hatte Mira Murati, CTO von OpenAI, einige Fragen zur Video-KI Sora beantwortet. Eine der wichtigsten Fragen ließ sie allerdings unbeantwortet: Mit welchen Daten wurde die KI trainiert?
So stellte Joanna Stern vom Wall Street Journal etwa die Frage, ob die KI mit Videos von Youtube, Facebook oder Instagram trainiert wurde. Dabei wurde Murati zurückhaltender und sagte: „Wenn die Daten öffentlich verfügbar waren, dann vielleicht. Aber ich bin mir da nicht sicher.“ Der Ausschnitt ist etwa ab der vierten Minute des Interviews zu sehen:
Warum Sora nicht mit Youtube-Videos trainieren soll
Nun hat sich Youtube-CEO Neal Mohan zu Wort gemeldet und betont, dass OpenAI kein Recht hätte, die KI mit Youtube-Videos zu trainieren. Im Gespräch mit Bloomberg sagte er: „Die Richtlinien erlauben es nicht, dass Transkriptionen oder Videos heruntergeladen werden. Das ist ein klarer Verstoß. Das sind sozusagen die Straßenverkehrsregeln für Content auf unserer Plattform.“
Diese Aussage hat Mohan vermutlich nicht nur wegen der vagen Antworten von Murati getroffen. Erst kürzlich wurde bekannt, dass KIs allmählich die Daten zum Trainieren ausgehen. Künftig könnte das bedeuten, dass sie auf andere Quellen zurückgreifen müssen. OpenAI hatte in einem Interview mit dem Wall Street Journal angekündigt, dass man für GPT‑5 auf Transkriptionen von Youtube-Videos zurückgreifen könnte.
Youtube – genauer gesagt Google – nutzt laut Mohan nur dann Videos auf der Plattform für KI-Training, wenn dies mit den Richtlinien übereinstimmt und in den Verträgen der Content-Creator:innen verankert ist.