„Zum Scheitern verurteilt“: Führender Meta-Wissenschaftler zerlegt Sora

Die Veröffentlichung von Sora hat jüngst für großes Aufsehen gesorgt. Das KI-Videoprogramm von OpenAI kann Videos auf Basis eines Text-Prompts erstellen. Doch jetzt gibt es Gegenwind – und zwar von prominenter Stelle.
LeCun gilt als einer der Erfinder moderner künstlicher Intelligenz
Für Yann LeCun, Chef-KI-Wissenschaftler bei Meta, ist Sora nicht als Weltensimulator geeignet – und somit auch kein Fortschritt in Richtung einer Artificial General Intelligence, wie es OpenAI sagt. „Die Modellierung der Welt durch die Generierung von Pixeln ist sowohl verschwenderisch als auch zum Scheitern verurteilt“, schrieb er in einem Beitrag auf X.
LeCuns Wort zählt in der KI-Welt, gehört er doch „zu den Erfindern moderner künstlicher Intelligenz“, wie die Zeit schrieb. Für den Spiegel ist er Facebooks „wichtigster KI-Forscher“.
Der 63-jährige Franzose zündet damit die nächste Stufe in einer Debatte, die schon länger schwelt. LeCun glaubt laut Futurism, dass der Ansatz, Pixel „aus erklärenden Variablen“ zu generieren, zu ineffizient ist und die Unsicherheit, die sich aus diesen komplexen Vorhersagen in einem 3D-Raum ergeben, nicht angemessen bewältigen kann.
Seiner Meinung nach versuchen diese Modelle, zu viele Details abzuleiten, die nicht relevant sind. Daran sei nichts auszusetzen, wenn Soras Ziel darin bestehe, einfach Videos zu erstellen, schrieb er in dem Beitrag. „Aber wenn ihr Ziel darin besteht, zu verstehen, wie die Welt funktioniert, ist das ein verlorenes Unterfangen.“
Meta hat eigene Video-KI vorgestellt
Laut LeCun funktioniert der generative Ansatz mit großen Sprachmodellen wie ChatGPT, weil der Text eine endliche Anzahl von Symbolen aufweist. Aber wenn man die Welt so simulieren will, wie Sora es tun soll, habe man es mit viel mehr als nur ein paar Charakteren zu tun.
LeCun verfolgt einen anderen Ansatz – und hat bei Meta an seinem eigenen Modell namens Video Joint Embedding Predictive Architecture (V‑JEPA) gearbeitet, das letzte Woche vorgestellt worden ist.
Im Gegensatz zu generativen Ansätzen, „die versuchen, jedes fehlende Pixel zu ergänzen“, teilte Meta in einem Blogbeitrag mit, habe V‑JEPA die Flexibilität, unvorhersehbare Informationen zu verwerfen, was zu einer 1,5- bis 6-mal „verbesserten Trainings- und Probeneffizienz“ führe.
Meta? Es scheint deren neue Taktik zu sein, alles von der Konkurrenz öffentlich schlecht zu reden, möglicherweise sind die eigenen Produkte nicht konkurrenzfähig. Letzte Woche war es Apple, heute OpenAI, morgen Google?
https://t3n.de/news/mark-zuckerberg-apple-vision-pro-meta-quest-3-1607628/