Eine Anfang Januar 2025 von Tim Brooks geteilte Stellenausschreibung gibt Hinweise darauf, woran Googles KI-Tochter Deepmind gerade arbeitet. Brooks war einer der Köpfe hinter OpenAIs Sora – einem KI-Modell zur Erzeugung von Videos aus Texteingaben. Der KI-Experte wechselte im Oktober 2024 zum KI-Forschungslabor von Google.

„DeepMind hat ehrgeizige Pläne, massive generative Modelle zu erstellen, die die Welt simulieren“, so Brooks. „Ich stelle ein neues Team für diese Mission auf.“

Was Deepmind vorhat

Generative KI-Modelle reproduzieren, was sie in ihren Trainingsdaten gelernt haben. Sie sind also in der Lage, Welten und Personen darzustellen. Allerdings haben diese Modelle aktuell noch kein Verständnis davon, wie oder warum etwas geschieht.

Ein Beispiel: Schießt ein Fußballspieler aufs Tor, versteht KI die Physik dahinter meist nicht. Sie kann diese Szene zwar aus erlerntem Bildmaterial nachstellen – das führt bisweilen aber zu klassischen KI-Fehlern, bei denen etwa der Fußball eine seltsame Flugkurve hat.

Hier möchte Googles Entwicklerteam offenbar ansetzen und ein Modell entwickeln, das solche Prozesse genauer verstehen kann. Die Art von Modellen ist allerdings sehr schwierig zu entwickeln, weil die Ausführung einen extremen Rechenaufwand benötigt, um physikalische Prozesse wie das Schießen eines Balls korrekt zu verstehen und darstellen zu können.

Die Stellenbeschreibung verrät auch, dass die Entwickler eng mit den schon bestehenden Gemini-, Veo- und Genie-Teams zusammenarbeiten werden. Veo ist Googles KI-Videogeneration und Genie ein bestehendes Simulationsmodell, mit dem etwa Open-World-Spielszenen erzeugt werden können – wenngleich innerhalb enger technischer Grenzen.

Laut Stellenbeschreibung soll aber kein neues Veo oder Genie entstehen. Vielmehr macht sich das neue Projekt die Arbeiten der anderen KI zunutze. So heißt es: „Das Team wird mit der Arbeit der Gemini-, Veo- und Genie-Teams zusammenarbeiten und darauf aufbauen und kritische neue Probleme angehen, um Weltmodelle auf die höchsten Rechenebenen zu skalieren.“

