Dass KI die Gaming-Branche verändern wird, daran besteht kein Zweifel mehr. Videospiel-Hintergründe können schon jetzt mittels künstlicher Intelligenz erstellt werden, und erste Spiele kommen schon völlig ohne Game-Engine aus, etwa Doom, das von einer Bild-KI nachgebildet (t3n Pro) wird, was die Spieleentwicklung nicht nur völlig neu denkt, sondern auch Spieler:innen anders miteinbezieht, die ein Game durch Prompts selbst verändern können.

Einen ganz ähnlichen Ansatz gibt es nun auch mit Super Mario Bros., das wir eigentlich vom NES kennen. Forscher:innen der Tech-Firma Virtuals Protocol wollen herausfinden, ob ein KI-Modell zur „Erstellung und Demonstration eines zuverlässigen und steuerbaren Videospielgenerators“ genutzt werden kann; erste Ergebnisse ihrer Arbeit haben sie nun in einem Paper veröffentlicht.

MarioVGG: Game-Programmierung per Prompt-Eingabe?

Das Text-zu-Video-KI-Modell der Forschenden trägt den Namen MarioVGG und wurde im Training mit über 737.000 Frames gefüttert, um die grundlegenden Gameplay-Dynamiken von Super Mario Bros. zu erlernen. Um den Versuch zunächst zu vereinfachen, wurde nur mit zwei möglichen Aktionen gearbeitet: „nach rechts laufen“ und „nach rechts laufen und springen“.

Wie Ars Technica schreibt, ist das Ergebnis noch immer voller Bugs und von flüssigem Gameplay könne keine Rede sein, doch „die Ergebnisse zeigen, wie selbst ein begrenztes Modell allein durch das Studium einiger Video- und Eingabedaten beeindruckende physikalische und Gameplay-Dynamiken ableiten kann.“ So war MarioVGG in der Lage, „die Physik des Spiels rein aus Videobildern in den Trainingsdaten zu lernen, ohne explizite, fest codierte Regeln“, heißt es in dem Forschungs-Paper. Dazu gehörte etwa das Fallen, wenn Mario über eine Kante läuft.

Auch Halluzinationen des KI-Modells, die etwa Hindernisse für Mario darstellten, sollen sich teilweise äußerst stimmig in die Spieleatmosphäre integriert haben – allerdings wurden auch visuelle Störungen wie Farbwechsel der Spielfigur oder das Hindurchgehen durch Hindernisse von MarioVGG halluziniert.

6 Sekunden Rechenzeit für rund eine halbe Sekunde Videospielsequenz

Obwohl die von Virtuals Protocol veröffentlichten Beispiele auf den ersten Blick gut (wenn auch bedingt durch die geringe Auflösung von 64×48 Pixel unscharf) aussehen, ist die KI noch ein gutes Stück davon entfernt, zum „vollständigen Ersatz der Spieleentwicklung“ zu werden.

Dessen sind sich auch die Forscher:innen bewusst, die in ihrem bisherigen Experiment mithilfe einer einzelnen RTX 4090 in sechs Sekunden gerade einmal sechs Frames generieren konnten. Das sei „weder praktikabel noch benutzerfreundlich“, doch die Forscher:innen hoffen, mit einem längeren Training, größeren Datensätzen und mehr Rechen-Ressourcen bessere Ergebnisse erzielen zu können.

Luft nach oben ist also noch einige vorhanden, vor allem wenn man sich anschaut, was Googles Diffusions-KI GameNGen in Sachen Doom bereits leisten kann – dennoch nennt Ars Technica MarioVGG einen „unterhaltsamen Proof of Concept, der zeigt, dass selbst begrenzte Trainingsdaten und Algorithmen einige anständige Startmodelle für einfache Spiele erstellen können“.

Inwiefern KI Progammierer:innen, die aktuell bereits von großen Entlassungswellen geplagt werden, künftig ersetzen kann und wird, wird sich zeigen müssen. Im besten Fall bleibt KI ein Werkzeug, das neue Möglichkeiten bietet, statt menschliche Kreativität überflüssig zu machen.

