ChatGPT und Dall-E: KI wird Gaming verändern – die Frage ist, wie sehr
Von künstlicher Intelligenz generierte Kunst taucht jetzt schon in Videospielen auf. Wie etwa in dem gerade erst erschienenen „High on Life“, in dem einem Forum-User seltsame Poster aufgefallen sind. Sie zeugen deutlich davon, dass eine KI vorhandenes Material genutzt, zerstückelt und vermengt hat, um daraus vermeintlich neue Bilder zu kreieren. Zudem hat ein Elfjähriger kürzlich ein Text-Adventure in Minuten erstellt – dank ChatGPT.
Es könnte erst der Beginn einer Entwicklung sein, in der KI-Anwendungen wie Dall-E für Bilder und ChatGPT für Text die Produktion von Videospielen stark verändern – und damit auch ihren Inhalt.
Von Mockups zu 3D-Assets
Der Nutzen von Bild-KI wie Dall-E ist dabei naheliegend: Mit wenigen Befehlen können Artworks erstellt und in Spielen genutzt werden. „Wir haben uns aber dagegen entschieden – aus moralischen und rechtlichen Gründen“, sagt Benjamin Lochmann, Gründer und CEO vom deutschen Spielestudio Pixel Maniacs, das gerade an „Chromagun 2“ arbeitet. Da Dall-E die Arbeiten von Künstlerinnen und Künstlern nutzt, habe man sich dazu entschlossen, das Tool nicht für die Entwicklung zu nutzen – zumindest nicht direkt.
„Stattdessen nutzen wir es als Inspiration. In ‚Chromagun 2‘ soll es ein Multiversum aus unterschiedlichen Dimensionen geben. Dall-E konnte uns da bei Mockups helfen“, sagt er. Sie gaben dem Tool Beschreibungen, wie die Dimensionen aussehen sollen, und bekamen so in Minutenschnelle Ergebnisse:
„Die Bilder benutzen wir nicht direkt im Spiel, sondern sehen sie als eine Grundlage dafür, wie die Dimensionen aussehen können“, sagt Lochmann. Eine Künstlerin oder ein Künstler hätte für solche Mockups Stunden, wenn nicht Tage gebraucht. In die Zukunft gedacht, sieht Lochmann noch mehr Einsatzmöglichkeiten solcher KI-Tools. Besonders dann, wenn neben Bildern auch 3D-Objekte von einer KI kreiert werden können.
„Die Generierung von 3D-Assets dauert sehr lange. Wenn man da schreiben könnte: ‚Mach mal einen Low-Poly-Scifi-Roboter‘, und schon hätte man sein Asset, mit dem man arbeiten kann, wäre das krass“, sagt er. So krass sogar, dass er so ein Tool als bedrohlich für einige Arbeitsplätze sieht, die noch von Menschen ausgefüllt werden. „Gerade Einstiegsjobs in der Gamesbranche könnten dann gefährdet sein“, sagt er.
Echte und falsche KI
KI ist an einem Punkt angekommen, an dem jeder und jede ihren Nutzen erkennen kann. Sie ist von einem eher abstrakten Konzept zu einer konkreten Anwendung geworden: Am Ende steht das Bild oder der Text. Darum erleben wir gerade diesen Boom – etliche Apps, die mit „KI“ locken und schier unendliche Möglichkeiten versprechen. Das bedeutet aber nicht, dass KI nicht schon lange eine große Rolle in der Entwicklung von Videospielen spielt.
Schon seit vielen Jahren bewegt sich die Industrie immer weiter in Richtung Automatisierung. Wo früher komplexer Code selbst geschrieben werden musste, reichen heute schon oft einfache Befehle, die dann in Game-Engines ausgeführt werden. Auch die neuen KI-Tools werden aktuell vor allem genutzt, um Abläufe weiter zu automatisieren und die Arbeit für Entwickler:innen zu vereinfachen.
Per Hand Bäume in eine Open World zu setzen, ist etwa eine sehr mühsame Arbeit. Stattdessen kann KI das automatisiert und massenhaft tun. Mit einigen Variablen dazu, wie Blätter oder Stämme aussehen können, wird die Arbeit innerhalb kürzester Zeit erledigt. Bei Spielen mit engeren und durchdesignten Spielwelten würde das aber wiederum weniger gut funktionieren.
Doch selbst in Spielen wird KI – oder (Vor-)Formen davon – schon seit Jahrzehnten eingesetzt. Das eindrücklichste Beispiel ist wohl die KI von computergesteuerten Gegnern. Die scheinen auf den Input der Spieler:innen einzugehen, sich hinter Mauern zu verschanzen oder sie in Fallen zu locken. Vor einigen Jahren erschienen zudem Spiele wie „Hello Neighbor“ oder „Echo“, die angaben, eine lernende KI zu bieten, die sich auf den Spielstil der User:innen einstellt.
Nicht immer ist das, was wir KI nennen, aber wirklich künstliche Intelligenz. Vielmehr handelt es sich oft um Skripte, „wenn, dann“-Szenarien, die von den Entwickler:innen vorgegeben sind. Die Gegner reagieren also nicht intelligent, sondern wählen aus einer von mehreren vorgegebenen Varianten. Einer KI hingegen gibt man gewisse Parameter, innerhalb derer sie frei agiert.
So unterscheiden sich Spiele wie „No Man’s Sky“ mit prozedural erstellter Spielwelt von Spielen, die von „echter KI“ entwickelt würden. Prozedurale Generierung folgt einer Abfolge von festen Optionen, die miteinander kombiniert werden. KI entwickelt hingegen ein Modell, in dem sie „intelligent“ agiert. Die Nachvollziehbarkeit bleibt aus.
Spiele mit unendlichen Möglichkeiten – und Fehlern
Wie weit das in einem Videospiel gehen kann, deutet ChatGPT heute schon an. Anfang 2021 hat der Entwickler Lee Vermeulen ein Sandbox-Framework gebaut, in dem Charaktere herumlaufen, die durch eine API mit GPT-3 verbunden sind. Er stellte den Charakteren in VR Fragen: „Wohin gehst du?“. Die KI antwortete darauf – und sie konnte sogar Folgefragen beantworten. Das lief noch recht zeitverzögert, da das Tool nicht direkt im Framework integriert, sondern nur angebunden ist. Aber es zeigt, wohin die Reise gehen kann.
„Eines meiner Traumprojekte ist ein dynamisches, generatives Textadventure, in dem ich der KI die Regeln der Welt beibringe und jeder Spieler etwas anderes erlebt“, sagt Paul Lawitzki, Softwareentwickler und Game-Designer beim deutschen Studio Chasing Carrots. Er sieht den größten Nutzen von ChatGPT und anderen Text-KI darin, Spiele unvorhersehbar zu machen.
Eine KI könnte Dialoge dynamisch erstellen, oder die Lore einer Spielwelt variabel bauen. So, dass sie direkt und individuell auf den Input der Spieler:innen reagiert. „Ich bin mir sicher, dass ChatGPT jetzt schon von großen Gaming-Studios benutzt wird. Die Spiele sind nur noch nicht erschienen“, sagt Lawitzki.
Wenn man feste Regeln setzen würde, innerhalb der ein ChatGPT Dialoge für Charaktere erstellt, könne das Tool schon jetzt die Entwicklung von Spielen stark verändern. „Ich kann der KI Infos zum Zustand der Welt geben. Etwa: NPC 1 ist mit NPC 2 befreundet. Aber NPC 2 geht fremd mit der Frau von NPC 1“, dann könnte das Tool dann anhand dieser Regeln auf den Input der Spieler:innen reagieren.
Gleichzeitig ist er aber überzeugt, dass das nur eine Spielart von vielen sein wird. Menschen würden auch weiterhin menschgemachte Geschichten erleben wollen. Zumal so eine KI auch in Sackgassen landen könne, wenn sie nicht richtig trainiert ist – was wiederum viel Arbeit ist. „KI kann den Faden verlieren, sich in Widersprüchen verstricken, Dinge wiederholen“. Zumal es die Nuancen menschlicher Kommunikation – Subtext, Körpersprache, Betonung, Ironie – als Eingabe nicht oder nur fehlerhaft verstehen könne.
KI ohne Menschen geht nicht
All diese KI-Anwendungen funktionieren deshalb so gut, weil sie auf einen gigantischen Fundus an von Menschen gemachter Substanz zurückgreifen können – und müssen. Dall-E nimmt bereits vorhandene Werke und fügt sie zu einem Bild zusammen, das zu den Schlagworten passt, die der oder die User:in eingegeben hat. ChatGPT greift auf bereits vorhandene Texte, Bücher oder wissenschaftliche Arbeiten zurück. Es wurde von Menschen trainiert, um möglichst „intelligente“ Antworten auf die Anfragen der User:innern zu geben.
Bei jeder Diskussion über künstliche Intelligenz, bei der Frage, wie intelligent sie wirklich ist und wie sehr sie unser Berufsleben verändern wird, ist genau dieser Punkt zu bedenken: KI funktioniert, weil sie gefüttert wurde. Sie funktioniert, weil Menschen vorher die Arbeit gemacht haben – über Jahrtausende an Wissen und Erfahrung.
Schon jetzt gibt es Anzeichen dafür, dass KI „dümmer“ wird, seit sie für Anwendungen wie Dall-E genutzt wird. Auch das liegt auf der Hand: Wenn in den Fundus des Ausgangsmaterials nun auch KI-Bilder eingehen und aus diesem Bildern wieder neue Bilder entstehen – dann war es das mit der Genialität. Das fortlaufende Training der KI ist also genauso wichtig, wie ein möglicher Einsatz der KI. Ohne Menschen geht es nicht.
Eine dystopische Zukunft?
KI-Tools haben einen weiteren Einfluss auf die Games-Entwicklung – indem die künstliche Intelligenz selbst zum Gegenstand des Spiels wird. Jörg Friedrich arbeitet mit seinem Studio Paintbucket Games an einem Prototyp mit dem Namen „Silicon Sunk“, mit einem leicht dystopischen Szenario. „In 80 Jahren arbeitet niemand mehr, KI macht alles. Wir konsumieren nur noch und sind auf Social-Media-Plattformen unterwegs“, erzählt Friedrich.
Doch dann bekommt die KI Probleme, wie sie auch Menschen haben: Die Psyche spielt nicht mehr mit. Die Aufgabe der Spieler:innen ist es, sie zu reparieren. Da das in dieser dystopischen Welt aber verboten ist – neu kaufen ist besser als reparieren –, müssen sie gegen Liquidierungsdrohnen kämpfen, die die defekte KI zerstören wollen.
Auch für ihr Concept-Art hat Paintbucket Games eine Bild-KI genutzt:
„Mich beeindruckt vor allem die Programmierfähigkeiten dieser Tools. Wie schnell sie etwa Fehler korrigieren können, wenn man sie darauf hinweist“, sagt Friedrich. So könne man ChatGPT etwa Code schreiben lassen: First-Person-Steuerung in einem 3D-Raum, in der Engine Unity. „Natürlich nutzt die KI dann Quellen von Menschen, die so einen Code schon geschrieben haben“, sagt er.
Doch könnten solche Funktionen besonders für kleinere Studios enorme Vorteile bringen. Die Entwicklungsgeschwindigkeit würde dadurch extrem erhöht. „Das wird aber gleichzeitig alle unter Druck setzen, diese Tools auch zu benutzen. Sonst bist du bald langsamer als die anderen“, gibt er zu bedenken.
Für spezialisierten Code, wenn es also in die Tiefen des eigenen Spiels geht, würde die KI jedoch noch nicht funktionieren. Denn sie würde die Regeln dieses Codes nicht kennen. „Aber wenn es um Prototypen geht, oder darum, einen Anfang zu finden, sehe ich enorme Effizienzgewinne“, sagt er.
Jörg Friedrich kann beiden Extremen nichts abgewinnen: weder sieht er KI-Tools wie Dall-E und ChatGPT als Heilsbringer, die alles richten werden, noch sieht er sie als Jobvernichter. „Sicher wird es einige Jobs geben, gerade bei Visual Artists, die obsolet werden“, sagt er. Aber schlussendlich brauche es eben doch immer noch Menschen, die erkennen können, was gut und was schlecht funktioniert.
„Es wird ganz viel verändern“, sagt er. „Aber die Gegenwart, wie wir sie gerade erleben, existiert sowieso noch nicht lange“. Es sei alles im Wandel. Die Frage ist nur, unter welchen Regeln dieser Wandeln stattfindet.
ich hoffe das es nicht zuviel KI in Games geben wird ,sonst könnte es schnell passieren ,dass man eher stundenlange Gespräche mit der hübschen Tavernenmaid führt als das Game zu spielen und Leute noch mehr Suchtpotenzial finden.