Mehr als nur Blöcke stapeln: Forscher nutzen Minecraft, um KI-Agenten echte Autonomie beizubringen
Generative KI-Modelle haben in den vergangenen Jahren enorme Fortschritte gemacht und sind mittlerweile im Alltag vieler Menschen angekommen. Sie erstellen auf Zuruf Texte und Bilder oder fassen Informationen für uns zusammen. Wirklich autonome Systeme, die Probleme selbst erkennen und lösen, sind hingegen weiterhin eine Herausforderung.
Helfen sollen Open-World-Videospiele. Denn die bieten umfangreiche virtuelle Welten, die nach klaren Regeln funktionieren und so die perfekte Forschungsumgebung für autonome KI-Agenten bieten.
Vor allem das Sandbox-Game Minecraft ist beliebt bei KI-Forscher:innen. So haben Wissenschaftler:innen der Carnegie Mellon University mit MineRL schon 2020 eine Bibliothek zum Einsatz von KI in dem Spiel vorgestellt. Es folgten weitere Projekte, wie das vor zwei Jahren veröffentlichte MineDojo. Das wiederum bildet jetzt die Grundlage für ein neues KI-Framework namens Odyssey, von dem sich die Entwickler:innen einen weiteren Schritt nach vorn erhoffen.
Eine autonome Odyssee in Minecraft
Die Forscher:innen hinter dem Odyssey-Framework kritisieren, dass bestehende Agentensysteme für Minecraft vorwiegend die Lösung einfacher Aufgaben im Blick haben, etwa das Sammeln von Ressourcen oder die Herstellung von Werkzeugen.
„Solche Aufgaben bewerten von Natur aus nur die Fähigkeit von großen Sprachmodellen, innerhalb eines begrenzten Aufgabenraums Prioritäten bei den Bastelschritten zu setzen, und nicht ihr Potenzial für komplizierte und vielfältige Lösungen“, erläutern die Forscher:innen in ihrem als Vorabdruck veröffentlichten Paper.
Weil das eine Erkundung der verschiedenen Spielmöglichkeiten durch KI-Agenten erschwere, rüsten sie diese mithilfe ihres Frameworks mit weiter reichenden Open-World-Fähigkeiten aus. Ziel dabei ist aber nicht die Erstellung eines einzelnen KI-Agenten, sondern die Grundlage für autonome Agenten zu schaffen, die dann eigenständig die Welt von Minecraft erkunden sollen.
Mithilfe des nötigen Rüstzeugs, das unter anderem aus einem am Minecraft-Wiki trainierten Sprachmodell besteht, sollen Agenten für ihre jeweiligen Ziele konkrete Pläne entwickeln und Schritt für Schritt ausführen können. Dabei werden die übergeordneten Ziele in Zwischenaufgaben aufgeteilt und dann unter Berücksichtigung der konkreten Spielumgebung umgesetzt.
Selbstkritisch durch virtuelle Welten
Jeder einzelne Schritt des Agenten wird von Odyssey dokumentiert. Dadurch kann die KI überprüfen, ob das Ergebnis dem ursprünglichen Ziel entspricht. Gleichzeitig soll die KI aber auch prüfen, warum ein Plan fehlgeschlagen ist. Auf die Art sollen zukünftige Probleme dann immer besser gelöst werden können.
Geprüft werden soll das Ergebnis der jeweiligen KI-Agenten dann anhand eines von den Odyssey-Macher:innen vorgestellten Benchmark-System, das verschiedene Problemstellungen umfasst und etwa langfristige Planungsfähigkeiten oder dynamisches Reaktionsvermögen von Agenten anhand festgelegter Kriterien bewerten soll.
Wer sich dafür interessiert, der findet auf GitHub sämtliche Quellcodes, Datensätze und Modellgewichte unter der freien MIT-Lizenz.