Videos als Trainingsdaten: KI lernt, indem sie 70.000 Stunden Minecraft schaut
Für das Training der künstlichen Intelligenz wurden die Daten echter Spieler:innen genutzt. Der Bot soll nun sehr gut im Minecraft-Zocken sein, wie es in einem Bericht der Technology Review heißt.
KI lernt durch Beobachtung
Bei der Methode des Imitationslernens lernt die KI durch die Beobachtung von Menschen, die eine Aufgaben lösen. Bei dieser Forschung wurden dafür auch Videos eingesetzt. Dafür haben die Forscher:innen einerseits Gamer:innen ihre Bildschirme aufzeichnen lassen, während sie Minecraft gespielt haben, und andererseits auch ihre Klicks aufgezeichnet.
Bislang war das sehr aufwendig: Jede Aktion musste einzeln beschrieben werden, sprich: „Klick hier, dann passiert dies; klick da, dann passiert jenes.“ Mit der neuen Methode, genannt Video Pre-Training (kurz VPT), mussten die Forscher:innen die Klick- und Videodaten nur noch verbinden.
70.000 Stunden Game-Videos
Dazu haben sie die entstandenen Videos mit einer Abspieldauer von insgesamt 2.000 Stunden genommen und die Daten für weitere, unkommentierte Videos aus dem Internet genutzt. Insgesamt hatten die unkommentierten Internetvideos eine Abspieldauer von 70.000 Stunden.
Diese Datensätze wurden dann der KI gegeben – die hatte also eine ganze Menge Material. Das Ergebnis: Die KI soll allein durchs „Zuschauen“ gut in dem Game geworden sein. Sie ist jetzt der erste Bot, der das Diamant-Werkzeug bei Minecraft herstellen kann. Auch Aufgaben, wie Bäume fällen, kann die KI im Spiel ausführen.
Minecraft eignet sich gut zum KI-Training
Da es bei Minecraft kein klares Spielziel gibt, war diese Lernmethode geeigneter als das in den vergangenen Jahren häufig genutzte Nachahmungslernen. Dabei lernt die KI durch (Fehl-)Versuche, was natürlich nur klappt, wenn es Aufgaben gibt, die ein klares Ziel haben – die also auch nicht gelöst werden können.
So ist Minecraft aufgrund der vielen Möglichkeiten und der fehlenden Begrenzung durch klare Spielziele eine geeignete Testfläche, um eine KI über Imitation zu trainieren.
Am besten lernt eine KI laut Forscher:innen übrigens, wenn beide Lernmöglichkeiten zusammen eingesetzt werden. Trainiert wird zwar im Spiel, die Ergebnisse wirken sich jedoch auf die Realität aus. KI können so für die Steuerung von Roboterarmen oder beim Autonomen Fahren trainiert werden.
Die KI hat bei Minute 8:03 Kohle übersehen