Deepmind hat mit Robocat ein KI-Modell vorgestellt, das verschiedene Arten von Roboterarmen so steuern kann, dass sie unterschiedliche Aufgaben ausführen. Das allein wäre noch keine Sensation. Aber Robocat ist laut Googles KI-Schmiede das erste Modell, das die unterschiedlichen Aufgaben mit echten Roboterarmen in der realen Welt durchführen kann.
Neue Aufgaben, unterschiedliche Roboterarme
Dabei stelle sich Robocat außerordentlich schnell sowohl auf neue Aufgaben als auch auf unterschiedliche Ausführungen von Roboterarmen ein, wie Deepmind-Forscher Alex Lee gegenüber Techcrunch ausführte.
Bei der Entwicklung von Robocat haben sich die Deepmind-Forscher:innen von „Gato“ inspirieren lassen, einem ebenfalls von Deepmind entwickelten KI-Modell für die Interaktion mit Texten, Bilder und Veranstaltungen. Robocat wurde mit Bildern und Daten von Robotern gefüttert. Zum Teil stammten die Trainingsdaten von Robocat selbst.
Steuerung von Roboterarmen: So lernt Robocat
Zunächst, so schreibt Deepmind in einem entsprechenden Blogeintrag, wurden zwischen 100 und 1.000 Vorführungen einer bestimmten Aufgabe oder eines von Menschenhand gesteuerten Roboterarms gesammelt. Dabei handelte es sich um simple Dinge wie das Einsammeln von Werkzeugen oder das Stapeln von Bausteinen.
Dann wurde ein Teil von Robocat auf jede einzelne dieser Aufgaben trainiert. Im Schnitt musste die KI eine Aufgabe 10.000 Mal durchführen. Mit den Daten der jeweiligen Robocat-Spin-offs und den Demo-Trainingsdaten wurden das Gesamtmodell weiter trainiert.
Robocat: 253 Aufgaben in 141 Anwendungsfällen
Zum Schluss beherrschte Robocat 253 Aufgaben in 141 verschiedenen Anwendungsfällen – sowohl in der Simulation als auch der realen Welt. Letztlich könne das KI-Modell neue Aufgaben lernen, indem es sich weniger als 100 Vorführungen „ansehe“, so Deepmind.
Das würde die Barriere für das Erfüllen neuer Aufgaben in der Robotik enorm senken, so Deepmind-Forscher Lee. Und die Entwicklung werde noch beflügelt durch die Fähigkeit des KI-Modells, sich selbst zu verbessern, etwa durch selbst erzeugte Trainingsdaten.
Künftig will Deepmind die Zahl der für das Erfüllen einer Aufgabe notwendigen Demonstrationen auf unter zehn senken, wie Techcrunch schreibt.