Mit GPT-4: So sollen Roboter jetzt noch schneller ihren Weg durch deine Wohnung finden

Aufgaben erledigen in einer für sie bisher unbekannten Umgebung ist für Roboter eine immense Herausforderung. Normalerweise müssen Forscher:innen sie für jeden neuen Ort, den sie betreten, mit neuen Daten trainieren. Das kann mitunter sehr zeitaufwendig und teuer werden.
Diese Schwierigkeit ist ein Forscherteam angegangen und hat jetzt eine Reihe von KI-Modellen entwickelt, die Robotern beibringen, grundlegende Aufgaben in neuen Umgebungen ohne weiteres Training oder Feinabstimmung zu erledigen. Die insgesamt fünf KI-Modelle werden unter der Bezeichnung RUM zusammengefasst: robot utility models (also: Roboter-Gebrauchsmuster). In der Studie erreichen damit programmierte Maschinen auf unbekanntem Terrain eine Erfolgsquote von 90 Prozent bei fünf verschiedenen Aufgaben: das Öffnen von Türen und Schubladen, das Aufheben von Taschentüchern, Taschen und zylindrischen Gegenständen. Mithilfe dieses Ansatzes könnten Roboter einfacher und kostengünstiger aus dem Labor und hinein in neue Umgebungen, wie unseren Haushalt, so die Hoffnung.
Wie bringt man einem Roboter bei, beispielsweise eine Tür zu öffnen, egal wo?
„In der Vergangenheit haben sich die Menschen sehr auf das Problem konzentriert: ‚Wie bringen wir Roboter dazu, alles zu tun?‘, aber nicht wirklich gefragt: ‚Wie bringen wir Roboter dazu, die Dinge zu tun, die sie können – überall?‘“, sagt Mahi Shafiullah, ein Doktorand an der New York University, der an dem Projekt mitgearbeitet hat. „Wir haben uns die Frage gestellt: Wie bringt man einem Roboter bei, beispielsweise eine Tür zu öffnen, egal wo?“
Um Robotern neue Fähigkeiten beizubringen, sind in der Regel viele Daten erforderlich, die nur schwer zu beschaffen sind. Da die Trainingsdaten für Roboter physisch gesammelt werden müssen – Zeit und Kosten (Argument siehe oben) –, ist es viel anspruchsvoller, Trainingsdatenbanken für Roboter zu erstellen und zu skalieren als für große Sprachmodelle, die mit Informationen aus dem Internet trainiert werden.
Um die Daten schneller zu erfassen, die nötig sind, um einem Roboter neue Fähigkeiten beizubringen, entwickelten die Forscher eine neue Version eines Tools aus früheren Forschungsarbeiten: ein iPhone an einem simplen Greifarm, wie er normalerweise zum Aufsammeln von Müll verwendet wird.
Einsatz in Wohnungen in New York City
Diese Konstruktion, angebracht an einem Roboterarm, hatte schließlich ihren Einsatz in etwa 1.000 Demonstrationen in 40 verschiedenen Umgebungen, darunter Wohnungen in New York City und Jersey City. Bei jeder der fünf Aufgaben erstellte es Aufnahmen – auch bei diesem Fundus profitierte das Team aber ebenfalls von Daten, die bei früheren Forschungsarbeiten gesammelt worden. Anschließend trainierten sie Lernalgorithmen auf den fünf Datensätzen, um die fünf RUM-Modelle zu erstellen.
Der Roboter Stretch der Firma Hello Robot nutzte in der Folge diese Modelle. Stretch besteht aus einer Einheit auf Rädern, einer hohen Stange samt Kamera und einem einziehbaren Arm mit dem iPhone. Letzteres diente gewissermaßen als Kontrolle, wie erfolgreich der Roboter die Aufgaben in neuen Umgebungen ohne zusätzliche Anpassungen ausführen konnte. Obwohl das Team mit Stretch und RUM-Modellen eine Abschlussquote von 74,4 Prozent erreichte, konnten die Forscher diese auf eine Erfolgsquote von 90 Prozent steigern. Das gelang, indem sie Bilder vom iPhone und der am Kopf des Roboters montierten Kamera aufnahmen, sie dem aktuellen Sprachmodell GPT-4o von OpenAI übermittelten und es fragten, ob die Aufgabe erfolgreich abgeschlossen wurde. Wenn GPT-4o „nein“ sagte, setzten sie den Roboter einfach zurück und versuchten es erneut.
Wer mehr über den Stand der Robotik erfahren möchte, dem sei Ausgabe 5/2024 von MIT Technology Review empfohlen. Darin beschäftigen wir uns damit, wie KI die Robotik beflügeln kann. Hier könnt ihr die TR 5/2024 bestellen.
Der Traum für Robotiker
„Es ist schön zu sehen, dass es in all diesen unterschiedlichen Haushalten und Küchen getestet wird, denn wenn man einen Roboter dazu bringen kann, in freier Wildbahn in einem beliebigen Haus zu arbeiten, ist das das eigentliche Ziel der Robotik“, sagt Mohit Shridhar, ein auf robotische Manipulation spezialisierter Forscher, der nicht an der Arbeit beteiligt war.
Das Projekt könnte als allgemeines Rezept für den Bau anderer nützlicher Robotermodelle für andere Aufgaben dienen und dabei helfen, Robotern mit minimalem Mehraufwand neue Fähigkeiten beizubringen und es Menschen, die keine ausgebildeten Robotiker sind, zu erleichtern, zukünftige Roboter in ihren Häusern einzusetzen, sagt der involvierte Doktorand Shafiullah.
„Unser Traum ist es, dass ich etwas trainieren, es ins Internet stellen kann und du es herunterladen und auf einem Roboter in deinem Haus ausführen kannst“, sagt er.
Roboter im Einsatz