Anzeige
Anzeige
MIT Technology Review News

Mit GPT-4: So sollen Roboter jetzt noch schneller ihren Weg durch deine Wohnung finden

Dinge öffnen und aufheben in einer unbekannten Umgebung ist für Roboter schwierig. Ein Forscherteam geht diese Herausforderung an, indem Aufzeichnungen des Ablaufs an das Sprachmodell von OpenAI weitergeleitet werden.

Von MIT Technology Review Online
3 Min.
Artikel merken
Anzeige
Anzeige
Öffnen und Aufheben: Der Roboter Stretch übt im Haushalt und GPT-4o "schaut", ob er es richtig gemacht hat. (Screenshot: Pinto, Shaffiulah et al.)

Aufgaben erledigen in einer für sie bisher unbekannten Umgebung ist für Roboter eine immense Herausforderung. Normalerweise müssen Forscher:innen sie für jeden neuen Ort, den sie betreten, mit neuen Daten trainieren. Das kann mitunter sehr zeitaufwendig und teuer werden.

Anzeige
Anzeige

Diese Schwierigkeit ist ein Forscherteam angegangen und hat jetzt eine Reihe von KI-Modellen entwickelt, die Robotern beibringen, grundlegende Aufgaben in neuen Umgebungen ohne weiteres Training oder Feinabstimmung zu erledigen. Die insgesamt fünf KI-Modelle werden unter der Bezeichnung RUM zusammengefasst: robot utility models (also: Roboter-Gebrauchsmuster). In der Studie erreichen damit programmierte Maschinen auf unbekanntem Terrain eine Erfolgsquote von 90 Prozent bei fünf verschiedenen Aufgaben: das Öffnen von Türen und Schubladen, das Aufheben von Taschentüchern, Taschen und zylindrischen Gegenständen. Mithilfe dieses Ansatzes könnten Roboter einfacher und kostengünstiger aus dem Labor und hinein in neue Umgebungen, wie unseren Haushalt, so die Hoffnung.

Wie bringt man einem Roboter bei, beispielsweise eine Tür zu öffnen, egal wo?

„In der Vergangenheit haben sich die Menschen sehr auf das Problem konzentriert: ‚Wie bringen wir Roboter dazu, alles zu tun?‘, aber nicht wirklich gefragt: ‚Wie bringen wir Roboter dazu, die Dinge zu tun, die sie können – überall?‘“, sagt Mahi Shafiullah, ein Doktorand an der New York University, der an dem Projekt mitgearbeitet hat. „Wir haben uns die Frage gestellt: Wie bringt man einem Roboter bei, beispielsweise eine Tür zu öffnen, egal wo?“

Anzeige
Anzeige

Um Robotern neue Fähigkeiten beizubringen, sind in der Regel viele Daten erforderlich, die nur schwer zu beschaffen sind. Da die Trainingsdaten für Roboter physisch gesammelt werden müssen – Zeit und Kosten (Argument siehe oben) –, ist es viel anspruchsvoller, Trainingsdatenbanken für Roboter zu erstellen und zu skalieren als für große Sprachmodelle, die mit Informationen aus dem Internet trainiert werden.

Um die Daten schneller zu erfassen, die nötig sind, um einem Roboter neue Fähigkeiten beizubringen, entwickelten die Forscher eine neue Version eines Tools aus früheren Forschungsarbeiten: ein iPhone an einem simplen Greifarm, wie er normalerweise zum Aufsammeln von Müll verwendet wird.

Anzeige
Anzeige

Einsatz in Wohnungen in New York City

Diese Konstruktion, angebracht an einem Roboterarm, hatte schließlich ihren Einsatz in etwa 1.000 Demonstrationen in 40 verschiedenen Umgebungen, darunter Wohnungen in New York City und Jersey City. Bei jeder der fünf Aufgaben erstellte es Aufnahmen – auch bei diesem Fundus profitierte das Team aber ebenfalls von Daten, die bei früheren Forschungsarbeiten gesammelt worden. Anschließend trainierten sie Lernalgorithmen auf den fünf Datensätzen, um die fünf RUM-Modelle zu erstellen.

Der Roboter Stretch der Firma Hello Robot nutzte in der Folge diese Modelle. Stretch besteht aus einer Einheit auf Rädern, einer hohen Stange samt Kamera und einem einziehbaren Arm mit dem iPhone. Letzteres diente gewissermaßen als Kontrolle, wie erfolgreich der Roboter die Aufgaben in neuen Umgebungen ohne zusätzliche Anpassungen ausführen konnte. Obwohl das Team mit Stretch und RUM-Modellen eine Abschlussquote von 74,4 Prozent erreichte, konnten die Forscher diese auf eine Erfolgsquote von 90 Prozent steigern. Das gelang, indem sie Bilder vom iPhone und der am Kopf des Roboters montierten Kamera aufnahmen, sie dem aktuellen Sprachmodell GPT-4o von OpenAI übermittelten und es fragten, ob die Aufgabe erfolgreich abgeschlossen wurde. Wenn GPT-4o „nein“ sagte, setzten sie den Roboter einfach zurück und versuchten es erneut.

Anzeige
Anzeige

Wer mehr über den Stand der Robotik erfahren möchte, dem sei Ausgabe 5/2024 von MIT Technology Review empfohlen. Darin beschäftigen wir uns damit, wie KI die Robotik beflügeln kann. Hier könnt ihr die TR 5/2024 bestellen.

Der Traum für Robotiker

„Es ist schön zu sehen, dass es in all diesen unterschiedlichen Haushalten und Küchen getestet wird, denn wenn man einen Roboter dazu bringen kann, in freier Wildbahn in einem beliebigen Haus zu arbeiten, ist das das eigentliche Ziel der Robotik“, sagt Mohit Shridhar, ein auf robotische Manipulation spezialisierter Forscher, der nicht an der Arbeit beteiligt war.

Das Projekt könnte als allgemeines Rezept für den Bau anderer nützlicher Robotermodelle für andere Aufgaben dienen und dabei helfen, Robotern mit minimalem Mehraufwand neue Fähigkeiten beizubringen und es Menschen, die keine ausgebildeten Robotiker sind, zu erleichtern, zukünftige Roboter in ihren Häusern einzusetzen, sagt der involvierte Doktorand Shafiullah.

„Unser Traum ist es, dass ich etwas trainieren, es ins Internet stellen kann und du es herunterladen und auf einem Roboter in deinem Haus ausführen kannst“, sagt er.

Anzeige
Anzeige
Autorin des Textes ist Rhiannon Williams. Sie ist News-Redakteurin bei der US-amerikanischen Ausgabe der MIT Technology Review.

Roboter im Einsatz

Roboter in Action: Acht spannende Tech-Helfer im Einsatz Quelle: Diligent Robotics

 

 

Mehr zu diesem Thema
Fast fertig!

Bitte klicke auf den Link in der Bestätigungsmail, um deine Anmeldung abzuschließen.

Du willst noch weitere Infos zum Newsletter? Jetzt mehr erfahren

Anzeige
Anzeige
Kommentare

Community-Richtlinien

Bitte schalte deinen Adblocker für t3n.de aus!
Hallo und herzlich willkommen bei t3n!

Bitte schalte deinen Adblocker für t3n.de aus, um diesen Artikel zu lesen.

Wir sind ein unabhängiger Publisher mit einem Team von mehr als 75 fantastischen Menschen, aber ohne riesigen Konzern im Rücken. Banner und ähnliche Werbemittel sind für unsere Finanzierung sehr wichtig.

Schon jetzt und im Namen der gesamten t3n-Crew: vielen Dank für deine Unterstützung! 🙌

Deine t3n-Crew

Anleitung zur Deaktivierung
Artikel merken

Bitte melde dich an, um diesen Artikel in deiner persönlichen Merkliste auf t3n zu speichern.

Jetzt registrieren und merken

Du hast schon einen t3n-Account? Hier anmelden

oder
Auf Mastodon teilen

Gib die URL deiner Mastodon-Instanz ein, um den Artikel zu teilen.

Community-Richtlinien

Wir freuen uns über kontroverse Diskussionen, die gerne auch mal hitzig geführt werden dürfen. Beleidigende, grob anstößige, rassistische und strafrechtlich relevante Äußerungen und Beiträge tolerieren wir nicht. Bitte achte darauf, dass du keine Texte veröffentlichst, für die du keine ausdrückliche Erlaubnis des Urhebers hast. Ebenfalls nicht erlaubt ist der Missbrauch der Webangebote unter t3n.de als Werbeplattform. Die Nennung von Produktnamen, Herstellern, Dienstleistern und Websites ist nur dann zulässig, wenn damit nicht vorrangig der Zweck der Werbung verfolgt wird. Wir behalten uns vor, Beiträge, die diese Regeln verletzen, zu löschen und Accounts zeitweilig oder auf Dauer zu sperren.

Trotz all dieser notwendigen Regeln: Diskutiere kontrovers, sage anderen deine Meinung, trage mit weiterführenden Informationen zum Wissensaustausch bei, aber bleibe dabei fair und respektiere die Meinung anderer. Wir wünschen Dir viel Spaß mit den Webangeboten von t3n und freuen uns auf spannende Beiträge.

Dein t3n-Team

Kommentar abgeben

Melde dich an, um Kommentare schreiben und mit anderen Leser:innen und unseren Autor:innen diskutieren zu können.

Anmelden und kommentieren

Du hast noch keinen t3n-Account? Hier registrieren

Anzeige
Anzeige