Digit: Wie die Technologie hinter ChatGPT diesen Roboter antreibt

News MIT Technology Review

Digit: Wie die Technologie hinter ChatGPT diesen Roboter antreibt

Die Software für den humanoiden Roboter Digit funktioniert wie ein großes Sprachmodell. Beim Spaziergang durch San Francisco zeigte sich, dass der Zweibeiner damit nicht nur vorwärts laufen konnte.

Von Wolfgang Stieler

24.04.2024, 15:30 Uhr • 3 Min.

Digit: Wie die Technologie hinter ChatGPT diesen Roboter antreibt — Der Roboter Digit kann auch rückwärts laufen, obwohl er dafür nicht trainiert wurde. (Foto: Ilija Radosavovic, University of California, Berkeley.)

Dieser Humanoide sieht ein bisschen aus wie aus Star Wars – nur vielleicht nicht ganz so elegant. Aber der Digit-Roboter ist keine Science-Fiction, sondern echt.

Ilija Radosavovic und Kollegen von der University of California, Berkeley haben dem etwa 1,60 Meter großen und rund 45 Kilogramm schweren Zweibeiner von Agility Robotics mithilfe eines Transformer-Modells beigebracht, auf den unterschiedlichsten Oberflächen stabil zu laufen. Das Modell arbeitet im Prinzip genau so wie die großen Sprachmodelle, auf denen Chatbots wie ChatGPT beruhen. Und ganz ähnlich wie bei den großen Sprachmodellen entwickelte die Software auch in diesem Fall gänzlich neue Fähigkeiten, auf die sie zuvor nicht trainiert worden war: So hatte sie etwa gelernt, auch rückwärts zu laufen. Technische Einzelheiten beschreiben Radosavovic und Kollegen in einem Paper auf dem Preprint-Server Arxiv.

Laufen für Anfänger

Humanoide, also menschenähnliche Roboter, die ähnlich groß sind wie Erwachsene, gibt es seit den 1970er-Jahren. Dass es verblüffend schwer ist, solche Maschinen auch wie Menschen zum Laufen zu bringen, stellte sich allerdings recht schnell heraus. Theoretisch ist die Lösung des Problem gar nicht so schwierig – allerdings nur dann, wenn der Roboter nicht all zu schnell über einen perfekt ebenen Boden läuft. Zwar hat es seitdem große technische Fortschritte gegeben, der Atlas-Roboter von Boston Dynamics etwa kann einen Hindernis-Parcours bewältigen, das funktioniert aber in der Regel immer nur für einen Spezialfall und muss aufwendig dafür optimiert werden.

Seit einigen Jahren forschen daher diverse Gruppen und Unternehmen an Methoden, bei denen der Roboter aus hinreichend vielen Beispielen die optimalen Bewegungen lernen soll. Radosavovic und sein Team wollten den Roboter mit einem neuronalen Netz in Transformer-Architektur steuern – der Architektur, die auch bei großen Sprachmodellen verwendet wird. Das war allerdings nur über einen Umweg möglich.

Zu wenig Daten

„Im Gegensatz zur Sprache haben wir jedoch keinen leicht zugänglichen Datensatz mit Daten über das Gehen von Humanoiden, aus dem wir lernen könnten“, sagt Radosavovic. „Mit anderen Worten, wir fangen bei Null an, tabula rasa.“

Die Forschenden trainierten ihr Transformer-Modell daher durch Versuch und Irrtum – mittels Verstärkungslernen. „Der Roboter führt zu Beginn zufällige Bewegungssequenzen aus. Jedes Mal, wenn er über ein erwünschtes Verhalten stolpert, zum Beispiel Balancieren oder einen Schritt machen, geben wir eine Belohnung und ermutigen den Roboter, dieses Verhalten wahrscheinlicher zu machen. Wenn der Roboter dagegen ein unerwünschtes Verhalten zeigt, zum Beispiel einen Sturz, gibt es eine Bestrafung/negative Belohnung, um ihn in Zukunft davon abzuhalten“, schreibt Radosavovic. „Im Laufe vieler Versuche konvergiert dieser Prozess zu einem neuronalen Netz, das in der Lage ist, den Roboter zum Laufen zu bringen.“ Die Ergebnisse dieses Trainings beschreiben die Forschenden aktuell in einem Aufsatz für die Fachzeitschrift Science Robotics.

Empfehlungen der Redaktion

News

Cyborg-Kakerlaken: Singapurs Forscher entwickeln ferngesteuerte Insekten

News

Dieser Roboter soll euch im Haushalt helfen und mit euch Gespräche führen – und das schon 2025

News

Dieser kleine Roboter soll hüpfend Asteroiden erkunden

Nach diesem ersten Training war Digit in der Lage, zuverlässig über unterschiedliches Terrain zu laufen, ohne zu stürzen, und mit externen Störungen umzugehen – selbst wenn er unterschiedliche Lasten trug und gestoßen wurde. In ihrer neuesten Arbeit verwendeten die Forschenden dann diese Software, um in einem Simulator Trainingsdaten zu generieren. Zusammen mit Video-Aufnahmen laufender Menschen und Sensordaten des Roboters bekamen die Forschenden genug Daten, um ein neues Transformer-Modell zu trainieren, das nun von Grund selbstständig gehen lernte.

Aktion für Aktion

Das so trainierte Transformer-Modell funktioniert nun tatsächlich so ähnlich wie ein Sprachmodell: Es sagt nach einer Abfolge von Bewegungen die nächste, sinnvolle Bewegung in Form eines Action-Token voraus, die dann ausgeführt wird, und so weiter. Das funktionierte nicht nur in der Simulation, sondern auch bei verschiedenen Experimente in der Stadt. Außerdem entwickelte der Roboter neue Verhaltensweisen. So war er beispielsweise auch in der Lage, rückwärts zu gehen, ohne dabei zu stolpern, ohne explizit darauf trainiert worden zu sein. „Das Ergebnis zeigt einen vielversprechenden Weg, um weitere, komplexe Fähigkeiten zu lernen“, schreiben die Forschenden. Als nächstes wollen sie den Roboter darauf trainieren, Hindernisse zu überwinden, und ihm komplexe Greifbewegungen mit mehrfingrigen Händen beibringen.

Mehr zu diesem Thema

MIT Technology Review Roboter ChatGPT

Verpasse keine News! 💌

Hinweis zum Newsletter & Datenschutz

Fast fertig!

Bitte klicke auf den Link in der Bestätigungsmail, um deine Anmeldung abzuschließen.

Du willst noch weitere Infos zum Newsletter? Jetzt mehr erfahren

Schreib den ersten Kommentar!

Bitte beachte unsere Community-Richtlinien

Wir freuen uns über kontroverse Diskussionen, die gerne auch mal hitzig geführt werden dürfen. Beleidigende, grob anstößige, rassistische und strafrechtlich relevante Äußerungen und Beiträge tolerieren wir nicht. Bitte achte darauf, dass du keine Texte veröffentlichst, für die du keine ausdrückliche Erlaubnis des Urhebers hast. Ebenfalls nicht erlaubt ist der Missbrauch der Webangebote unter t3n.de als Werbeplattform. Die Nennung von Produktnamen, Herstellern, Dienstleistern und Websites ist nur dann zulässig, wenn damit nicht vorrangig der Zweck der Werbung verfolgt wird. Wir behalten uns vor, Beiträge, die diese Regeln verletzen, zu löschen und Accounts zeitweilig oder auf Dauer zu sperren.

Trotz all dieser notwendigen Regeln: Diskutiere kontrovers, sage anderen deine Meinung, trage mit weiterführenden Informationen zum Wissensaustausch bei, aber bleibe dabei fair und respektiere die Meinung anderer. Wir wünschen Dir viel Spaß mit den Webangeboten von t3n und freuen uns auf spannende Beiträge.

Dein t3n-Team

Kommentieren