Anzeige
Anzeige
MIT Technology Review News

KI-Modell für den Haushalt: Startup entwickelt Roboter, der sogar deine Wäsche erledigt

Fast alle derzeitigen Roboter sind als Spezialisten auf ganz bestimmte Aufgaben trainiert. Das junge Startup Physical Intelligence will das ändern – und hat dafür viel Geld gesammelt.

Von Eike Kühl
3 Min.
Artikel merken
Anzeige
Anzeige
Der Roboter π0 von Physical Intelligence räumt Wäsche von der Maschine in den Trockner. (Screenshot von Video von Physical Intelligence)

Anfang des Jahres erschien ein Video, in dem der von Tesla entwickelte humanoide Roboter Optimus ein T-Shirt faltet. Wenig später kam heraus, dass bei der Präsentation – wie so oft bei Produkten, an denen der rechte Milliardär Elon Musk beteiligt ist – zu viel versprochen wurde: Der Roboter wurde nämlich durch einen Menschen gesteuert. Das Startup Physical Intelligence aus San Francisco will zeigen, wie es besser geht. Es entwickelt ein KI-Modell, mit dessen Hilfe Roboter in Zukunft eine Vielzahl an Arbeiten im Haushalt und darüber hinaus erledigen sollen.

Anzeige
Anzeige

In einem Blogbeitrag und einem dazugehörigen Paper (PDF) hat Physical Intelligence das Basismodell mit dem Namen π0 (Pi-Zero) vorgestellt. „Wir entwickeln nicht einfach ein Gehirn für einen bestimmten Roboter“, sagt der Mitgründer und Geschäftsführer Karol Hausmann im Gespräch mit der New York Times. „Sondern ein Generalistengehirn, das jeden Roboter steuern kann.“

Roboter mit „Verständnis physikalischer Zusammenhänge“

In Videos zeigen die Forschenden des Unternehmens, wie verschiedene Roboter mit Greifarmen diverse Haushaltsarbeiten verrichten: Sie räumen den Trockner aus, nehmen die Wäsche aus dem Korb und falten sie, füllen Bohnen in die Kaffeemaschine, entsorgen Müll und bestücken Eierkartons. Die Besonderheit ist, dass die Roboter nicht gezielt auf diese Arbeiten trainiert wurden, sondern dank π0 ein „allgemeines Verständnis physikalischer Zusammenhänge“ haben, das sie auch auf neue, ihnen bis dato fremde Arbeiten anwenden können.

Anzeige
Anzeige

Die Idee: Dank künstlicher Intelligenz müssen die Roboter der Zukunft nicht erst mühsam programmiert werden, um anschließend spezielle Aufgaben verrichten zu können. Stattdessen erteilt man ihnen Aufträge, etwa per Text- oder Spracheingabe, und sie orientierten sich anschließend selbst an ihrer Umgebung und ihren technischen Möglichkeiten, um sie erfolgreich auszuführen.

Ein Roboter, der selbstständig Lösungen findet

π0 besteht aus zwei Pre-Trainings-Komponenten. Zum einen aus einem Vision-Language-Model (VLM), also einem KI-Modell, das sowohl Text- als auch Bilddaten versteht. So wie große Sprachmodelle mit Informationen aus dem Internet trainiert werden, wird auch π0 zunächst mit öffentlich zugänglichen Videos und Texten trainiert, um dadurch „Allgemeinwissen, semantisches Denken und Problemlösungsfähigkeiten“ zu erhalten. Das Modell lernt zum Beispiel, was mit einem Ausdruck wie „Wäschefalten“ überhaupt gemeint ist.

Anzeige
Anzeige

Die zweite Komponente betrifft die Steuerung von Robotern. Die Forschenden haben das Modell dafür mit insgesamt 10.000 Stunden „Geschicklichkeitsdaten“ von sieben verschiedenen Roboterkonfigurationen und 68 Aufgaben trainiert, sowie mit zusätzlichen Open-Source-Daten zur Manipulation von Objekten. Dadurch lernt das Modell, wie ein Roboter sich bewegen muss, um gewisse Aufgaben zu bewältigen. Dadurch entsteht ein sogenanntes Vision-Language-Action Model (VLA). Ein Verfahren namens Flow Matching synchronisiert die Bewegungen mit dem gelernten Allgemeinwissen.

Um komplexe Aufgaben, darunter das Falten von Wäsche, zu meistern, kann das Modell anschließend noch einem Feintuning unterzogen werden: „Durch das Vortraining lernt das Modell die physische Welt kennen, während es durch die Feinabstimmung lernt, eine bestimmte Aufgabe gut zu erfüllen“, schreiben die Verantwortlichen.

Anzeige
Anzeige

400 Millionen US-Dollar Risikokapital für Physical Intelligence

Da es keinen direkten Vergleich zu π0 gibt, sei es schwierig, die Fähigkeiten des Modells zu evaluieren, heißt es. Im Vergleich mit anderen VLA-Modellen schneide es aber praktisch in allen getesteten Aufgaben besser ab. Trotzdem sei es noch ein weiter Weg, bis es wirklich Roboter gibt, denen man einfach Aufgaben erteilen kann, für die sie nicht spezialisiert sind. Oder bis es eine KI gibt, die mit möglichst vielen verschiedenen, verfügbaren Robotern funktioniert – etwa auch mit Teslas Optimus.

„Obwohl unsere Ergebnisse darauf hindeuten, dass universelle vortrainierte Basismodelle für Roboter möglich sind, bleibt es abzuwarten, ob sich diese Universalität auch auf weitaus unterschiedlichere Bereiche wie autonomes Fahren oder die Fortbewegung mit Beinen anwenden lässt“, heißt es abschließend.

An Geld für weitere Forschung mangelt es Physical Intelligence jedenfalls nicht. Obwohl das Startup erst Anfang des Jahres gegründet wurde, hat es kürzlich schon eine neue Kapitalrunde in Höhe von 400 Millionen US-Dollar abgeschlossen. Das Unternehmen hat dadurch bereits eine Bewertung von mehr als zwei Milliarden US-Dollar. Zu den jüngsten Investoren zählen unter anderem Amazon-Gründer Jeff Bezos und OpenAI.

Anzeige
Anzeige

 

 

Fast fertig!

Bitte klicke auf den Link in der Bestätigungsmail, um deine Anmeldung abzuschließen.

Du willst noch weitere Infos zum Newsletter? Jetzt mehr erfahren

Anzeige
Anzeige
Kommentare

Community-Richtlinien

Bitte schalte deinen Adblocker für t3n.de aus!
Hallo und herzlich willkommen bei t3n!

Bitte schalte deinen Adblocker für t3n.de aus, um diesen Artikel zu lesen.

Wir sind ein unabhängiger Publisher mit einem Team von mehr als 75 fantastischen Menschen, aber ohne riesigen Konzern im Rücken. Banner und ähnliche Werbemittel sind für unsere Finanzierung sehr wichtig.

Schon jetzt und im Namen der gesamten t3n-Crew: vielen Dank für deine Unterstützung! 🙌

Deine t3n-Crew

Anleitung zur Deaktivierung
Artikel merken

Bitte melde dich an, um diesen Artikel in deiner persönlichen Merkliste auf t3n zu speichern.

Jetzt registrieren und merken

Du hast schon einen t3n-Account? Hier anmelden

oder
Auf Mastodon teilen

Gib die URL deiner Mastodon-Instanz ein, um den Artikel zu teilen.

Community-Richtlinien

Wir freuen uns über kontroverse Diskussionen, die gerne auch mal hitzig geführt werden dürfen. Beleidigende, grob anstößige, rassistische und strafrechtlich relevante Äußerungen und Beiträge tolerieren wir nicht. Bitte achte darauf, dass du keine Texte veröffentlichst, für die du keine ausdrückliche Erlaubnis des Urhebers hast. Ebenfalls nicht erlaubt ist der Missbrauch der Webangebote unter t3n.de als Werbeplattform. Die Nennung von Produktnamen, Herstellern, Dienstleistern und Websites ist nur dann zulässig, wenn damit nicht vorrangig der Zweck der Werbung verfolgt wird. Wir behalten uns vor, Beiträge, die diese Regeln verletzen, zu löschen und Accounts zeitweilig oder auf Dauer zu sperren.

Trotz all dieser notwendigen Regeln: Diskutiere kontrovers, sage anderen deine Meinung, trage mit weiterführenden Informationen zum Wissensaustausch bei, aber bleibe dabei fair und respektiere die Meinung anderer. Wir wünschen Dir viel Spaß mit den Webangeboten von t3n und freuen uns auf spannende Beiträge.

Dein t3n-Team

Kommentar abgeben

Melde dich an, um Kommentare schreiben und mit anderen Leser:innen und unseren Autor:innen diskutieren zu können.

Anmelden und kommentieren

Du hast noch keinen t3n-Account? Hier registrieren

Anzeige
Anzeige