Rabbit präsentiert seinen KI-Agenten – aber ohne den R1

Anfang 2024 hat Rabbit für viel Aufsehen gesorgt: Das Tech-Startup stellte mit R1 einen physischen KI-Agenten vor, der es Nutzer:innen ermöglichen sollte, Apps auf ihrem Smartphone oder anderen Geräten per Sprache zu steuern, indem er die Benutzeroberflächen selbstständig bedient. Es stellte sich aber heraus, dass das Gerät kaum über die versprochenen Fähigkeiten verfügte – und sorgte dementsprechend für große Ernüchterung.
Am 19. Februar hat das Rabbit-Team ein Video veröffentlicht, in dem die Nutzung eines generalistischen Android-Agenten demonstriert wird. Dabei ist auch der Rabbit R1 zu sehen. Allerdings kommt das Gerät nicht zum Einsatz. Stattdessen werden die Befehle nur in einen Laptop eingegeben, der sie dann auf einem Android-Tablet ausführt.
Die Funktionsweise von LAM Playground
Rabbit ist ein KI-Unternehmen, das sich auf die Entwicklung intelligenter Agenten zur Steuerung von Softwareanwendungen spezialisiert hat. Mit dem Rabbit R1 wollte das Startup Anfang 2024 ein Gerät auf den Markt bringen, das als smarter Alltagsassistent verschiedene Aufgaben für die Nutzer:innen übernehmen sollte – von der Steuerung von Musik-Apps über Online-Bestellungen bis hin zur Terminverwaltung. Die Präsentation erregte große Aufmerksamkeit, aber schon bald stellte sich heraus, dass der R1 bei Weitem nicht so leistungsfähig und innovativ war wie angekündigt. Viele der versprochenen Funktionen waren stark eingeschränkt oder fehlten sogar komplett.
In dem neuen Video demonstrieren zwei Rabbit-Mitarbeiter, wie LAM Playground funktioniert. Im Gegensatz zum Rabbit R1 handelt es sich dabei nicht um ein physisches Gerät, sondern um einen virtuellen KI-Agenten, der in der Lage sein soll, eigenständig Apps zu bedienen. Er basiert auf einer Technologie namens Large Action Model – kurz LAM.
Die große Innovation bleibt aus
Besonders auffällig: Obwohl der Rabbit R1 als zentrales Produkt des Unternehmens vermarktet wurde, kommt er im Video überhaupt nicht zum Einsatz. Stattdessen geben die Ingenieure ihre Befehle in ein Eingabefeld auf einem Laptop ein, der die Anweisungen in Aktionen auf einem Android-Tablet umsetzt. LAM Playground wird unter anderem damit beauftragt, ein YouTube-Video zu finden, ein Whiskey-Cocktailrezept in einer Cocktail-App zu suchen, die benötigten Zutaten zu sammeln und diese in eine Einkaufsliste einzutragen. Außerdem erhält der KI-Agent die Aufgabe, das Smartphone-Spiel 2048 herunterzuladen und herauszufinden, wie es gespielt wird.
Das Modell führt die meisten Aufgaben zufriedenstellend aus, zeigt aber gelegentlich unerwartete Verhaltensweisen. So verschickt es zum Beispiel ein Gedicht über Whatsapp nicht als zusammenhängenden Text, sondern versendet jede Zeile als einzelne Nachricht. Einer der Ingenieure überlegt, ob eine klarere Formulierung mit dem Hinweis auf Zeilenumbrüche das Problem hätte vermeiden können – ausprobiert wird es aber nicht.
Rabbit zeigt sich weiterhin optimistisch
Wie es in dem Beitrag von Rabbit heißt, würden die präsentierten Beispiele lediglich den Kern der Aktionsschleife, die ein Android-Agent durchläuft, zeigen. Dabei wird einmal mehr deutlich, dass sich der KI-Agent des Unternehmens noch in der Entwicklungsphase befindet. Dennoch gibt sich Rabbit um Gründer und CEO Jesse Lyu optimistisch und kündigt an, in den kommenden Wochen weitere Details zu seinem plattformübergreifenden Multi-Agenten-System zu veröffentlichen.