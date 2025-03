Das chinesische Startup Butterfly Effect macht seinem Namen alle Ehre. Kaum hatte es in der vergangenen Woche seinen KI-Agenten Manus veröffentlicht, verbreitete dieser sich online wie ein Lauffeuer. Und das nicht nur in China. Er hat sich seinen Weg in die breite Tech-Welt gebahnt. So lobten etwa Twitter-Mitbegründer Jack Dorsey und der Produktleiter von Hugging Face, Victor Mustar, seine Leistung. Einige haben es sogar als „das zweite Deepseek“ bezeichnet, das Anfang des Jahres die KI-Branche aufgrund seiner unerwarteten Fähigkeiten und seiner Herkunft überraschte.



Anzeige Anzeige

Was das Besondere am KI-Agenten Manus ist

Manus soll der weltweit erste allgemeine KI-Agent sein, der mehrere KI-Modelle, etwa Claude 3.5 Sonnet von Anthropic und fein abgestimmte Versionen des quelloffenen Qwen von Alibaba sowie verschiedene unabhängig arbeitende Agenten einsetzt. Auf diese Weise soll es dem Agenten möglich sein, eine breite Palette von Aufgaben autonom zu erledigen. Das ist der große Unterschied zu KI-Chatbots wie Deepseek, die auf einer einzigen großen Sprachmodellfamilie basieren und in erster Linie für Konversationsinteraktionen konzipiert sind.

Trotz des ganzen Hypes konnten Manus bisher nur wenige Menschen nutzen. Es gibt eine Warteliste, auf die man sich eintragen kann. Aber bisher haben weniger als ein Prozent der Nutzer:innen auf dieser Liste einen Einladungscode erhalten. Es ist allerdings unklar, wie viele Leute auf dieser Liste stehen, deswegen ist die Angabe unter Vorbehalt zu verstehen. Um eine grobe Einschätzung zu haben: der Discord-Channel von Manus hat mehr als 186.000 Mitglieder.

Anzeige Anzeige

KI-Agent Manus ausprobiert

Für MIT Technology Review konnte ich Manus exklusiv testen. Mein erster Eindruck: Die Zusammenarbeit fühlt sich an, wie die Unterstützung durch einen hochintelligenten und effizienten Praktikanten. Aber der Vergleich hinkt etwas: Zwar versteht er gelegentlich nicht, worum er gebeten wird, trifft falsche Rückschlüsse oder nimmt „Abkürzungen“, um Aufgaben zu beschleunigen. Allerdings erklärt er seine Überlegungen klar, ist bemerkenswert anpassungsfähig und kann sich erheblich verbessern, wenn es detaillierte Anweisungen oder Feedback erhält. Mein Manus-Fazit: Vielversprechend, aber nicht perfekt.

Genau wie das Vorgängerprodukt der Muttergesellschaft, eine KI-Assistentin namens Monica, die 2023 auf den Markt kam, ist Manus für ein globales Publikum gedacht. Englisch ist als Standardsprache eingestellt, und das Design ist klar und minimalistisch.

Anzeige Anzeige

Um sich anzumelden, muss ein Benutzer einen gültigen Einladungscode eingeben. Dann leitet das System die Benutzer auf eine Landing-Page weiter, die der von ChatGPT oder Deepseek sehr ähnlich ist. Frühere Sitzungen werden in einer linken Spalte angezeigt, in der Mitte ist das Chat-Eingabefeld. Auf der Landing-Page finden sich auch vom Unternehmen kuratierte Aufgabenbeispiele, die von der Entwicklung von Geschäftsstrategien über interaktives Lernen bis hin zu maßgeschneiderten Audiomeditationssitzungen reichen.

Dem KI-Agenten Manus über die Schulter schauen

Wie andere auf Reasoning-Modellen basierende KI-Tools, wie zum Beispiel ChatGPT Deep Research, zerlegt Manus Aufgaben in einzelne Schritte und navigiert selbstständig im Internet, um die für die Erledigung der Aufgaben erforderlichen Informationen zu finden. Das Besondere an Manus ist das „Manus’s Computer“-Fenster, in dem die Benutzer nicht nur beobachten können, was der Agent tut, sondern auch jederzeit eingreifen können.

Anzeige Anzeige

Drei Aufgaben für den KI-Agenten Manus

Als Test habe ich Manus drei Aufgaben gegeben:

eine Liste mit namhaften Reportern, die über China berichten, zusammenstellen nach Immobilienangeboten mit zwei Schlafzimmern in New York City zu suchen potenzielle Kandidat:innen für die Innovators Under 35 zu nominieren, eine Liste, die jedes Jahr von MIT Technology Review erstellt wird.

Das kam dabei heraus:

Aufgabe 1: Die erste Liste von Reportern, die Manus mir gab, enthielt nur fünf Namen, darunter fünf „ehrenvolle Erwähnungen“. Mir fiel auf, dass die Liste zwar die bemerkenswerte Arbeit einiger Journalist:innen auflistete, dies aber bei anderen nicht der Fall war. Ich fragte Manus nach dem Grund. Der Grund war denkbar einfach: Es wurde faul. Das lag „zum Teil an Zeitmangel, da ich versuchte, den Rechercheprozess zu beschleunigen“, erklärte mir der Agent. Als ich auf Konsistenz und Gründlichkeit bestand, antwortete Manus mit einer umfassenden Liste von 30 Journalist:innen, in der ihr derzeitiges Unternehmen und ihre bemerkenswerten Arbeiten aufgeführt waren. (Ich war froh zu sehen, dass ich es zusammen mit vielen meiner geliebten Kolleg:innen auf die Liste geschafft hatte.)

Anzeige Anzeige

Was mich beeindruckte war, dass ich Änderungsvorschläge auf höchster Ebene machen konnte – und das Programm reagierte angemessen. Und obwohl anfangs Änderungen im Arbeitgeberstatus einiger Journalisten übersehen wurden, wurden sie auf meine Bitte hin, einige Ergebnisse zu überprüfen, schnell korrigiert. Ein weiteres nettes Feature: Die Ergebnisse konnten als Word- oder Excel-Datei heruntergeladen werden, so dass sie sich leicht bearbeiten oder mit anderen teilen ließen.

Beim Zugriff auf Nachrichtenartikel von Journalisten hinter Bezahlschranken stieß Manus jedoch auf ein Problem: Es gab häufig Captcha-Sperren. An diesen Stellen wäre es nützlich, wenn eine künftige Version von Manus proaktiv darauf hinweist, wenn es auf diese Art von Einschränkungen stößt.

Aufgabe 2: Für die Wohnungssuche gab ich Manus eine Reihe komplexer Such-Kriterien vor: Darunter ein Budget und Anforderungen an die Wohnung, wie eine geräumige Küche, einen Außenbereich, Zugang zum Stadtzentrum von Manhattan und einen Hauptbahnhof, der in sieben Minuten zu Fuß zu erreichen ist. Manus interpretierte vage Anforderungen wie „eine Art Außenbereich“ zunächst zu wörtlich und schloss Objekte ohne private Terrasse oder Balkon komplett aus. Nach weiterer Beratung und Klärung erstellte er jedoch eine umfassendere und hilfreichere Liste. Sie gab Empfehlungen in Abstufung an und enthielt übersichtliche Aufzählungspunkte.

Anzeige Anzeige

Das endgültige Ergebnis hatte dann das Flair von Empfehlungsportalen: Da wurde das „beste Gesamtangebot“, das „beste Preis-Leistungs-Verhältnis“ und die „Luxusoption“ angepriesen. Für diese Aufgabe (einschließlich des Hin- und Herschreibens) wurde weniger als eine halbe Stunde benötigt – viel weniger Zeit als für die Zusammenstellung der Journalistenliste (die etwas mehr als eine Stunde dauerte), was wahrscheinlich daran liegt, dass Immobilienangebote online offener zugänglich und besser strukturiert sind.

Aufgabe 3: Diese Aufgabe war die umfangreichste: Ich bat Manus, 50 Personen für die diesjährige Liste der „Innovatoren unter 35“ zu nominieren. Diese Liste zu erstellen, ist für unser Team jedes Mal eine enorme Herausforderung. Wir erhalten normalerweise jedes Jahr Hunderte von Nominierungen. Daher war ich neugierig, wie gut Manus abschneiden würde. Er teilte die Aufgabe in mehrere Schritte, darunter die Durchsicht früherer Listen, um die Auswahlkriterien zu verstehen, die Entwicklung einer Suchstrategie zur Identifizierung von Kandidat:innen, die Zusammenstellung von Namen und die Sicherstellung einer vielfältigen Auswahl von Kandidat:innen aus der ganzen Welt.

Die Entwicklung einer Suchstrategie war der zeitaufwändigste Teil für Manus. Das Computerfenster von Manus zeigte, dass der Agent schnell durch Websites angesehener Forschungsuniversitäten, Ankündigungen von Technologiepreisen und Nachrichtenartikel blätterte, auch wenn er seinen Ansatz nicht ausdrücklich beschrieb. Allerdings stieß er erneut auf Hindernisse, als er versuchte, auf akademische Arbeiten und kostenpflichtige Medieninhalte zuzugreifen.

Anzeige Anzeige

Nach drei Stunden Internetrecherche, in denen Manus mich (verständlicherweise) mehrmals fragte, ob ich die Suche eingrenzen könne, kamen schließlich nur drei Kandidat:innen mit vollständigen Hintergrundprofilen dabei heraus. Als ich das Programm erneut aufforderte, eine vollständige Liste mit 50 Namen zu erstellen, wurde schließlich eine erstellt, aber bestimmte akademische Einrichtungen und Fachgebiete waren stark überrepräsentiert, was auf einen unvollständigen Rechercheprozess hindeutete. Als ich auf das Problem hinwies und das Programm bat, fünf Kandidat:innen aus China zu finden, gelang es ihm, eine solide Liste mit fünf Namen zu erstellen, obwohl die Ergebnisse in Richtung chinesischer Medienlieblinge verschoben waren. Schließlich musste ich aufgeben, nachdem das System mich gewarnt hatte, dass die Leistung von Manus nachlassen könnte, wenn ich weiterhin zu viel Text eingäbe.

Wie hat KI-Agent Manus in den Tests abgeschnitten?

Meine Fazit: Manus ist ein sehr intuitives Werkzeug, das für Benutzer:innen mit oder ohne Programmierkenntnisse geeignet ist. Bei zwei der drei Aufgaben lieferte es bessere Ergebnisse als ChatGPT Deep Research, obwohl es deutlich länger brauchte, um sie zu lösen. Manus scheint am besten für analytische Aufgaben geeignet zu sein, die umfangreiche Recherchen im offenen Internet erfordern, aber nur einen begrenzten Umfang haben. Mit anderen Worten, es ist am besten, sich an die Art von Aufgaben zu halten, die ein qualifizierter menschlicher Praktikant während eines Arbeitstages erledigen könnte.

Minuspunkte beim KI-Agenten

Dennoch läuft nicht alles glatt. Häufige Abstürze und Systeminstabilitäten können vorkommen, und es kann zu Problemen kommen, wenn große Textmengen verarbeitet werden sollen. Die Meldung „Aufgrund der hohen Auslastung des Dienstes können keine Aufgaben erstellt werden. Bitte versuchen Sie es in ein paar Minuten noch einmal“ blinkte ein paar Mal auf meinem Bildschirm auf, wenn ich versuchte, neue Anfragen zu starten. Gelegentlich fror der Computer von Manus auf einer bestimmten Seite für längere Zeit ein.

Anzeige Anzeige

Die Fehlerquote ist höher als bei ChatGPT Deep Research – ein Problem, das das Team laut Manus‘ Chefwissenschaftler Peak Ji derzeit in Angriff nimmt. Das chinesische Medienunternehmen 36Kr berichtet jedoch, dass die Kosten von Manus pro Aufgabe bei etwa zwei US-Dollar liegen, was nur ein Zehntel der Kosten von Deep Research ist. Wenn das Manus-Team seine Serverinfrastruktur stärkt, kann ich mir vorstellen, dass das Tool zu einer bevorzugten Wahl für Einzelanwender:innen wird. Insbesondere für Angestellte, unabhängige Entwickler und kleine Teams.

Pluspunkte des KI-Agenten

Dass der Arbeitsprozess von Manus relativ transparent und kooperativ ist, sehe ich definitiv als Pluspunkt. Es stellt aktiv Fragen und speichert wichtige Anweisungen als „Wissen“ in seinem Speicher für die spätere Verwendung. Dadurch können für ähnliche Aufgaben lediglich Anpassungen nötig sein. Es ist auch sehr schön, dass jede Sitzung wiederholbar ist und gemeinsam genutzt werden kann.

Ich kann mir durchaus vorstellen, dass ich Manus weiterhin für alle möglichen Aufgaben verwende, sowohl privat als auch beruflich. Ich bin mir zwar nicht sicher, ob die Vergleiche mit Deepseek ganz richtig sind, aber es ist ein weiterer Beweis dafür, dass chinesische KI-Unternehmen nicht nur in die Fußstapfen ihrer westlichen Pendants treten. Anstatt nur Basismodelle zu erneuern, gestalten sie die Einführung autonomer KI-Agenten aktiv auf ihre eigene Weise.

Dieser Artikel stammt von Caiwei Chen. Sie ist China-Reporterin für die US-amerikanische Ausgabe von MIT Technology Review

Mehr zu diesem Thema