In diesen vier Punkten werden KI-Agenten 2025 noch besser – laut Anthropic-Mitgründer Kaplan

Agentenbasierte KIs bekommen die Fähigkeit, Computer zu benutzen, sollen also Tippen, Scrollen und Anklicken. (Bild: Midjourney / t3n)
KI-Agenten sind derzeit das heißeste Thema in der Technologiebranche. Führende Unternehmen von Google Deepmind über OpenAI bis hin zu Anthropic arbeiten daran, große Sprachmodelle um die Fähigkeit zu erweitern, Aufgaben selbstständig auszuführen. Im Fachjargon als agentenbasierte KI bekannt, sind solche Systeme schnell zum neuen Ziel des Silicon Valley geworden. Von Nvidia bis Salesforce spricht jeder darüber, wie sie die Branche umkrempeln werden.
„Wir glauben, dass 2025 die ersten KI-Agenten in die Belegschaft eintreten und die Leistung von Unternehmen wesentlich verändern werden“, schrieb OpenAI-Geschäftsführer Sam Altman Anfang Januar in einem Blogbeitrag. Im weitesten Sinne ist ein KI-Agent ein Softwaresystem, das loslegt und etwas tut, meist mit nur minimaler oder gar keiner Überwachung. Je komplexer diese Aufgabe ist, desto intelligenter muss der Agent sein.
Was bereits KI-Agenten können
Für viele sind große Sprachmodelle inzwischen intelligent genug, um KI-Agenten zu betreiben, die eine ganze Reihe nützlicher Aufgaben für uns erledigen können. Dazu gehören etwa das Ausfüllen von Formularen, das Nachschlagen eines Rezepts und das Hinzufügen der Zutaten zu einem Online-Einkaufskorb. Sie könnten aber auch mithilfe einer Suchmaschine in letzter Minute vor einer Besprechung ein Thema recherchieren und eine schnelle Zusammenfassung in Stichpunkten erstellen.
Letzten Oktober stellte das US-Unternehmen Anthropic einen der bisher fortschrittlichsten Agenten vor: eine Erweiterung seines Claude-Großsprachmodells namens „Computer Use“. Wie der Name schon sagt, kann man Claude anweisen, einen Computer zu benutzen, ähnlich wie ein Mensch es tun würde, der einen Cursor bewegt, auf Schaltflächen klickt und Texte eintippt. Anstatt sich einfach nur mit Claude zu unterhalten, kann man ihn jetzt bitten, Aufgaben auf dem Bildschirm auszuführen.
Anthropic weist darauf hin, dass diese Funktion noch umständlich und fehleranfällig ist. Aber sie ist bereits für eine Handvoll Tester:innen verfügbar, darunter Drittentwickler bei Unternehmen wie dem Lieferservice DoorDash und Software-Entwicklern wie das auf die Erstellung visueller Inhalte spezialisierte Unternehmen Canva und Asana, das eine Software für Arbeitsorganisation und Projektmanagement vertreibt.
Die Computernutzung ist nur ein Vorgeschmack auf die Aufgaben, die auf KI-Agenten zukommen wird. Um zu erfahren, was sie künftig können sollen, hat MIT Technology Review mit Jared Kaplan, dem Mitgründer und Chefwissenschaftler von Anthropic gesprochen. Hier sind die vier Möglichkeiten, die er für die Verbesserungen von Agenten im Jahr 2025 sieht.
1. KI-Agenten werden besser mit Tools umgehen
„Ich denke, es gibt zwei Achsen, um darüber nachzudenken, wozu KI fähig ist. Die eine ist die Frage, wie komplex die Aufgabe ist, die ein System erledigen kann. Da KI-Systeme immer intelligenter werden, werden sie auch in dieser Richtung besser. Ein weiterer wichtiger Aspekt ist die Frage, welche Art von Umgebungen oder Werkzeugen die KI nutzen kann.“
„Wenn man fast zehn Jahre zurückgeht und [Deepminds Go-Spielmodell] AlphaGo betrachtet, hatten wir KI-Systeme, die übermenschlich gut Brettspiele spielen konnten. Aber wenn man nur mit einem Brettspiel arbeiten kann, dann ist das eine sehr eingeschränkte Umgebung. Es ist nicht wirklich nützlich, auch wenn es sehr intelligent ist. Mit Textmodellen, dann mit multimodalen Modellen und jetzt mit der Computernutzung – und vielleicht in Zukunft mit Robotern – bewegt man sich auf die Möglichkeit zu, KI in verschiedene Situationen und Aufgaben einzubringen und sie nützlich zu machen.“
„Wir waren von der Computernutzung vor allem aus diesem Grund begeistert. Bis vor kurzem war es bei großen Sprachmodellen notwendig, ihnen eine sehr spezifische Eingabeaufforderung zu geben, ihnen sehr spezifische Werkzeuge an die Hand zu geben, und dann sind sie auf eine bestimmte Art von Umgebung beschränkt. Meiner Meinung nach wird sich die Computernutzung wahrscheinlich schnell verbessern, wenn es darum geht, wie gut Modelle verschiedene Aufgaben und komplexere Aufgaben erledigen können. Und sie erkennen auch, wenn sie Fehler gemacht haben oder wenn eine wichtige Frage ansteht und sie den Benutzer um Feedback bitten müssen.“
2. KI-Agenten werden personalisierter
„Claude muss genug über deine spezielle Situation und die Bedingungen, unter denen du arbeitest, erfahren, um nützlich zu sein. Zum Beispiel, welche Rolle du innehast, wie dein Schreibstil ist oder welche Bedürfnisse du und dein Unternehmen haben.“
„Ich denke, dass wir dort Verbesserungen sehen werden, wo Claude Dinge wie deine Dokumente, dein Slack und Ähnliches durchsuchen kann, um wirklich zu lernen, was für dich nützlich ist. Das wird bei Agenten ein wenig unterschätzt. Es ist notwendig, dass Systeme nicht nur nützlich, sondern auch sicher sind und das tun, was man erwartet.“
„Ein weiterer Punkt ist, dass Claude bei vielen Aufgaben nicht viel nachdenken muss. Man muss nicht stundenlang sitzen und nachdenken, bevor man Google Docs oder ähnliches öffnet. Ich glaube also, dass wir nicht nur mehr Denkarbeit sehen werden, sondern auch die Anwendung von Denkarbeit, wenn sie wirklich nützlich und wichtig ist, aber auch keine Zeitverschwendung, wenn sie nicht notwendig ist.“
3. KI-Agenten werden Programmierassistenten besser machen
„Wir wollten den Entwicklern eine erste Beta-Version der Computernutzung zur Verfügung stellen, um ein Feedback zu erhalten, solange das System noch relativ primitiv ist. Aber wenn diese Systeme besser werden, könnten sie breiter eingesetzt werden und wirklich mit dir bei verschiedenen Aktivitäten zusammenarbeiten. Ich denke, DoorDash, The Browser Company und Canva experimentieren alle mit verschiedenen Arten von Browser-Interaktionen und gestalten sie mithilfe von KI.“
„Ich erwarte, dass wir auch weitere Verbesserungen bei den Programmierassistenten sehen werden. Das ist für Entwickler sehr aufregend. Es gibt ein großes Interesse am Einsatz von Claude 3.5 für die Programmierung, bei der es nicht nur um die automatische Vervollständigung geht, wie es noch vor ein paar Jahren der Fall war. Es geht wirklich darum, zu verstehen, was mit dem Code nicht stimmt, ihn zu debuggen – also den Code auszuführen, sehen, was passiert, und es zu beheben.“
4. KI-Agenten müssen sicher gemacht werden
„Wir haben Anthropic gegründet, weil wir davon ausgingen, dass sich die künstliche Intelligenz sehr schnell weiterentwickeln würde, und dass Sicherheitsaspekte unweigerlich eine Rolle spielen würden. Ich denke, das wird dieses Jahr noch deutlicher werden, denn diese Agenten werden immer mehr in unsere Arbeit integriert. Wir müssen uns auf Herausforderungen wie ‚Prompt Injections‘ vorbereiten.“
[Anmerk. d. Red.: Prompt Injection ist ein Angriff, bei dem ein bösartiger Prompt auf eine Art und Weise in ein großes Sprachmodell eingespeist wird, die die Entwickler nicht vorhergesehen oder beabsichtigt haben. Eine Möglichkeit dazu ist, einen solchen Prompt zu Websites hinzuzufügen, die die Modelle möglicherweise besuchen].
„Prompt Injection steht bei uns [als Risiko] an erster Stelle, wenn wir eine breitere Nutzung von KI-Agenten in Betracht ziehen. Ich denke, sie ist besonders wichtig für die Computernutzung, und wir arbeiten sehr aktiv daran, denn wenn die Computernutzung durch KI-Agenten in großem Umfang eingesetzt wird, könnte es schädliche Websites oder andere Fallen geben, in die Claude hineintappen könnte.“
„Und bei fortgeschritteneren Modellen ist das Risiko einfach größer. Wir haben eine robuste Skalierungsrichtlinie, nach der wir, wenn KI-Systeme ausreichend leistungsfähig sind, das Gefühl haben, dass wir in der Lage sein müssen, ihren Missbrauch wirklich zu verhindern. Zum Beispiel, wenn sie Terroristen helfen könnten – solche Dinge.“
„Ich bin wirklich gespannt, wie KI nützlich sein wird – sie beschleunigt uns bei Anthropic auch intern sehr, da die Leute Claude auf alle möglichen Arten nutzen, insbesondere beim Programmieren. Aber es wird auch viele Herausforderungen geben. Es wird ein interessantes Jahr werden.“