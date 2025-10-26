KI-Agenten sollen der nächste große Schritt im Bereich der Künstlichen Intelligenz sein. Die Modelle können deutlich komplexere Aufgaben als Chatbots lösen und dabei sogar Geräte wie euren Computer anhand eurer Anweisungen selbstständig steuern – zumindest theoretisch. Andrej Karpathy, seines Zeichens OpenAI-Mitgründer und Gründer des KI-Lernunternehmens Eureka Labs, hat da noch seine Zweifel.

OpenAI-Mitgründer: Warum KI-Agenten noch weit von ihrem Potenzial entfernt sind

Im Dwarkesh Podcast verriet der Erfinder des Begriffs Vibe-Coding, was ihn an heutigen KI-Agenten stört: „Sie funktionieren einfach nicht. Sie sind nicht intelligent genug, sie sind nicht multimodal genug, sie können keine Endgeräte nutzen und noch viel mehr. Sie sind nicht dazu in der Lage, kontinuierlich zu lernen. Man kann ihnen nicht einfach etwas sagen und sie erinnern sich später daran. Sie sind kognitiv enttäuschend und das funktioniert einfach nicht.“

Laut Karpathy sind diese Probleme zwar lösbar, lassen sich aber selbst mit Expertise nur langfristig überwinden. Er geht davon aus, dass es mindestens ein Jahrzehnt dauern wird, bis wir echte KI-Agenten zu sehen bekommen. Auf die Nachfrage hin, warum er genau diesen Zeitraum als Schätzung gewählt hat, ergänzte er: „Ich habe etwa 15 Jahre Erfahrungen damit, wie Menschen im KI-Bereich Vorhersagen treffen und wie sie am Ende wirklich ausgehen. Außerdem war ich eine Weile in der Industrie, im Forschungsbereich. Ich habe dadurch eine allgemeine Intuition bekommen.“

Dennoch kann der OpenAI-Mitgründer, der das KI-Unternehmen im Februar 2024 verließ, einige positive Worte zu aktuellen KI-Agenten verlieren: „Ich glaube, dass KI-Agenten in sehr spezifischen Szenarien reibungslos funktionieren, und dort würde ich sie auch nutzen.“ So gäbe es etwa Agenten, die gut darin sind, einfache Code-Aufgaben mit Copy-und-Paste-Abläufen zu handhaben – und das deutlich schneller als Menschen. Allerdings müssten Nutzer:innen immer genau wissen, welche Aufgaben welche Tools am besten können. Ein echter KI-Agent müsste alle Aufgaben gut beherrschen.

Grundsätzlich sieht Karpathy im Coding den perfekten Aufgabenbereich für KI-Agenten und LLM: „Coding hat schon immer über Text funktioniert. Es sind Computerterminals und Text; alles dreht sich darum. LLMs, so wie sie trainiert sind, lieben Text. Sie sind die perfekten Textverarbeiter. […] Wenn ein Agent eine Änderung macht, lässt sich das über ein Diff-Tool einfach nachvollziehen. Es ist fast schon so, als hätten wir einen Großteil der Infrastruktur für Code gebaut. Ich habe gesehen, dass einige Unternehmen Präsentationsslides automatisieren wollten. Das ist schwerer, weil Slides keine Texte sind. Sie bestehen aus kleinen Grafiken, die arrangiert werden müssen und eine visuelle Komponente haben. Slides haben keine vorgefertigte Infrastruktur.“

