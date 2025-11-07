Anzeige
Kimi K2 Thinking: Günstiges China-Modell soll bessere Agenten-Fähigkeiten bieten als ChatGPT

Erneut sorgt ein KI-Modell aus China für Aufsehen. Nicht nur sollen die Trainingskosten von Kimi K2 Thinking vergleichsweise niedrig gewesen sein, das Modell könnte bei einigen Aufgaben auch der US-amerikanischen Konkurrenz überlegen sein.

Von Noëlle Bölling
2 Min.
So gut schneidet Kimi K2 Thinking in Benchmarks ab. (Foto: Shutterstock / Robert Way)

Das chinesische Startup Moonshot AI hat sein neues generatives KI-Modell vorgestellt. Wie CNBC berichtet, soll es ChatGPT insbesondere im Hinblick auf agentische Fähigkeiten übertreffen – und erhöht damit den Druck auf US-amerikanische Anbieter.

Kimi K2 Thinking kann in Benchmarks überzeugen

Moonshot AI wurde 2023 in Peking gegründet. Zu den wichtigsten Investor:innen zählt der Technologiekonzern Alibaba, der schon Milliardenbeträge in die Forschung zu KI und Robotik investiert hat. Das neue Modell Kimi K2 Thinking basiert auf dem im Juli erschienenen K2-Modell, einem Mixture-of-Experts-System, das in mehreren Benchmarks überzeugen konnte. Auch in einem Test, der KI-Modelle auf das Phänomen Sycophancy untersuchte, schnitt Kimi K2 besonders gut ab. Dabei wurde bewertet, wie entschieden Modelle Nutzer:inneneingaben widersprechen – beispielsweise bei wahnhaften Aussagen oder Suizidgedanken.

Die neue Thinking-Variante soll jetzt im Reasoning-Bereich mit den führenden Modellen von OpenAI und Anthropic konkurrieren. Das Open-Source-Modell ist darauf ausgelegt, wie ein persönlicher Agent zu arbeiten, der mehrschrittige Denkprozesse durchführt und verschiedene Tools einbindet.

Laut den Angaben des Startups erzielt Kimi K2 Thinking in gängigen Benchmark-Tests starke Ergebnisse und zeigt vor allem bei Argumentation, agentenbasierten Suchprozessen, Codierung und Texterstellung deutliche Fortschritte. Im Benchmark Humanity’s Last Exam, der universelles Wissen aus Natur- und Geisteswissenschaften prüft, erreichte das Modell mit Tools eine Trefferquote von 44,9 Prozent.

Beim Browsecomp-Test, der die Fähigkeit bewertet, eigenständig im Internet zu recherchieren, erzielte es 60,2 Prozent. Beim SWE-Bench Verified, einem Benchmark für komplexe Softwareprobleme, Bugfixes und Implementierungen, lag die Genauigkeit bei 71,3 Prozent. Laut Moonshot AI kann Kimi K2 Thinking ohne menschliche Eingriffe bis zu 300 Tool-Aufrufe nacheinander ausführen und über Hunderte Schritte hinweg konsistent argumentieren, um komplexe Aufgaben zu lösen.

Chinesische Modelle sind deutlich günstiger

Die Vorstellung des neuen Modells erfolgt vor dem Hintergrund erneuter Warnungen von Nvidia-CEO Jensen Huang, die USA müssten im Wettlauf mit chinesischen KI-Entwicklungen aufholen. Auch US-Unternehmen wie Airbnb greifen inzwischen auf Modelle chinesischer Anbieter zurück, die ähnlich leistungsfähig sein sollen – allerdings zu wesentlich geringeren Kosten. CNBC-Quellen zufolge hat das Training von Kimi K2 Thinking rund 4,6 Millionen Dollar gekostet.

Der ebenfalls in China ansässige Anbieter Deepseek gab an, für sein leistungsstarkes Modell V3 rund 5,6 Millionen Dollar investiert zu haben. Durch die vergleichsweise niedrigen Trainingskosten wird auch eine deutlich günstigere Nutzung ermöglicht. Zum Vergleich: Die Kosten für das Modelltraining von OpenAI bewegen sich im Milliardenbereich – bis 2030 könnten sie sich Schätzungen zufolge auf rund 200 Milliarden Dollar belaufen. Langfristig könnten US-Anbieter also vor allem wegen des finanziellen Aspekts ins Hintertreffen geraten.

