Alibaba veröffentlicht Qwen 3: Das kann das neue KI-Spitzenmodell aus China

Erst vor wenigen Monaten hatte der chinesische Konzern Alibaba sein neues KI-Modell Qwen 2.5 vorgestellt. Damit wollte das Unternehmen nicht nur westliche KI-Modelle in den Schatten stellen, sondern auch Deepseek aus dem eigenen Land die Stirn bieten. Jetzt hat Alibaba schon den Nachfolger der KI angekündigt und gezeigt, was Qwen 3 so besonders macht.
Qwen 3: Hybride Reasoning-Modelle mit Denk-Budget
Unter dem Namen Qwen 3 erscheinen zunächst sechs KI-Modelle mit Parametern von 0,6 Milliarden bis 32 Milliarden. Die drei kleinsten Modelle bis vier Milliarden Parameter bieten dabei eine maximale Kontextlänge von 32.000 Token, die größeren Modelle hingegen maximal 128.000. Alle sechs Modelle sind sogenannte Open-Weight-Modelle. Das bedeutet, dass Alibaba auch Zugriff auf die erlernten Parameter gibt. Alle sechs Modelle sind laut Alibaba über die Apache-2.0-Lizenz als Open-Source über Github und Hugging Face zum Download verfügbar.
Dazu kommen zwei weitere Qwen-3-Modelle. Bei Qwen3-30B-A3B und Qwen3-235B-A22B handelt es sich ebenfalls um Open-Weighted-Modelle. Wie die Namen schon verraten, hat das erste Modell 30 Milliarden Parameter, während das zweite Modell ganze 235 Milliarden Parameter bietet. Die Kontextlänge beider Modelle liegt bei maximal 128.000 Tokens. Das Besondere an diesen Modellen: Laut Alibaba handelt es sich dabei um sogenannte Mixture-of-Experts-Modelle. Das bedeutet, dass die Modelle die Prompts in Unteraufgaben aufteilen und diese an kleinere Experten-KI-Modelle weiterleiten, um sie schneller lösen zu können.
Alle Modelle von Qwen 3 sind zudem zu hybridem Reasoning in der Lage. Das bedeutet, dass sie sowohl kurze Antworten liefern, als auch über einen Prompt länger nachdenken und ihre eigene Antwort hinterfragen können. Dabei können User:innen jederzeit selbst auswählen, wie viel „Denk-Budget“ Qwen 3 zur Verfügung stehen soll. So kann dem Qwen-Chatbot, der mit Qwen3-235B-A22B betrieben wird, etwa ein „Denk-Budget“ zwischen 1.024 und 38.912 Token gegeben werden. Je größer das Budget, desto länger dauert die Antwort und desto genauer fällt sie aus.
Zudem betont Alibaba, dass Qwen 3 im Vergleich zu seinen Vorgängern verbesserte Skills als KI-Agent mit sich bringt. Qwen 3 soll in der Lage sein, noch einfacher mit seiner Umgebung zu interagieren und diese für die Antworten zu nutzen. Alibaba zeigt in der Ankündigung etwa, dass Qwen 3 auf Verzeichnisse auf einem PC zugreifen kann. So können User:innen die KI beispielsweise anweisen, einen Ordner mit vielen Einzeldateien aufzuräumen, sinnvolle Unterordner zu erstellen und alle Daten darin einzusortieren.
Wie schlägt sich Qwen 3 im Vergleich mit Gemini, ChatGPT und Deepseek?
Sämtliche Qwen-3-Modelle unterstützen 119 Sprachen und sollen mit einem Datenset von mehr als 36 Trillionen Tokens trainiert worden sein. Eine Million Tokens entspricht dabei etwa 750.000 Wörtern. Als Datengrundlage sollen unter anderem Bücher, PDFs, Code und KI-generierte Daten fungiert haben. In der Ankündigung zieht Alibaba auch Vergleiche zu der westlichen und heimischen Konkurrenz.
So erzielt das Spitzenmodell Qwen3-235B-A22B in vielen Benchmarks ähnliche Werte wie OpenAIs Modell o1 und kann die Konkurrenz sogar in einigen Tests übertrumpfen. Im Vergleich zu Deepseek R1 schlägt sich Qwen 3 laut Alibaba sogar noch besser. In allen neun gezeigten Benchmarks erzielt die KI bessere Ergebnisse. Nur im Vergleich zu Googles Gemini 2.5 Pro schwächelt Qwen 3 laut den Benchmark-Ergebnissen. Nur in drei Tests konnte die KI hier bessere Ergebnisse erzielen. Ob und wie sich die Benchmark-Werte bei der Nutzung bemerkbar machen, lässt sich daran aber nicht immer hundertprozentig ausmachen. Erst bei der Nutzung wird sich zeigen, welche Performance Qwen 3 liefert und wo die Schwächen der KI liegen.