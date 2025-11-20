OpenAI hat am 19. November 2025 ein neues KI-Modell veröffentlicht, das speziell auf langwierige Programmieraufgaben ausgelegt ist. GPT-5.1-Codex-Max soll laut Hersteller in der Lage sein, Aufgaben über mehrere Kontextfenster hinweg zu bearbeiten und dabei den Faden nicht zu verlieren.

Das Modell zielt auf das sogenannte „Agentic Coding“ ab. Dabei agiert die künstliche Intelligenz nicht mehr nur als reiner Code-Vervollständiger, sondern als weitgehend autonomer Agent, der Fehler sucht, Tests schreibt und Anpassungen vornimmt.

Compaction soll das Kontext-Limit umgehen

Die technische Kernneuerung bezeichnet OpenAI als „Compaction“. Bisherige Sprachmodelle stoßen bei sehr langen Interaktionen an ihre Grenzen, da das Kontextfenster, der Kurzzeitspeicher der KI, volläuft. Ist das Limit erreicht, vergisst das Modell den Anfang der Aufgabe oder beginnt zu halluzinieren.

Bei der neuen Methode wird die Historie der Interaktion automatisch bereinigt. Irrelevante Informationen werden entfernt, während der für die Aufgabe kritische Kontext erhalten bleibt. Dieser Prozess soll es ermöglichen, dass Codex-Max internen Tests zufolge über 24 Stunden an einer einzigen Aufgabe arbeiten kann, ohne die Kohärenz zu verlieren.

Wie ZDNet berichtet, ist dieser Ansatz vergleichbar mit einem menschlichen Gespräch, bei dem man sich auf das Wesentliche konzentriert, wenn die Aufmerksamkeit nachlässt. Das Modell „komprimiert“ sein Wissen über den aktuellen Job, um Platz für neue Gedanken zu schaffen.

Effizienz steigt, Kosten sollen sinken

Neben der Ausdauer verspricht der Hersteller eine höhere Effizienz. In Benchmarks benötigt das neue Modell für vergleichbare Ergebnisse deutlich weniger Rechenleistung als sein Vorgänger.

Im Test „SWE-bench Verified“ verbrauchte GPT-5.1-Codex-Max rund 30 Prozent weniger sogenannte „Thinking Tokens“ bei gleicher Leistung. Für Entwickler:innen könnte das in der Praxis bedeuten, dass Projekte schneller und kostengünstiger umgesetzt werden können.

OpenAI nennt als Beispiel eine Frontend-Design-Aufgabe, bei der das neue Modell die Token-Anzahl von 37.000 auf 27.000 reduzieren konnte. Gleichzeitig sank die Anzahl der generierten Codezeilen bei gleicher Funktionalität, was auf einen saubereren Programmierstil hindeuten könnte.

Fokus auf Windows-Umgebungen

Eine interessante Neuausrichtung zeigt sich bei der Zielplattform. War die Entwicklung mit KI-Tools bislang oft stark auf Unix-basierte Systeme oder macOS fokussiert, ist Codex-Max das erste Modell von OpenAI, das explizit für Windows-Umgebungen trainiert wurde.

Das dürfte vor allem in deutschen Unternehmen auf Interesse stoßen, wo Windows nach wie vor das dominierende Betriebssystem auf Entwickler-Laptops ist. Das Modell soll hier besser mit der Kommandozeile (CLI) und typischen Windows-Eigenheiten zurechtkommen.

Gleichzeitig wurde die Sicherheit der Sandbox-Umgebung betont. Da das Modell lange Zeit autonom arbeiten soll, sind Schreibrechte auf den Arbeitsbereich beschränkt und der Netzwerkzugriff ist standardmäßig deaktiviert.

Schattenseiten bei der Spezialisierung

Trotz der beeindruckenden Zahlen ist das neue Modell kein Allheilmittel. Ein Blick in die technischen Daten zeigt, dass die Spezialisierung ihren Preis hat. Im „Terminal-Bench 2.0“ schnitt Codex-Max mit einer Genauigkeit von 52,8 Prozent schlechter ab als der Vorgänger GPT-5.1-Codex, der 58,1 Prozent erreichte.

Das deutet darauf hin, dass das Modell zwar hervorragend für lange, zusammenhängende Aufgaben optimiert ist, bei kurzen, isolierten Terminal-Befehlen aber an Präzision eingebüßt hat. Entwickler:innen sollten daher genau abwägen, für welche Art von Aufgabe sie den neuen Agenten einsetzen.

Zudem führt OpenAI neue „Reasoning“-Stufen ein. Während für die tägliche Arbeit eine mittlere Stufe empfohlen wird, gibt es nun einen „Extra High“-Modus. Dieser lässt die KI extrem lange über eine Lösung nachdenken, was zwar die Qualität erhöhen soll, aber auch die Wartezeit deutlich verlängert.

Verfügbarkeit: ab sofort

GPT-5.1-Codex-Max ist ab sofort für Nutzer:innen der Bezahlmodelle ChatGPT Plus, Pro, Team und Enterprise verfügbar. Die Integration erfolgt vorerst über die Codex-Oberflächen, eine API-Anbindung für die Integration in eigene Tools soll laut OpenAI in Kürze folgen.

Ob sich das Versprechen der 24-Stunden-Coding-Sessions im Alltag bewährt, werden die kommenden Wochen zeigen müssen. Solltet ihr das Modell bereits ausprobieren können, lohnt sich ein kritischer Blick darauf, ob die „Compaction“ wirklich alle relevanten Details behält oder ob bei komplexen Refactorings doch wichtige Nuancen verloren gehen.