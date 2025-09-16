OpenAI hat mit GPT-5-Codex ein neues Modell vorgestellt. Es handelt sich dabei um eine spezialisierte Version des kürzlich eingeführten GPT-5, die gezielt für komplexe Programmieraufgaben trainiert wurde. Die wohl weitreichendste Neuerung ist die Fähigkeit zum sogenannten „agentenbasierten Programmieren“.

Laut einem Blogbeitrag von OpenAI soll das Modell in der Lage sein, über sieben Stunden hinweg autonom an einer Aufgabe zu arbeiten. Dabei soll es selbstständig Fehler identifizieren und Korrekturen vornehmen, ohne dass ein:e Entwickler:in eingreifen muss.

Vom Werkzeug zum autonomen Teamkollegen

Die neue Fähigkeit positioniert Codex weniger als ein reines Werkzeug zur Code-Vervollständigung und mehr als einen eigenständigen digitalen Assistenten. Ein primärer Anwendungsfall ist laut OpenAI das Refactoring, also die strukturelle Überarbeitung von bestehendem Code zur Qualitätsverbesserung. In einem internen Benchmark für solche Aufgaben erreichte GPT-5-Codex eine Erfolgsquote von 51,3 Prozent und übertraf damit das allgemeine GPT-5-Modell um mehr als 17 Prozentpunkte.

Eine weitere Kernfunktion ist die Durchführung von Code-Reviews. Das Modell analysiert dabei nicht nur den eingereichten Code, sondern berücksichtigt auch Abhängigkeiten innerhalb der gesamten Codebasis und kann Tests ausführen, um die Funktionalität zu validieren. Die von der KI erstellten Kommentare in Pull-Requests sollen dabei signifikant seltener fehlerhaft und gleichzeitig relevanter sein als die des Vorgängermodells.

Direkte Integration in den Workflow

Um die Nutzung im Entwickler:innen-Alltag zu verankern, stellt OpenAI neue Integrationen bereit. Eine Erweiterung für gängige Code-Editoren wie Visual Studio Code ermöglicht es Codex, den Kontext geöffneter Dateien zu nutzen. Dies soll zu präziseren Ergebnissen bei kürzeren Anfragen führen.

Die Kommandozeilen-Version (CLI) wurde ebenfalls überarbeitet und kann nun auch visuellen Input verarbeiten, etwa Skizzen von Benutzeroberflächen. Interessant ist zudem die adaptive Leistungsfähigkeit: Bei einfachen, klar definierten Aufgaben arbeitet GPT-5-Codex laut OpenAI deutlich ressourcenschonender, während es sich für komplexe Probleme mehr Rechenzeit für Analyse und Lösungsfindung nimmt.

Ein kritischer Blick auf die Benchmarks

Während die Fortschritte im Refactoring und bei Code-Reviews aufhorchen lassen, zeigt ein anderer Standardtest ein differenzierteres Bild. Im „SWE-bench Verified“-Benchmark, der allgemeine Problemlösungsfähigkeiten in der Softwareentwicklung misst, schneidet GPT-5-Codex mit 72,8 Prozent eine Nuance schwächer ab als das universelle GPT-5 mit 74,5 Prozent. OpenAI merkt hierzu an, dass die Testmethodik angepasst und auf den vollständigen Satz von 500 Aufgaben erweitert wurde, was einen direkten Vergleich erschwert.

Obwohl die Automatisierung von zeitaufwendigen Routineaufgaben wie Refactoring oder dem Anlegen von Test-Strukturen eine erhebliche Effizienzsteigerung verspricht, wirft die Entwicklung auch Fragen auf. Die zunehmende Autonomie von KI-Systemen könnte langfristig die Anforderungen an Berufseinsteiger:innen in der Softwareentwicklung verändern. OpenAI selbst betont, dass eine menschliche Überprüfung der Ergebnisse unerlässlich bleibt und Codex als zusätzlicher Reviewer, nicht aber als Ersatz für menschliche Expertise verstanden werden sollte.

GPT-5-Codex ist ab sofort für Nutzer:innen der kostenpflichtigen Abonnements von ChatGPT verfügbar, darunter die Pläne Plus, Pro und Enterprise. Eine Bereitstellung über die Programmierschnittstelle (API) für eine tiefere Integration in eigene Anwendungen ist für die nahe Zukunft angekündigt.

