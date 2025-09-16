Anzeige
Anzeige
Anzeige
Anzeige
News
Verpasse keine News mehr!

Mehr als nur Code-Schnipsel: GPT-5-Codex soll selbstständig arbeiten – und aus Fehlern lernen

OpenAI liefert ein neues KI-Modell, das nicht nur Code schreibt, sondern Projekte über Stunden eigenständig vorantreibt. Das ist eine neue Stufe der Automatisierung in der Softwareentwicklung und zielt direkt auf den Workflow von Profis.

Von Dieter Petereit
2 Min.
Artikel merken
Anzeige
Anzeige
Mehr als nur Code-Schnipsel: GPT-5-Codex soll selbstständig arbeiten – und aus Fehlern lernen

OpenAI bringt Coding-Agent. (Grafik: Midjourney / t3n)

OpenAI hat mit GPT-5-Codex ein neues Modell vorgestellt. Es handelt sich dabei um eine spezialisierte Version des kürzlich eingeführten GPT-5, die gezielt für komplexe Programmieraufgaben trainiert wurde. Die wohl weitreichendste Neuerung ist die Fähigkeit zum sogenannten „agentenbasierten Programmieren“.

Anzeige
Anzeige

Laut einem Blogbeitrag von OpenAI soll das Modell in der Lage sein, über sieben Stunden hinweg autonom an einer Aufgabe zu arbeiten. Dabei soll es selbstständig Fehler identifizieren und Korrekturen vornehmen, ohne dass ein:e Entwickler:in eingreifen muss.

Du möchtest mehr zum Thema lernen?

Regelmäßig veröffentlicht die t3n-Redaktion praxisorientierte Paper, Guides und Onlinekurse mit den besten Expert:innen im digitalen Business, die dabei helfen, neue Technologien zu verstehen, um damit in Zukunft erfolgreich zu sein.

Mehr erfahren

Anzeige
Anzeige

Vom Werkzeug zum autonomen Teamkollegen

Die neue Fähigkeit positioniert Codex weniger als ein reines Werkzeug zur Code-Vervollständigung und mehr als einen eigenständigen digitalen Assistenten. Ein primärer Anwendungsfall ist laut OpenAI das Refactoring, also die strukturelle Überarbeitung von bestehendem Code zur Qualitätsverbesserung. In einem internen Benchmark für solche Aufgaben erreichte GPT-5-Codex eine Erfolgsquote von 51,3 Prozent und übertraf damit das allgemeine GPT-5-Modell um mehr als 17 Prozentpunkte.

Eine weitere Kernfunktion ist die Durchführung von Code-Reviews. Das Modell analysiert dabei nicht nur den eingereichten Code, sondern berücksichtigt auch Abhängigkeiten innerhalb der gesamten Codebasis und kann Tests ausführen, um die Funktionalität zu validieren. Die von der KI erstellten Kommentare in Pull-Requests sollen dabei signifikant seltener fehlerhaft und gleichzeitig relevanter sein als die des Vorgängermodells.

Empfohlene redaktionelle Inhalte

Hier findest du externe Inhalte von TargetVideo GmbH, die unser redaktionelles Angebot auf t3n.de ergänzen. Mit dem Klick auf "Inhalte anzeigen" erklärst du dich einverstanden, dass wir dir jetzt und in Zukunft Inhalte von TargetVideo GmbH auf unseren Seiten anzeigen dürfen. Dabei können personenbezogene Daten an Plattformen von Drittanbietern übermittelt werden.

Hinweis zum Datenschutz

Direkte Integration in den Workflow

Um die Nutzung im Entwickler:innen-Alltag zu verankern, stellt OpenAI neue Integrationen bereit. Eine Erweiterung für gängige Code-Editoren wie Visual Studio Code ermöglicht es Codex, den Kontext geöffneter Dateien zu nutzen. Dies soll zu präziseren Ergebnissen bei kürzeren Anfragen führen.

Die Kommandozeilen-Version (CLI) wurde ebenfalls überarbeitet und kann nun auch visuellen Input verarbeiten, etwa Skizzen von Benutzeroberflächen. Interessant ist zudem die adaptive Leistungsfähigkeit: Bei einfachen, klar definierten Aufgaben arbeitet GPT-5-Codex laut OpenAI deutlich ressourcenschonender, während es sich für komplexe Probleme mehr Rechenzeit für Analyse und Lösungsfindung nimmt.

Anzeige
Anzeige

Ein kritischer Blick auf die Benchmarks

Während die Fortschritte im Refactoring und bei Code-Reviews aufhorchen lassen, zeigt ein anderer Standardtest ein differenzierteres Bild. Im „SWE-bench Verified“-Benchmark, der allgemeine Problemlösungsfähigkeiten in der Softwareentwicklung misst, schneidet GPT-5-Codex mit 72,8 Prozent eine Nuance schwächer ab als das universelle GPT-5 mit 74,5 Prozent. OpenAI merkt hierzu an, dass die Testmethodik angepasst und auf den vollständigen Satz von 500 Aufgaben erweitert wurde, was einen direkten Vergleich erschwert.

Empfehlungen der Redaktion
Artikel wechseln

Obwohl die Automatisierung von zeitaufwendigen Routineaufgaben wie Refactoring oder dem Anlegen von Test-Strukturen eine erhebliche Effizienzsteigerung verspricht, wirft die Entwicklung auch Fragen auf. Die zunehmende Autonomie von KI-Systemen könnte langfristig die Anforderungen an Berufseinsteiger:innen in der Softwareentwicklung verändern. OpenAI selbst betont, dass eine menschliche Überprüfung der Ergebnisse unerlässlich bleibt und Codex als zusätzlicher Reviewer, nicht aber als Ersatz für menschliche Expertise verstanden werden sollte.

GPT-5-Codex ist ab sofort für Nutzer:innen der kostenpflichtigen Abonnements von ChatGPT verfügbar, darunter die Pläne Plus, Pro und Enterprise. Eine Bereitstellung über die Programmierschnittstelle (API) für eine tiefere Integration in eigene Anwendungen ist für die nahe Zukunft angekündigt.

Anzeige
Anzeige

So arbeitet Deepseek – und das macht es anders als andere KI-Modelle

4 Bilder ansehen
So arbeitet Deepseek – und das macht es anders als andere KI-Modelle Quelle: (Grafik: Dall-E / t3n)

Mehr zu diesem Thema
MIT Technology Review Deepseek Künstliche Intelligenz Open AI So arbeitet
Fast fertig!

Bitte klicke auf den Link in der Bestätigungsmail, um deine Anmeldung abzuschließen.

Du willst noch weitere Infos zum Newsletter? Jetzt mehr erfahren

Anzeige
Anzeige
Kommentare

Community-Richtlinien

Bitte schalte deinen Adblocker für t3n.de aus!
Hallo und herzlich willkommen bei t3n!

Bitte schalte deinen Adblocker für t3n.de aus, um diesen Artikel zu lesen.

Banner und ähnliche Werbemittel sind für unsere Finanzierung sehr wichtig.

Schon jetzt und im Namen der gesamten t3n-Crew: vielen Dank für deine Unterstützung! 🙌

Deine t3n-Crew

Anleitung zur Deaktivierung
Artikel merken

Bitte melde dich an, um diesen Artikel in deiner persönlichen Merkliste auf t3n zu speichern.

Jetzt registrieren und merken

Du hast schon einen t3n-Account? Hier anmelden

Auf Mastodon teilen

Gib die URL deiner Mastodon-Instanz ein, um den Artikel zu teilen.

Community-Richtlinien

Wir freuen uns über kontroverse Diskussionen, die gerne auch mal hitzig geführt werden dürfen. Beleidigende, grob anstößige, rassistische und strafrechtlich relevante Äußerungen und Beiträge tolerieren wir nicht. Bitte achte darauf, dass du keine Texte veröffentlichst, für die du keine ausdrückliche Erlaubnis des Urhebers hast. Ebenfalls nicht erlaubt ist der Missbrauch der Webangebote unter t3n.de als Werbeplattform. Die Nennung von Produktnamen, Herstellern, Dienstleistern und Websites ist nur dann zulässig, wenn damit nicht vorrangig der Zweck der Werbung verfolgt wird. Wir behalten uns vor, Beiträge, die diese Regeln verletzen, zu löschen und Accounts zeitweilig oder auf Dauer zu sperren.

Trotz all dieser notwendigen Regeln: Diskutiere kontrovers, sage anderen deine Meinung, trage mit weiterführenden Informationen zum Wissensaustausch bei, aber bleibe dabei fair und respektiere die Meinung anderer. Wir wünschen Dir viel Spaß mit den Webangeboten von t3n und freuen uns auf spannende Beiträge.

Dein t3n-Team

Kommentar abgeben

Melde dich an, um Kommentare schreiben und mit anderen Leser:innen und unseren Autor:innen diskutieren zu können.

Anmelden und kommentieren

Du hast noch keinen t3n-Account? Hier registrieren