Nahe an AGI? OpenAI zeigt neue KI-Modelle o3 und o3 Mini über „menschlichem Niveau“

Am 5. Dezember 2024 startet OpenAI seine werktägliche Livestream-Reihe 12 Days of OpenAI, in deren Rahmen zahlreiche KI-Neuerungen vorgestellt wurden. So wurden die Video-KI Sora und SearchGPT zugänglich gemacht. Zudem ermöglicht es OpenAI jetzt, ChatGPT per Telefon oder Whatsapp zu nutzen.
OpenAI zeigt in 12 Tagen KI-Modell-Vielfalt
Begonnen hatte OpenAI aber mit der Einführung des neuen KI-Modells GPT-o1, das komplizierte Denkaufgaben bewältigen können soll. Wer 200 US-Dollar pro Monat für das neue Abo ChatGPT Pro zahlt, kann den Pro-Mode für GPT-o1 aktivieren. Der KI-Chatbot soll dann noch besser komplizierte Rechen- und Programmieraufgaben lösen können.
Vielleicht können Nutzer:innen sich das Geld auch sparen oder zumindest noch ein paar Wochen warten. Denn am zwölften und letzten Tag von 12 Days of OpenAI schloss der ChatGPT-Entwickler den Kreis – mit der Vorstellung der noch leistungsfähigeren „denkenden“ KI-Modelle o3 und o3 Mini.
Forscher können sich um Early-Access bewerben2>
Noch befinden sich die beiden neuen Modelle in der internen Testphase. OpenAI hat aber Sicherheits- und Forschungsexpert:innen eingeladen, sich um Early-Access-Zugänge zu bewerben, um die Modelle vor ihrer Veröffentlichung zu testen.
Dann wird sich vielleicht schon zeigen, ob die von OpenAI bekanntgegebenen Leistungsdaten Bestand haben. Demnach übertrifft o3 den Vorgänger o1 in puncto optimierte Coding-Leistung um 22,8 Prozentpunkte. Auch in den Bereichen Mathematik und Wissenschaft schlägt sich o3 um Längen besser als bisherige Modelle.
AGI-Test: „Menschliches Niveau“ übertroffen
Besonders beeindruckend: Im ARC-AGI-Test, bei dem bewertet wird, wie effizient ein KI-System neue Fähigkeiten außerhalb der trainierten Daten erwerben kann, übertraf o3 „menschliches Niveau“, wie die FAZ schreibt. Kein Wunder, dass OpenAI das o3-Modell als Schritt in Richtung AGI bewirbt.
Interessantes Detail am Rande: o3 ist der direkte Nachfolger von o1. Die eigentlich logischerweise zu erwartende Modellnummer o2 soll OpenAI aus Respekt vor möglichen markenrechtlichen Auseinandersetzungen mit dem gleichnamigen Markennamen des Telekomkonzerns Telefonica ausgelassen haben.