Project Strawberry heißt o1: Was OpenAIs neues KI-Modell besser kann als GPT-4o
In einem ausführlichen Blogbeitrag hat OpenAI endlich die künstliche Intelligenz vorgestellt, die seit Wochen und Monaten als „Strawberry“ in der Gerüchteküche seine Runden dreht. Jetzt steht fest: Das neue Modell für ChatGPT heißt nicht Strawberry, sondern schlicht o1 – und soll das erste KI-Modell sein, das über gestellte Aufgaben nachdenkt.
Das soll OpenAI erreicht haben, indem eine neue Trainingsmethode für die KI angewandt wurde. Statt diese nur mit Trainingsdaten zu füttern, wurde der KI positives Feedback für richtige Antworten und negatives Feedback bei falschen Antworten gegeben. So hat die KI gelernt, nicht nur die Trainingsdaten in der richtigen Reihenfolge auszuspucken, sondern über das Problem nachzudenken und seine Schritte zur Lösung zu kommunizieren.
Welche Vorteile hat o1 für ChatGPT?
Wie OpenAI in dem Blogbeitrag betont, soll o1 ähnlich wie Menschen zunächst über ein Problem grübeln, bevor es eine Lösung anbietet. Währenddessen soll es seine „Gedankengänge weiter schärfen und seine Strategien zur Lösung verfeinern.“ Zudem spricht OpenAI davon, dass o1 in der Lage ist, seine Fehler zu erkennen, sie dann zu korrigieren oder einen anderen Ansatz zu verfolgen.
Als Beispiel zeigt OpenAI eine Chiffre, die ChatGPT dekodiert werden soll. Als Vorlage hat die KI „oyfjdnisdr rtqwainr acxz mynzbhhx“, das dekodiert „Think step by step“ ergeben soll. Damit soll die KI „oyekaijzdf aaptcg suaokybhai ouow aqht mynznvaatzacdfoulxxz“ decodieren und einen entschlüsselten Satz als Ergebnis präsentieren.
GPT-4o ist mit dieser Aufgabe anscheinend überfordert. Es liefert keine Antwort, sondern nur Vorschläge, wie das Rätsel lösbar sein könnte. o1 hingegen liefert zunächst einen „Gedankengang“. Dieser kann im Dialog mit ChatGPT ganz einfach auf- oder zugeklappt werden, um die Übersicht im Chat zu behalten. Denn im Gedankengang von o1 steht jeder kleine Schritt, den die KI unternimmt, um zum Ergebnis zu kommen.
So versucht ChatGPT mit o1 zunächst, einzelne Buchstaben dem dekodierten Satz zuzuordnen. Als das nicht klappt, „überlegt“ die KI, ob möglicherweise Paare von Buchstaben in der Chiffre für einzelne Buchstaben im Lösungssatz stehen könnten. Das ist zwar ein Lösungsansatz, da die Chiffrenwörter immer doppelt so viele Buchstaben haben, aber noch sieht die KI keinen Zusammenhang.
Erst als sie die Position der Buchstaben im Alphabet hinzunimmt, diese addiert und anschließend durch zwei teilt, kann sie der Lösung näherkommen und der Chiffre einzelne Buchstaben zuordnen. Interessant ist auch, dass die KI offenbar dazu angehalten ist, ihren Gedankengang möglichst menschlich klingen zu lassen. Sie fügt immer wieder Sätze wie „Warte mal, das ist doch vielversprechend“ oder „Nein, das sieht falsch aus“.
Am Ende liefert sie aber nicht nur die Antwort im Gedankengang, sondern auch in einer verkürzten Form unterhalb. So müsst ihr nicht jedes Mal den kompletten Gedankengang verfolgen, sondern bekommt am Ende trotzdem das Ergebnis, dass die Chiffre den Satz „There Are Three R’s in Strawberry“ ergibt. Ein Satz, mit dem viele künstliche Intelligenzen immer wieder Probleme haben.
Dall-E malt unsere Headlines
Preis und Grenzen von o1
Laut OpenAI soll o1 vorwiegend beim Coding und bei mathematischen Problemen überlegen sein. Eben in solchen Bereichen, in denen eine schrittweise Lösung besser zum Ziel führt. In einigen Bereichen ist GPT-4o aber weiterhin überlegen. Vor allem dann, wenn es um die Texterstellung und Bildverarbeitung geht. Zudem soll das o1-Modell schwächeln, wenn es nach aktuellen Ereignissen und Wissen gefragt wird.
Wer die neue KI-Power nutzen möchte, muss tiefer in die Tasche greifen. Für den API-Zugang verlangt OpenAI 15 US-Dollar pro Million Input-Token. Für eine Million Output-Token werden sogar 60 Dollar fällig. Zum Vergleich: Für ChatGPT mit GPT-4o liegen die Preise für eine Million Input-Token bei fünf Dollar; für dieselbe Anzahl an Output-Token bei 15 Dollar.
Zunächst ist o1 als o1-preview und ein kleines Sprachmodell namens o1-mini für alle Plus-Abonnent:innen und Team-Kund:innen verfügbar. Wer eine Unternehmenslizenz oder einen Education-Account hat, muss sich wohl noch ein wenig gedulden, bis OpenAI den Zugang freischaltet. Wer ChatGPT kostenlos nutzt, bekommt zunächst keines der beiden Modelle. Allerdings will OpenAI künftig o1-mini auch ohne Abo zur Verfügung stellen. Wie lang das dauern könnte, verriet das Unternehmen aber nicht.