Die Anbieter von KI-Modellen konkurrieren nicht mehr nur über die Leistungsfähigkeit, sondern zunehmend auch über die Kosteneffizienz. Wie Techcrunch berichtet, führt OpenAI deshalb jetzt eine „Flex-Verarbeitung“ von Anfragen ein. Dadurch werden Aufgaben zwar langsamer, aber deutlich günstiger bearbeitet.

Anzeige Anzeige

Erhebliche Kosteneinsparungen – mit einem Haken

Das neue „Flex Processing“ befindet sich derzeit noch in der Beta-Phase und ist für die KI-Modelle o3 und o4-mini von OpenAI verfügbar. Der größte Vorteil der Neuerung liegt in der deutlichen Kostensenkung: Die Nutzung der API ist genau halb so teuer wie der Standardtarif. Konkret sinkt der Preis für das o3-Modell von ursprünglich zehn auf fünf US-Dollar pro Million Input-Token, was etwa 750.000 Wörtern entspricht. Bei den Output-Tokens sinken die Kosten von 40 US-Dollar auf 20 US-Dollar pro Million Token. Noch günstiger wird es beim Modell o4-mini: Hier sinken die Kosten von 1,10 US-Dollar auf 0,55 US-Dollar pro Million Eingabetoken und von 4,40 US-Dollar auf 2,20 US-Dollar pro Million Ausgabetoken.

Die Preissenkung ist allerdings an Bedingungen geknüpft: Nutzer:innen müssen nämlich mit deutlich langsameren Antwortzeiten rechnen. Zudem kann es gelegentlich zu Engpässen kommen, sodass Ressourcen vorübergehend nicht zur Verfügung stehen. Zielgruppe sind laut OpenAI deshalb vor allem Anwender:innen, deren Aufgaben eine geringere Priorität haben oder nicht zeitkritisch sind. Dazu gehören beispielsweise Auswertungen oder asynchrone Workloads, bei denen Geschwindigkeit eine untergeordnete Rolle spielt.

Anzeige Anzeige

Wettbewerbsdruck führt zu neuen Lösungen

Die Einführung von „Flex Processing“ ist eine Reaktion auf den zunehmenden Wettbewerbsdruck innerhalb der KI-Branche. Unternehmen wie Google haben mit KI-Modellen wie Gemini 2.5 Flash kürzlich ihre eigenen kostengünstigen Alternativen auf den Markt gebracht. Es soll eine vergleichbare Leistung wie das KI-Modell R1 von Deepseek bieten – allerdings zu deutlich günstigeren Konditionen. Mit der preiswerteren „Flex-Verarbeitung“ reagiert OpenAI direkt auf diesen Trend und bietet Entwickler:innenn jetzt ebenfalls eine Möglichkeit, ihr Budget zu schonen.

Anzeige Anzeige

Im Zuge der Einführung von „Flex Processing“ hat OpenAI auch eine verschärfte ID-Verifizierung für Entwickler:innen angekündigt. Durch diese Maßnahme soll insbesondere Missbrauch verhindert und sichergestellt werden, dass keine unautorisierten Aktivitäten über OpenAI-Dienste stattfinden können.

Mit dem neuen, preisbewussten Angebot will OpenAI insgesamt attraktiver für Anwendungen werden, die nicht auf sofortige Ergebnisse angewiesen sind, gleichzeitig aber erhebliche Kosteneinsparungen ermöglichen. Damit stärkt das Unternehmen seine Wettbewerbsposition gegenüber kostengünstigen Alternativen von Google und anderen Konkurrenzunternehmen.