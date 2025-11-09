Sam Altman steht vor einem Problem. Genauer gesagt: einem 1,4 Billionen US-Dollar schweren Problem. Diese Summe muss der OpenAI-Chef in den nächsten Jahren aufbringen, um die Verträge für Rechenkapazität, die sein KI-Startup in den vergangenen Monaten abgeschlossen hat, bedienen zu können. Aktuell soll OpenAI mit ChatGPT und Co. geschätzte zwölf Milliarden Dollar pro Jahr generieren, wie The Information berichtet. Selbst wenn es „deutlich mehr“ ist, wie Altman kürzlich in einem Podcast mit dem Geschäftsführer der Risikokapitalfirma Altimeter Group behauptet hat: Das reicht bei weitem nicht aus – und entspricht außerdem nicht der ganzen Wahrheit.

Denn OpenAI ist als Privatunternehmen niemandem Rechenschaft über seine Zahlen schuldig. Was Einnahmen, Verluste und andere harte Kennzahlen angeht, können Außenstehende nur spekulieren. Dazu kommt, dass die zwölf Milliarden als ARR gelten, was nicht mit tatsächlichem Jahresumsatz gleichzusetzen ist. Trotzdem bedienen sich Tech-Firmen, gerade wenn es um ihre KI- und Cloud-Segmente geht, solcher weicher Metriken, die oft Auslegungssache statt unumstößlicher Fakt sind.

Wir haben uns mit ARR, Token-Verbrauch und MAU drei im KI-Geschäft besonders beliebte Kennzahlen genauer angeschaut. Wir klären, wofür die Abkürzungen und Begriffe stehen, was sie problematisch macht und warum Firmen sie vermehrt einsetzen, obwohl ihre Aussagekraft begrenzt ist.

ARR: Ersatz für Jahresumsatz mit Schwächen

Zuallererst eine Begriffsklärung: Die Abkürzung ARR kann für eine Vielzahl von Konzepten stehen, für All Rights Reserved oder Accounting Rate of Return beziehungsweise Rentabilitätsrechnung. Taucht das Kürzel aber in Pressemitteilungen von Tech-Startups auf, steckt dahinter mit großer Wahrscheinlichkeit Annual Recurring Revenue. Das entspricht dem Betrag, den die Firma plant, mit aktuell laufenden Verträgen in einem Jahr einzunehmen.

Im Kontext von KI ist diese Metrik allerdings watteweich. Wie die Fortune-Finanzjournalistin Allie Garfinkle in einer umfassenden Analyse darlegt, entstand das Konzept in den 2000er Jahren mit dem Aufstieg von Software-as-a-Service. Besonders relevant ist die Kennzahl für Firmen, die an Sitze gebundene Jahresabos mit strikten Kündigungsfristen verkaufen.

Jahresabos gibt es auch bei vielen KI-Startups. Aber egal, was Tech-Firmen behaupten: KI-Projekte haben sich im Enterprise-Kontext noch lange nicht etabliert. Einer Anfang 2025 durchgeführten IBM-Umfrage unter 2.000 Top-Geschäftsführern nach stecken zum Beispiel 60 Prozent ihrer KI-Vorhaben in der Pilotphase. Dass man nach einer Probezeit bei den frisch eingekauften KI-Tools bleibt, ist alles andere als gesetzt.

„Gründer zählen Pilotprojekte, einmalige Geschäfte oder nicht aktivierte Verträge als wiederkehrende Einnahmen“, so Garfinkle. Außerdem ist ARR häufig einfach eine Hochrechnung, bei der die monatlichen Einnahmen aus dem derzeit besten Monat des Jahres mit zwölf multipliziert werden, um auf einen groben Jahresumsatz zu kommen.

Das ist nicht nur ein Beispiel für kreative Buchhaltung, sondern kann auch Investor:innen und Kund:innen in die Irre führen. Der Druck, mit der Vielzahl an KI-Startups mitzuhalten und sich weitere Finanzierungen von Risikokapitalgebern zu sichern, führt allerdings dazu, dass viele Firmen eher diesen Pi-mal-Daumen-Jahresumsatz vermelden als gar keinen.

Token-Verbrauch: Große Zahlen, wenig dahinter?

Eine Billion Tokens. So viel haben laut einer Folie, die Sam Altman während seiner Keynote auf den diesjährigen OpenAI Dev Days zeigte, dreißig Großkunden seines Startups wie Duolingo, Shopify oder Salesforce jeweils verbraucht. Tokens, das ist die kleinstmögliche Währung im Sprachmodell-Kontext. Wenn ChatGPT beispielsweise einen Satz generiert, steht eine Silbe oder ein Wortbestandteil, im Englischen oft vier Buchstaben, für ein Token. Und wenn ein:e Nutzer:in eine Anfrage schickt, wird diese ebenso in Tokens zerlegt.

Auf den ersten Blick scheinen verarbeitete Tokens also ein adäquater Gradmesser. Schließlich spricht zum Beispiel auch Google in den Kommentaren zu den Ergebnissen aus dem dritten Quartal 2025 neben ARR-Angaben für sein Cloud-Segment von sieben Milliarden Tokens pro Minute, die über seine Gemini-Schnittstelle verarbeitet werden. Außerdem behauptet die Alphabet-Tochter, dass 150 ihrer Google-Cloud-Kunden im vergangenen Jahr die Eine-Billion-Marke durchbrochen haben. Nur: Ohne Kontext ist diese Metrik mehr als intransparent.

Denn wie lukrativ der Verbrauch von Tokens für die dazugehörige Firma ist, hängt von zahlreichen Faktoren ab. Ein Blick auf die Preisgestaltung für den Zugriff auf die OpenAI-API zeigt beispielsweise drastische Unterschiede je nach verwendetem Modell. Auch die Kosten für Input- und Output-Token unterscheiden sich extrem. Eine Million Output-Tokens kosten bei GPT-5 beispielweise zehn Dollar, bei GPT-5 Mini zwei Dollar und bei GPT-5 Pro 120 Dollar. Zwischen den API-Kosten für eine Billion Output-Tokens über das Standard- und das Pro-Modell liegt also ein dreistelliger Millionenbetrag. Und dabei sind potenzielle Preisnachlässe für Batch-Berechnungen noch nicht einbezogen.

MAU, DAU, WAU: Aktivität liegt im Ermessen der Plattformen

Eine Metrik, die es so erst seit dem Aufstieg von Social-Media-Plattformen wie Facebook, Instagram, Tiktok oder X gibt, ist MAU. Das Kürzel steht für monthly active users, also aktive Nutzer:innen auf einer Plattform. Je nach Plattform werden auch DAU oder WAU, also die Anzahl täglich oder wöchentlich aktiver Nutzender, als Kennzahl für die Beliebtheit eines Dienstes herangezogen.

Meta, Betreiber der wohl größten Social-Media-Netzwerke der westlichen Welt Facebook und Instagram, nutzt als Metrik mittlerweile beispielsweise DAP, daily active people. Berechnet werden diese laut Jahresbericht „basierend auf der Aktivität von Nutzern, die während des entsprechenden Messzeitraums mindestens eines der folgenden Produkte besucht haben: Facebook, Instagram, Messenger und Whatsapp (zusammenfassend als unsere ‚Produktfamilie‘ bezeichnet)“. Aktivität ist allerdings dehnbar.

Ob dazu jemand gezählt wird, der eine Seite aufruft, eine bestimmte Zeit darauf verbringt oder etwas anklickt, ist nicht standardisiert. Deswegen sind Meldungen wie die, dass OpenAI 800 Millionen wöchentliche Nutzer:innen hat, ein Stück weit eine Nebelkerze. Da die Firma keiner Berichtspflicht nachkommen muss, kann sie diese Metrik definieren, wie sie will. Wenn jemand also ChatGPT im Browser oder auf dem Handy ansurft und nach zwei Sekunden den Tab wieder schließt, könnte das schon als aktive:r Nutzer:in gezählt werden. Und das, obwohl andere Firmen vielleicht ganz andere Maßstäbe anlegen. Das macht Vergleiche zwischen Plattformen so lange schwierig, bis eine standardisierte Methode zur Zählung eingeführt wird.

Weiche Metriken und Angst vor einer Blase gehen Hand in Hand

Ein Blick auf drei der beliebtesten Kennzahlen im KI-Geschäft zeigt: Wo handfeste Ergebnisse, beispielsweise verifizierte und auditierte Berichte über einen Return on Investment oder echte, prüfbare Nutzungsstatistiken, fehlen, stopfen Firmen die Lücken mit weichen Kennzahlen, anstatt sie offen zu lassen. Das ist ideales Futter für die Diskussion, ob wir uns in einer KI-Blase befinden.

Denn ob und wann diese Blase platzt, liegt am Vertrauen der Investor:innen. KI-Startups wie OpenAI und Anthropic schreiben internen Leaks zufolge konstant rote Zahlen, Cloud-Konzerne wie Google oder Amazon schrauben ihre Kapitalausgaben für neue Rechenzentren nach oben, obwohl die zukünftige Nachfrage unsicher ist. Bleiben messbare Erfolge zu lange aus, könnten die Geldströme, mindestens an kleinere Startups, schnell versiegen.

Bis sich KI also als echter Effektivitätsbooster in der Jahresbilanz niederschlägt, bleibt die Bedrohung einer platzenden Blase akut. Da helfen auch Rekordergebnisse bei Token-Verbrauch, MAU und ARR nichts.