KI-generierte Bilder bringen OpenAI an ihre Grenzen: GPUs kämpfen mit Überhitzung

Diesen dramatisch klingenden Schritt teilte OpenAI-Chef Sam Altman am Mittwoch auf X in gewohnt lakonischer Manier mit: „Es macht Spaß zu sehen, wie sehr Menschen die Bilder in ChatGPT lieben, aber unsere GPUs schmelzen.“
Wie genau die neuen Limits aussehen, ließ Altman offen. Klar scheint aber, dass selbst die kürzlich eingeführte Beschränkung für Nutzer:innen der kostenlosen ChatGPT-Version nicht ausreicht, um die hauseigene Infrastruktur zu entlasten. Hier soll die Bildgenerierung demnächst auf drei Bilder pro Tag begrenzt werden.
Bilder-KI: Hohe Nachfrage, hoher Energiebedarf
Technisch basiert die neue Funktion auf dem multimodalen Modell GPT-4o, das unter anderem realistischere Ergebnisse liefert und frühere Schwächen bei der Darstellung von Texten sichtbar reduziert. Wie wir hier bei t3n bereits erklärt haben, lässt sich das Leistungsniveau des Modells gut anhand eines Vergleichs veranschaulichen: Während frühere KI-Systeme etwa Schwierigkeiten hatten, lesbaren Text in Bildern zu erzeugen, gelingt dies GPT-4o deutlich besser. Gerade bei Beschriftungen oder visuellen Details mit semantischem Gehalt zeigt sich der Fortschritt gegenüber früheren Modellen wie DALL-E – das aber weiterhin als Bildgenerator wählbar bleibt.
OpenAI selbst sprach gegenüber The Verge von einem „Step Change“, also einem deutlichen Sprung gegenüber früheren Versionen. Doch diese deutlich verbesserte Qualität hat ihren Preis. Sie benötigt enorme Rechenleistung – und genau das führt derzeit zu spürbaren Engpässen.
OpenAI will die Auslastung seiner Infrastruktur nun effizienter gestalten, um die Limits möglichst bald wieder aufheben zu können. Schon die Verwendung von Begriffen wie „bald“ deutet allerdings darauf hin, dass das Unternehmen selbst noch nicht genau weiß, wie hier die Enden zusammengeführt werden können.
KI trifft Ressourcenrealität
Die Diskussion um Rechenkapazitäten und Effizienz bei generativer KI ist nicht neu, gewinnt aber mit Fällen wie diesem an Schärfe. Denn während Textmodelle wie GPT-4 vergleichsweise ressourcenschonend arbeiten, erhöhen Bild- und Videoanwendungen den Energiebedarf exponentiell. Für Anbieter wie OpenAI, aber auch für Unternehmen, die KI-Systeme produktiv einsetzen wollen, stellen sich damit zwei alte Fragen neu: Was kostet Fortschritt – und lohnt sich das?