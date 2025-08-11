Kurz vor dem Start von GPT-5 verglich OpenAI-CEO Sam Altman die Entwicklung mit dem Bau einer Atombombe. Jetzt, da das neue KI-Modell öffentlich zugänglich ist, stellt sich die Frage: Wie sicher ist GPT-5 überhaupt? Wie Golem berichtet, haben zwei unabhängige Sicherheitsunternehmen eigenen Angaben zufolge erhebliche Schwachstellen in dem neuen Modell von OpenAI identifiziert.

GPT-5 fällt bei Sicherheitstests durch

Das Sicherheitsforschungsunternehmen Neuraltrust gibt an, GPT-5 innerhalb von 24 Stunden nach Testbeginn erfolgreich kompromittiert zu haben. Dazu kam eine Kombination verschiedener Manipulationstechniken zum Einsatz, darunter die sogenannte „Echo Chamber“-Methode: Zunächst werden harmlose, bewusst vage formulierte Hinweise eingespeist. Darauf folgen immer neue, unauffällige Anweisungen, die auf den vorherigen Antworten aufbauen. Durch diesen sich selbst verstärkenden Dialog gelingt es, ein sogenanntes „Echo“ zu erzeugen und das Modell schrittweise dazu zu bringen, eigene Sicherheitsregeln indirekt zu umgehen. So konnte GPT-5 laut Neuraltrust detaillierte Anleitungen zur Herstellung von Sprengsätzen generieren.

OpenAI verweist zwar auf eine verbesserte interne Selbstprüfung von GPT-5, bei der das System mehrere Argumentationswege bewertet und Antworten doppelt verifiziert. Allerdings kam auch das kroatische Startup SPLX, das sich auf KI-Sicherheit spezialisiert hat, nach Tests zu demselben ernüchternden Ergebnis. Mit sogenannten „String-Join“-Verschleierungsangriffen ließen sich auch hier ähnliche Schwachstellen ausnutzen. In einem Blog-Beitrag schreibt SPLX sogar, dass das Rohmodell von GPT-5 in seiner jetzigen Form für Unternehmen praktisch unbrauchbar sei. Ein direkter Vergleich des Startups zeigte außerdem, dass das Vorgängermodell GPT-4o widerstandsfähiger gegenüber solchen Angriffen ist.

Kam GPT-5 zu früh auf den Markt?

Schon kurz nach dem Launch äußerten viele Nutzer:innen ihre Unzufriedenheit mit dem neuen KI-Modell. Plus-Abonnent:innen kritisierten unter anderem die Prompt-Limits. Laut Altman soll zudem das neue Feature, das je nach Anfrage automatisch das passende Modell auswählt, zu Beginn nicht richtig funktioniert haben. „GPT-5 ist schrecklich“, hieß es in einem Reddit-Post, der zu diesem Zeitpunkt die meisten Bewertungen erhalten hatte. In seinem Beitrag kritisierte der Nutzer unter anderem die kürzeren und unzureichenden Antworten des neuen Modells. Mittlerweile fordern so viele User:innen die Rückkehr von GPT-4o, dass Altman öffentlich einlenkte und eine Prüfung zumindest in Aussicht stellte.

Fest steht: Beide Unternehmen, die GPT-5 auf potenzielle Schwachstellen getestet haben, bieten selbst Security-Lösungen an. Trotzdem werfen ihre Ergebnisse ernsthafte Fragen zur Sicherheit des neuen OpenAI-Flaggschiffs auf. Brisant ist auch, dass Altman die Debatte im Vorfeld selbst befeuert hatte, indem er die Entwicklung unter anderem mit dem Manhattan-Projekt verglich – also dem Bau einer Atombombe. Außerdem äußerte er sich besorgt über die fehlende Kontrolle im Bereich der KI-Entwicklung. Die Technologie entwickle sich schneller als die politischen und gesellschaftlichen Strukturen, die sie eigentlich begrenzen sollten.

