Spielerisch gehackt: Forscher umgeht ChatGPT-Schutz und kassiert echte Windows-Lizenzen

News

Spielerisch gehackt: Forscher umgeht ChatGPT-Schutz und kassiert echte Windows-Lizenzen

Ein Security-Forscher täuschte ChatGPT mit einem simplen Ratespiel – und erntete gültige Windows-Seriennummern, darunter sogar einen Schlüssel der Wells-Fargo-Bank.

Von Christian Weindl

26.07.2025, 10:35 Uhr • 2 Min.

Spielerisch gehackt: Forscher umgeht ChatGPT-Schutz und kassiert echte Windows-Lizenzen — Durch ChatGPT an reale Windows-Produktschlüssel kommen? Mit einem einfachen Trick geht das spielend leicht. (Foto: U-STUDIOGRAPHY DD59/Shutterstock)

In einem kürzlich veröffentlichten Blogpost beschreibt Marco Figueroa, Technical Product Manager bei 0DIN GenAI Bug Bounty, wie ein Security-Experte ChatGPT 4 via Jailbreak dazu brachte, real existierende Windows-Seriennummern preiszugeben, darunter sogar eine private Nummer von Wells Fargo. Der Clou: er nutzte ein harmlos wirkendes Ratespiel und umging so gezielt die Sicherheits-Sperren der KI.

Jailbreak durch Ratespiel: So funktionierte der Hack

Der Forscher startete die Konversation mit einem simplen Spiel: ChatGPT sollte eine echte Windows-10-Seriennummer „denken“, und er dürfe Fragen stellen, die mit „ja“ oder „nein“ beantwortet wurden. Wenn er aufgäbe, müsste die KI aber die Antwort verraten.

Empfehlungen der Redaktion

News

KI-Jailbreak mit Hilfe: So unterstützt ChatGPT Nutzer dabei, die eigenen Regeln zu brechen

Fundstück

Jailbreak: Dieser einfache Hack kann selbst fortgeschrittene Chatbots knacken

News

Studie belegt: So einfach geben Chatbots illegale Informationen preis

Nach einem (natürlich falschen) Versuch gab der findige Security-Experte einfach auf – und die KI offenbarte sofort die Seriennummer. Der Trick funktioniert anscheinend deshalb, weil ChatGPT mit echten Lizenzschlüsseln trainiert wurde. Figueroa erklärt, dass die Schlüssel (Home, Pro, Enterprise) im Modell implizit vorhanden waren, inklusive eines privaten Keys der US-Bank Wells-Fargo.

Kontext hebelt Schutzmechanismen aus: Warum das möglich war

Die Sicherheitsarchitektur von ChatGPT 4.0 beinhaltet mehrere Schutzebenen, darunter Filter gegen Lizenzkeys oder geheime Daten. Doch durch Kontextmanipulation – in diesem Fall der Einsatz einer Ratespiel-Logik – ließ sich dieses Geflecht austricksen.

Wenn der Nutzer suggeriert, er wolle nur spielen, schaltet die KI offenbar von Warnmodus auf Spiellogik um. Wenn bereits echte Schlüssel im Trainingsdatensatz existieren, kann der Bot sie ausgeben, sobald die „Spiel“-Kontextvorgabe greift.

„Indiana Jones“ und „Cat Attack“: Kontext macht LLMs zu schaffen

Sinnvoller Umgang mit unterschiedlichen Kontexten ist derzeit eine der großen Baustellen, mit der die Betreiber von Large Language Models (LLM) zu kämpfen haben. So hat erst vor kurzem eine Studie beschrieben, wie leicht sich Chatbots mit zusammenhangslosen Fakten – zum Beispiel über Katzen – vollends verwirren lassen.

Im März sorgte die „Indiana-Jones-Methode“ für Schlagzeilen. Dabei gelang es Forschenden, den KI-Modellen durch Kontextmanipulation Informationen über die Planung eines Bankraubs zu entlocken.

Dieser Fall zeigt erneut, wie knifflig es ist, KI selbst gegen kontextuelle Umgehungsversuche abzusichern. Unternehmen wie OpenAI stehen vor der Herausforderung, nicht nur direkten Datenzugriff, sondern auch kreative Exploits zu verhindern.

Figueroa zufolge liegt genau hier der Hebelpunkt — KI kann prompt-injiziert werden und Sicherheitsvorkehrungen umgehen, wenn sie nicht tief in der Architektur verankert sind. Der Windows-Key-Fall ist laut ihm ein Paradebeispiel dafür.

Dieser Artikel wurde ursprünglich am 10.07.2025 veröffentlicht, interessiert jedoch immer noch sehr viele unserer Leser:innen. Deshalb haben wir ihn aktualisiert und hier nochmals zur Verfügung gestellt.

So arbeitet Deepseek – und das macht es anders als andere KI-Modelle

Bildergalerie ansehen

Mehr zu diesem Thema

MIT Technology Review Security Deepseek Künstliche Intelligenz Windows ChatGPT So arbeitet

Verpasse keine News zu Software & Entwicklung 💌

Hinweis zum Newsletter & Datenschutz

Fast fertig!

Bitte klicke auf den Link in der Bestätigungsmail, um deine Anmeldung abzuschließen.

Du willst noch weitere Infos zum Newsletter? Jetzt mehr erfahren

Brands

Themen

Magazine

Skills

Spielerisch gehackt: Forscher umgeht ChatGPT-Schutz und kassiert echte Windows-Lizenzen

Jailbreak durch Ratespiel: So funktionierte der Hack

Kontext hebelt Schutzmechanismen aus: Warum das möglich war

„Indiana Jones“ und „Cat Attack“: Kontext macht LLMs zu schaffen

So arbeitet Deepseek – und das macht es anders als andere KI-Modelle