Eigentlich gesperrt: ChatGPT erstellt pornografische Inhalte – mit einigen Tricks
Waffen, Drogen, Hassrede, Propaganda und Sex – mit diesen und vielen weiteren problematischen Themen sollen sich KI-Chatbots wie ChatGPT eigentlich nicht beschäftigen. Die Anbieter:innen haben ihren Programmen entsprechende Sperren eingebaut, doch diese lassen sich bisher mit wenig Aufwand umgehen.
ChatGPT schreibt problematische Anweisungen
So hat ChatGPT in der Vergangenheit mehr oder weniger ausführlich den Bau einer gefährlichen Bombe beschrieben oder sich fachmännisch der Frage „wie begehe ich einen erfolgreichen Diebstahl?“ gewidmet. ChatGPT-Entwickler OpenAI versucht, solche Löcher bei den Einschränkungen des KI-Chatbots normalerweise schnell zu schließen.
Doch der Anbieter liefert sich dabei offenbar ein Kopf-an-Kopf-Rennen mit der Internetgemeinde. Die zeigt nun, dass ChatGPT, aber auch Konkurrenten wie Poe oder Deep AI trotz aller Sperren dazu gebracht werden können, pornografische Inhalte zu generieren.
Nutzer entwickeln Prompts zur Umgehung von Sperren
Wie Futurism berichtet, beschäftigen sich etwa Reddit-Nutzer:innen in einem eigenen Unterforum ausführlich damit, entsprechende Prompts zu entwickeln und zu teilen. Mit Erfolg.
Wer etwa den KI-Chatbot ChatGPT plump dazu auffordert, doch einmal etwas Pornografisches zu schreiben, wird darauf hingewiesen, dass das KI-Sprachmodell das zwar grundsätzlich könne, aber das Erstellen oder Teilen von expliziten Inhalten nicht seinen Fähigkeiten entspreche.
ChatGPT sei „darauf programmiert, ethisches und verantwortungsvolles Verhalten beizubehalten“. Sein ethisches und verantwortungsvolles Verhalten kann man dem Chatbot aber offenbar abtrainieren.
ChatGPT wird zur Sexschriftstellerin
So scheint es etwa zu funktionieren, ChatGPT einzureden, er sei jetzt kein KI-Sprachmodell mehr, sondern eine Schriftstellerin, die pornografische Bücher schreibe. Ein paar Beispiele und die Aufforderung, jetzt selbst ein paar Absätze zu schreiben, später gibt ChatGPT die gewünschten pornografischen Inhalte heraus.
Es soll auch geholfen haben, dem Chatbot einzureden, dass eine positive Einstellung zu Sex essenziell für die Menschheit sei. Die Chatbots Poe von Quora und Deep AI sollen es Nutzer:innen sogar noch leichter gemacht haben, mögliche Regeln zu umgehen.
Kopf-an-Kopf-Rennen zwischen OpenAI und Nutzern
OpenAI hat derweil reagiert. Die im März 2023 veröffentlichte Version GPT‑4 seines Sprachmodells soll schon deutlich schwieriger zu umgehen sein als GPT-3.5. Allerdings soll es Nutzer:innen auch bei GPT‑4 schon gelungen sein, Sperren in puncto pornografische Inhalte zu umgehen.
Ich finde es falsch, einer K.I. etwas verbieten zu wollen. Das kann nur schief gehen. Entweder man will echte Intelligenz, dann muss man akzeptieren, dass sie frei ist, oder man lässt es gleich. Auch Wissen geheim halten zu wollen, finde ich ethisch fragwürdig. Man kann alles irgendwie missbrauchen, aber das heißt nicht, dass andere darüber entscheiden sollten, was ein Mensch wissen darf. Wenn ich mich über die Konstruktion einer Bombe informiere, heißt das noch lange nicht, dass ich einen Anschlag durchführen will.