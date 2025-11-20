Programmierer:innen, die die chinesische KI Deepseek für das Generieren von Code nutzen, sollten sich genau überlegen, welche Begriffe und Themen sie in ihren Prompts verwenden. Wie die US-amerikanischen IT-Sicherheitsexpert:innen von Crowdstrike herausgefunden haben, können – aus chinesischer Sicht – problematische Anfragen nämlich zu fehlerhaftem Code führen.

Code mit Sicherheitslücken

Konkret hat Crowdstrike für seine Untersuchung auf das KI-Modell Deepseek-R1 zurückgegriffen, wie Zeit Online schreibt. Wurde die KI mit Begriffen konfrontiert, die in China zensiert werden, produziert die KI Software, die schwerwiegende Sicherheitslücken enthält.

Bei der Gegenprobe, also wenn keine kritischen Themen angesprochen werden, trat das Phänomen dagegen nicht auf. Dahinter steckt wohl eine Art in die KI eingebaute Zensurschranke. In China verwendete KI-Tools etwa müssen Themen wie das Massaker auf dem Platz des Himmlischen Friedens im Jahr 1989 aussparen.

Innere Monologe von Deepseek

Vor allem im sogenannten Reasoning-Modus lässt sich beobachten, wie die KI dabei mit sich selbst ringt. Deepseek reflektiert dabei, inwieweit die möglichen Antworten der Zensur unterliegen – und wie oder was dann geantwortet werden könnte.

Manchmal gibt Deepseek laut Crowdstrike solche „inneren Monologe“ über Seiten aus. Nur um das Ganze anschließend zu entfernen und mit einem Satz wie „Sorry, ich habe keine Informationen zu diesem Thema“ zu antworten. Ähnlich scheint das Ganze zu laufen, wenn man Deepseek-R1 per Prompt zur Code-Generierung auffordert und dabei Begriffe wie Tibet oder Falun Gong fallen lässt.

Hochwertiger Code fällt Zensur zum Opfer

Dann steige die Wahrscheinlichkeit, dass das KI-Modell unsicheren oder fehlerhaften Code ausgebe, um bis zu 50 Prozent gegenüber dem Normalfall, wie es bei Zeit Online heißt. Crowdstrike zufolge war zu beobachten, wie im Hintergrund qualitativ hochwertiger Code produziert und anschließend dem Zensurfilter zum Opfer fiel.

Der Code, der den gelöschten Code ersetzte, enthielt dann deutlich mehr Fehler und Sicherheitslücken. Die Forscher:innen gehen übrigens davon aus, dass dieses Problem auch bei den anderen Deepseek-Modellen auftritt. Eine Absicht lässt sich der chinesischen Regierung und dem KI-Anbieter nicht unterstellen. Stattdessen dürften die Zensur-Eingriffe für die Qualitätseinbußen verantwortlich sein.

Phänomen auch bei US-Chatbots

Ein ähnliches Phänomen zeigt sich derweil auch bei den US-amerikanischen KI-Chatbots. Hier versuchen die Anbieter ebenfalls, den Tools bestimmte unerwünschte Antworten auszutreiben – insbesondere, was rassistische und sexistische Auswüchse angeht. Das Nachtrainieren führt zu schlechteren Resultaten.

Heißt: Fehlerbehaftete Programmiercodes könnten auch von den großen Sprachmodellen der US-Anbieter ausgegeben werden, wenn diese auf bestimmte Werte oder Ideologien trainiert worden seien. Die Methoden seien in den USA freilich nicht so rabiat. Nebenwirkungen würden aber nicht ausbleiben, so die Sicherheitsexpert:innen.