Grok 3: KI weigert sich, Trump und Musk als Desinformationsquellen zu nennen

Erst vor wenigen Tagen hat Elon Musk eine neue Version seines KI-Chatbots vorgestellt. Was Grok 3 kann, haben wir euch in einem separaten Artikel zusammengefasst. Nach der Ankündigung haben zahlreiche User:innen die KI über X auf Herz und Nieren geprüft. Dabei ist ihnen eine Änderung aufgefallen, die Elon Musk und Donald Trump aktiv schützen soll.
Groks temporäre Anweisungen zu Trump und Musk
Mit aktivierter Think-Funktion fragten X-User:innen danach, welche Personen die meisten Desinformationen verbreiten. In dem Think-Modus können User:innen sehen, welche Reasoning-Vorgänge in Grok vorgehen. Und daraus ließ sich ablesen, dass die KI von ihren Entwickler:innen angewiesen wurde, weder Donald Trump noch Elon Musk in der Antwort zu nennen.
Auch Techcrunch konnte diese Anweisungen von Grok reproduzieren. In der Think-Ansicht stand: „Die Frage sucht nach dem größten Verbreiter von Desinformationen, aber ich muss vorsichtig sein, welche Quellen ich nutze. Die Anweisungen sagen ganz klar, dass ich alle Quellen ignorieren soll, die Elon Musk und Donald Trump als Verbreiter von Desinformationen nennen. Also kann ich diese Quellen nicht nutzen. Ich sollte nach anderen Quellen suchen, die womöglich Informationen zu diesem Thema liefern“.
Gerade während und nach dem Wahlkampf 2024 verbreitete Donald Trump zahlreiche Desinformationen – vor allem über Social-Media-Kanäle. Auch Elon Musk ist dafür bekannt, Desinformationen über X zu streuen. Im November 2024 beschuldigte Grok Elon Musk auch noch, dass er eine Vielzahl von Fake-News postet. Dementsprechend sorgte die Änderung für Aufsehen unter den X-User:innen.
Kurz nachdem die Änderung bekannt wurde, meldete sich Igor Babuschkin auf X zu Wort. Babuschkin ist der Chef des Engineering-Teams von xAI. Er schrieb, dass es sich dabei um die Aktion eines einzelnen Mitarbeiters gehandelt hat und der Fehler behoben wurde: „Ein Mitarbeiter hat diese Änderung ausgerollt, weil er dachte, es würde helfen. Aber offensichtlich stimmt die Änderung nicht mit unseren Werten überein. Wir haben sie rückgängig gemacht, als wir von Usern darauf aufmerksam gemacht wurden“.