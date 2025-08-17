Könnte sich KI irgendwann gegen den Menschen wenden? Mit dieser Frage beschäftigen sich längst nicht mehr nur Science-Fiction-Filme. Wie Futurism berichtet, kommt eine neue Studie zu dem Ergebnis, dass große Sprachmodelle Inhalte bevorzugen, die ebenfalls von KI erstellt wurden. Die Autor:innen warnen deshalb vor einer Zukunft, in der KI-Modelle Menschen als soziale Gruppe gezielt diskriminieren könnten.

Studie belegt: KI bevorzugt KI-generierte Inhalte

Dass KI-Modelle voreingenommen sind, ist schon seit Längerem ein Thema. Oft geht es dabei um Minderheiten oder Frauen, da diese gesellschaftlich benachteiligt oder unterrepräsentiert sind, was sich auch in den verwendeten Trainingsdaten widerspiegelt. Ein Beispiel dafür ist eine Studie des MIT, die untersuchte, was passiert, wenn Patient:innen in der Kommunikation mit einer medizinischen KI Tippfehler machen. Das Ergebnis: Schon kleine Abweichungen von der üblichen Schreibweise führten dazu, dass die Modelle anders antworteten und ihr Gegenüber weniger ernst nahmen. Vor allem Frauen wurde in diesem Kontext davon abgeraten, mit ihren Beschwerden eine ärztliche Praxis aufzusuchen.

Aber was passiert, wenn sich diese Art der Voreingenommenheit gegen die gesamte Menschheit richtet? In ihren Tests untersuchten die Forscher:innen mehrere bekannte LLMs, darunter GPT-3.5 und GPT-4 von OpenAI sowie Llama 3.1-70b von Meta. Die Modelle sollten zwischen Produkten, wissenschaftlichen Artikeln oder Filmen wählen – jeweils auf Grundlage einer Beschreibung, die entweder von einem Menschen oder von einer KI erstellt wurde. Dabei zeigte sich, dass die Modelle eindeutig die KI-generierten Beschreibungen bevorzugten.

Was bedeutet diese Form der Benachteiligung konkret?

Am stärksten war die Voreingenommenheit bei Konsumgütern ausgeprägt. Vor allem GPT-4 zeigte hier eine deutliche Tendenz. Menschen, die dieselben Aufgaben bearbeiteten, wiesen dagegen nur eine leichte, uneinheitliche Präferenz für KI-Inhalte auf. Das zeigte sich vor allem in Bezug auf Filme und wissenschaftliche Texte. In einer Zeit, in der das Internet zunehmend mit KI-Inhalten überflutet wird, ist diese Entwicklung besonders besorgniserregend. Denn die Inhalte werden wiederum von anderen Modellen zum Training genutzt – ein Kreislauf, der die Qualität der Systeme langfristig verschlechtern könnte. Studienautor Jan Kulveit, Informatiker an der Universität Prag, fasst das Problem in einem Post auf X zusammen: „In einer von KI-Agenten bevölkerten Wirtschaft Mensch zu sein, wäre miserabel.“

Für Menschen stellt diese Form der Diskriminierung eine reale Gefahr dar. Wenn KI-gestützte Systeme künftig in Bewerbungsprozessen, bei der Vergabe von Stipendien oder der Auswahl wissenschaftlicher Arbeiten eingesetzt werden, könnten KI-generierte Inhalte systematisch bevorzugt werden. Das Forschungsteam warnt, dass dadurch Menschen benachteiligt würden, die entweder keine LLMs nutzen wollen oder sich deren Einsatz nicht leisten können. Dadurch würde die digitale Kluft zwischen privilegierten und weniger privilegierten Gruppen weiter vertieft.

Diskriminierung durch KI muss eingedämmt werden

Für Menschen, die vermuten, dass ihre Bewerbung oder ihre Hausarbeit von einem KI-System bewertet wird, hat Kulveit einen Rat: „Lassen Sie Ihre Präsentation von einem LLM so lange überarbeiten, bis es sie akzeptiert – versuchen Sie dabei nur, die menschliche Qualität nicht zu verlieren.“ Eine langfristige Lösung ist das allerdings nicht. Um Diskriminierung zu vermeiden und faire Bedingungen zu schaffen, muss diese Voreingenommenheit stattdessen besser verstanden und gezielt adressiert werden. Zukünftige Forschung sollte deshalb untersuchen, warum KI-Systeme vom Menschen erstellte Inhalte abwertet und wie dieses Phänomen reduziert werden kann.