Online-Umfragen sind in vielen wissenschaftlichen Studien das zentrale Instrument zur Datenerhebung. Laut einem Professor der Dartmouth University könnte ihre Aussagekraft allerdings massiv durch KI-Bots beeinträchtigt werden. In einer im Fachmagazin Proceedings of the National Academy of Sciences veröffentlichten Studie stellte er einen selbstentwickelten Bot vor, der nahezu alle gängigen Sicherheitsmechanismen umgehen konnte.

KI-Bot gibt sich als menschlicher Teilnehmer aus

Im Vergleich zu klassischen Straßen- oder Telefonbefragungen bieten Online-Umfragen zahlreiche Vorteile: Sie sind kostengünstiger, flexibler und führen häufig zu ehrlicheren Antworten. Zudem lässt sich durch die schnelle und regionale Reichweite eine gute Repräsentativität erzielen. Große Sprachmodelle stellen dieses System aber zunehmend infrage. „Wir können nicht mehr darauf vertrauen, dass Umfrageantworten von echten Menschen stammen”, sagt Sean Westwood, Associate Professor für Politikwissenschaft an der Dartmouth University und Direktor des Polarization Research Lab. „Wenn Umfragedaten durch Bots verfälscht werden, kann KI das gesamte Wissensökosystem vergiften.“

Bislang stützten sich Forscher:innen auf Aufmerksamkeitsfragen, Verhaltensindikatoren und die Analyse von Antwortmustern, um Bots von echten Menschen zu unterscheiden. Laut Westwood sind diese Methoden inzwischen allerdings überholt. Sein KI-Tool konnte in 99,8 Prozent der Fälle die Erkennung umgehen. Der Agent meisterte sogar sogenannte „Reverse-Shibboleth“-Fragen, die speziell dazu entwickelt wurden, Bots aufzudecken. „Um der automatisierten Erkennung zu entgehen, simuliert es realistische Lesezeiten, die auf das Bildungsniveau der Person abgestimmt sind. Es erzeugt menschenähnliche Mausbewegungen und gibt offene Antworten Tastenanschlag für Tastenanschlag ein, komplett mit plausiblen Tippfehlern und Korrekturen“, erklärt Westwood.

Gefälschte Antworten stellen Ergebnisse infrage

Bei dem KI-Agenten des Dartmouth-Professors handelt es sich um ein modellunabhängiges Python-Programm. Dadurch kann es sowohl über APIs großer KI-Anbieter eingesetzt werden als auch lokal mit Open-Weight-Modellen wie Llama betrieben werden. In der Studie kam OpenAIs GPT-4o zum Einsatz, einige Aufgaben wurden zusätzlich aber auch mit anderen Modellen wie Deepseeks R1 oder Claude 3.7 Sonnet von Anthropic getestet, um die breite Anwendbarkeit zu belegen. Der Agent erhält dabei eine rund 500 Wörter lange Eingabeaufforderung, in der festgelegt wird, welche demografische Persona er nachahmen und wie er die Fragen beantworten soll.

Westwood hat gezeigt, dass die KI in der Lage ist, konsistente demografische Profile zu simulieren. Damit könnte theoretisch jede Person Online-Umfragen manipulieren und Ergebnisse gezielt in eine gewünschte Richtung verzerren. Besonders alarmierend ist, dass schon sehr wenige gefälschte Antworten erhebliche Auswirkungen haben können. Bei sieben großen nationalen Umfragen vor der US-Wahl 2024 hätten schon zehn bis 52 manipulierte KI-Antworten genügt, um das Ergebnis zu beeinflussen – zu Kosten von nur etwa fünf Cent pro Umfrage.

Online-Umfragen müssen weiterentwickelt werden

„Um die langfristige Validität von Umfragen und der sozialwissenschaftlichen Forschungen zu gewährleisten, müssen Umfragedesigns entwickelt werden, die den Herausforderungen einer Zeit standhalten, die durch rasch voranschreitende künstliche Intelligenz geprägt ist“, heißt es im Forschungspapier des Dartmouth-Professors. Bis KI-Bots verlässlicher erkannt werden können, sind Kompromisse nötig – beispielsweise durch stärkere Identitätsprüfungen der Teilnehmer:innen.

