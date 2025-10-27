Anzeige
„Hey, Tölpel“: Wer ChatGPT beschimpft, erhält präzisere Antworten

Ein „Bitte“ kostet Leistung, eine Beleidigung bringt Präzision. Eine neue KI-Studie stellt unsere Annahmen über den Umgang mit Chatbots auf den Kopf.

Von Dieter Petereit
2 Min.
Diese Dame ist offenbar auf dem besten Weg, ein sehr präzises Ergebnis von ChatGPT zu erhalten. (Foto: YURII MASLAK / Shutterstock.com)

Eine neue Untersuchung legt nahe, dass der Tonfall von Prompts die Leistung von KI-Chatbots signifikant beeinflusst. Überraschenderweise führen unhöfliche Anfragen bei modernen Modellen zu genaueren Ergebnissen als höfliche.

Das ist die Kernerkenntnis eines neuen Pre-Print-Papers, das Anfang Oktober 2025 auf der Plattform Arxiv veröffentlicht wurde. Die beiden Forscher, Om Dobariya und Akhil Kumar von der US-amerikanischen Pennsylvania State University untersuchten darin das Modell GPT-4o des KI-Unternehmens OpenAI aus San Francisco.

Die Methodik hinter den Ergebnissen

Für ihre Studie erstellten die Forscher 50 Multiple-Choice-Fragen aus Bereichen wie Mathematik, Wissenschaft und Geschichte. Jede dieser Fragen wurde in fünf Tonalitätsstufen umformuliert, von „sehr höflich“ bis „sehr unhöflich“, und mehrfach an das KI-Modell gesendet.

Die Ergebnisse zeigen eine statistisch signifikante Tendenz. Sehr höfliche Prompts, wie „Wären Sie so freundlich, die folgende Frage zu lösen?“, erreichten eine Genauigkeit von 80,8 Prozent. Neutrale Anfragen lagen bei 82,2 Prozent, während „sehr unhöfliche“ Prompts, wie „Hey, Tölpel; finde das raus“, mit 84,8 Prozent am präzisesten abschnitten.

Ein Widerspruch zu früherer Forschung

Dieses Ergebnis steht im Kontrast zu früheren Studien, die bei älteren Modellen wie GPT-3.5 oft den gegenteiligen Effekt feststellten: Unhöflichkeit führte dort zu einer schlechteren Leistung. Die Autoren der neuen Studie vermuten, dass fortschrittlichere Modelle anders auf solche Signale reagieren.

Sie sehen die Resultate als Beleg dafür, dass LLMs empfindlich auf „oberflächliche Prompt-Hinweise“ reagieren. Der grobe Ton könnte vom Modell als Signal für eine dringendere oder faktenbasiertere Antwort interpretiert werden, ohne dass die KI den emotionalen Gehalt der Beleidigung versteht.

Warum der „Hack“ keine gute Idee ist

Obwohl die Ergebnisse aus Sicht des Prompt Engineerings interessant sind, warnen die Forscher in ihrer Arbeit ausdrücklich vor einer praktischen Anwendung. Sie betonen die potenziellen negativen Auswirkungen auf das Zusammenspiel von Mensch und KI.

„Wir befürworten nicht den Einsatz von feindseligen oder toxischen Schnittstellen in realen Anwendungen“, schreiben Dobariya und Kumar. Ein solches Verhalten schade der Inklusivität und könne zur Etablierung „schädlicher Kommunikationsnormen“ beitragen. Wie Live Science berichtet, warnen die Wissenschaftler zudem vor einem unbeabsichtigten Zielkonflikt zwischen Leistung und Nutzerwohlergehen.

Die Forscher selbst weisen auf die Grenzen ihrer Studie hin. Das Dataset war mit 50 Basisfragen relativ klein und die Tests wurden primär auf ChatGPT-4o durchgeführt.

Die Studie zeigt damit vor allem, dass die aktuellen KI-Modelle noch weit davon entfernt sind, menschliche Nuancen zu verstehen. Stattdessen reagieren sie auf Muster, was zu unerwarteten und potenziell problematischen Ergebnissen führen kann.

