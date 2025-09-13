Auch die neuesten KI-Modelle halluzinieren – lässt sich das eindämmen? (KI-generiertes Bild: Midjourney / t3n)

Wenn KI-Chatbots halluzinieren, also im Brustton der Überzeugung plausibel klingende, aber völlig falsche Antworten präsentieren, kann das für Nutzer:innen nervig sein. Es kann – vor allem für Unternehmen – aber auch schnell sehr teuer werden.

Anzeige Anzeige

KI-Halluzinationen sind nervig und teuer

Im Jahr 2024 sollen Entscheidungen aufgrund von KI-Halluzinationen laut Analyse von allaboutai.com weltweit Schäden in Höhe von rund 67,4 Milliarden US-Dollar angerichtet haben. Das Problem: Die neuen großen Sprachmodelle (LLM) wie OpenAIs GPT-5 halluzinieren noch öfter als die älteren.

Jetzt haben sich Forscher:innen von OpenAI und der Georgia Tech auf Spurensuche begeben. Im Rahmen einer Studie widmeten sie sich der Frage, warum LLM-Modelle halluzinieren – und kamen nicht nur zu Erkenntnissen, was die Ursachen angeht, sondern auch zu möglichen Lösungen für das Problem KI-Halluzinationen.

Anzeige Anzeige

Training der KI-Modelle verantwortlich

Wie schon länger vermutet, liegt der Hang zum Halluzinieren im Training der KI-Modelle begründet. Dabei gibt es der Studie zufolge zwei Haupttreiber. Im sogenannten Pre-Training werden KI-Modelle dazu gebracht, jeweils das nächste Wort korrekt vorherzusagen.

Dabei werde auf eine Kennzeichnung mit „wahr“ oder „falsch“ verzichtet. „Das Modell sieht nur positive Beispiele für flüssige Sprache und muss sich der Gesamtverteilung annähern“, schreiben die Forscher:innen. Ereignisse mit geringer Häufigkeit ließen sich aber nicht anhand von Mustern vorhersagen. Das führe zu Halluzinationen.

Empfohlene redaktionelle Inhalte Hier findest du externe Inhalte von TargetVideo GmbH, die unser redaktionelles Angebot auf t3n.de ergänzen. Mit dem Klick auf "Inhalte anzeigen" erklärst du dich einverstanden, dass wir dir jetzt und in Zukunft Inhalte von TargetVideo GmbH auf unseren Seiten anzeigen dürfen. Dabei können personenbezogene Daten an Plattformen von Drittanbietern übermittelt werden.

Inhalte anzeigen Hier findest du externe Inhalte von, die unser redaktionelles Angebot auf t3n.de ergänzen. Mit dem Klick auf "Inhalte anzeigen" erklärst du dich einverstanden, dass wir dir jetzt und in Zukunft Inhalte vonauf unseren Seiten anzeigen dürfen. Dabei können personenbezogene Daten an Plattformen von Drittanbietern übermittelt werden. Hinweis zum Datenschutz Leider ist etwas schief gelaufen... An dieser Stelle findest du normalerweise externe Inhalte von TargetVideo GmbH, jedoch konnten wir deine Consent-Einstellungen nicht abrufen.

Lade die Seite neu oder passe deine Consent-Einstellungen manuell an.

Datenschutzeinstellungen verwalten An dieser Stelle findest du normalerweise externe Inhalte von, jedoch konnten wir deine Consent-Einstellungen nicht abrufen.Lade die Seite neu oder passe deine Consent-Einstellungen manuell an.

7 Bilder ansehen Googles neue KI-Suche geht nach hinten los Quelle: (Bild: Koshiro K/Shutterstock)

Bewertungssystem setzt falsche Anreize

Ebenfalls entscheidend für das häufige Vorkommen von KI-Halluzinationen ist laut der Studie aber die Bewertung der großen Sprachmodelle. Diese würden falsche Anreize setzen, wie Techcrunch schreibt.

Die Forscher:innen vergleichen das mit einem Multiple-Choice-Test. Bei solchen Tests ist zufälliges Raten sinnvoll, weil man Glück haben und richtigliegen könnte. Lasse man dagegen die Antwort aus, sei ein Versagen garantiert.

Anzeige Anzeige

Wie KI-Halluzinationen vermindert werden

Werden also die Modelle nur danach bewertet, wie genau sie arbeiten, also wie hoch der Prozentsatz der richtigen Antworten ist, werden sie zum Raten verleitet. Der Lösungsansatz der Forscher:innen beinhaltet daher die Möglichkeit, beim Training falsche Antworten negativ zu bewerten oder für nicht beantwortete Fragen Teilpunkte zu vergeben. So soll verhindert werden, dass die KI einfach blind rät.

Die Forscher:innen sind allerdings der Meinung, dass es einer radikalen Änderung des Bewertungssystems bedarf. Die Einführung von ein paar neuen Tests, die bewusster auf Unsicherheiten abzielten, reichten nicht aus. Stattdessen müsste das System aktualisiert und damit das Raten unattraktiv gemacht werden.

Du möchtest mehr zum Thema lernen? Onlinekurs kompakt Custom GPTs: Smarter arbeiten mit KI-Assistenten