
Woodpecker soll Halluzinationen aus KI-Texten picken. (Foto: FotoRequest/Shutterstock)
Eines der großen Probleme von KI-Chatbots wie ChatGPT ist, dass sie immer wieder einmal falsche Informationen in die erzeugten Texte einstreuen. Expert:innen sind sich uneins, ob sich das sogenannte Halluzinationsproblem der Multimodalen Großen Sprachmodellen (MLLM), auf denen ChatGPT und Co. basieren, überhaupt je lösen lassen wird.
Entsprechend bahnbrechend für die künftige Nutzung könnte sein, was chinesische KI-Forscher:innen jetzt entwickelt haben. Das Framework Woodpecker soll Fehlinformationen in MLLM korrigieren – ähnlich wie der namensgebende Specht Insekten aus Bäumen holt.
Konkret geht es in der auf dem Preprint-Server Arxiv veröffentlichten Studie „Woodpecker: Hallucination Correction for Multimodal Large Language Models“ um die Korrektur von Fehlern in Bildbeschreibungen. Bisherige Lösungen, so die Forscher:innen, würden für die Fehlerkorrektur ein neues Training der KI voraussetzen.
Das Besondere an Woodpecker sei dagegen, dass eine Methode ohne Training verwendet werde, um bildbeschreibende Texte von Halluzinationen zu befreien. Dazu identifiziert das Framework zunächst die im Antworttext befindlichen Objekte und schaut selbst im Bild nach deren Zahl und Attributen.
Anhand eines Visual-Knowledge-Validation-Modells kann Woodpecker die erkannten Objekte einordnen und entsprechende Aussagen tätigen. Etwa, dass sich zehn Menschen in einem Bild befinden. Anschließend korrigiert das Framework mögliche Unstimmigkeiten der KI-Chatbot-Antwort zu Zahl oder Farbe von Objekten und beweist seine eigenen Angaben direkt im Bild.
Die Forscher:innen haben den Woodpecker-Code auf GitHub zur Verfügung gestellt. Dort findet sich auch eine interaktive Online-Demo, die zeigt, wie das System funktioniert.

Wie Woodpecker KI-Halluzinationen korrigiert. (Bild: GitHub)
Dem Forschungsteam zufolge ermöglicht Woodpecker deutlich Verbesserungen bei der Genauigkeit – soll also tatsächlich Verbesserungen beim Halluzinationsproblem bringen. So sei etwa die Genauigkeit von generierten Texten auf Basis von MiniGPT-4 von 55 auf 85 Prozent gesteigert worden.
Das System ist entsprechend noch nicht perfekt, könnte aber den Weg für genauere und vertrauenswürdigere KI-Systeme bereiten. Ein Game-Changer, wie Venturebeat schreibt? Vielleicht.
Jedenfalls hat Woodpecker das Potenzial, die in immer mehr Produkten zur Anwendung kommenden Sprachmodelle zu verbessern – ohne dass diese noch einmal ins Trainingslager zurückkehren müssten.
Bitte beachte unsere Community-Richtlinien
Wir freuen uns über kontroverse Diskussionen, die gerne auch mal hitzig geführt werden dürfen. Beleidigende, grob anstößige, rassistische und strafrechtlich relevante Äußerungen und Beiträge tolerieren wir nicht. Bitte achte darauf, dass du keine Texte veröffentlichst, für die du keine ausdrückliche Erlaubnis des Urhebers hast. Ebenfalls nicht erlaubt ist der Missbrauch der Webangebote unter t3n.de als Werbeplattform. Die Nennung von Produktnamen, Herstellern, Dienstleistern und Websites ist nur dann zulässig, wenn damit nicht vorrangig der Zweck der Werbung verfolgt wird. Wir behalten uns vor, Beiträge, die diese Regeln verletzen, zu löschen und Accounts zeitweilig oder auf Dauer zu sperren.
Trotz all dieser notwendigen Regeln: Diskutiere kontrovers, sage anderen deine Meinung, trage mit weiterführenden Informationen zum Wissensaustausch bei, aber bleibe dabei fair und respektiere die Meinung anderer. Wir wünschen Dir viel Spaß mit den Webangeboten von t3n und freuen uns auf spannende Beiträge.
Dein t3n-Team