Nicht einmal ChatGPT erkennt ChatGPT-Texte: KI-Detektoren laut OpenAI allesamt Schrott

Seit Anfang 2023 sind eine Reihe von Tools veröffentlicht worden, die versprachen, von ChatGPT und anderen Sprachmodellen geschriebene Texte erkennen zu können. Programme wie GPT-Zero sollten insbesondere an Schulen und Universitäten dafür sorgen, dass Schüler:innen und Student:innen ihre Hausaufgaben oder Masterarbeiten selbst schreiben.
Schon nach wenigen Monaten stellte sich aber aber heraus, dass die Tools eine sehr geringe Trefferquote haben, was die Erkennung von KI-geschriebenen Texten angeht. Das führte sogar dazu, dass Schüler:innen fälschlicherweise beschuldigt wurden, ChatGPT zur Erledigung ihrer Hausaufgaben benutzt zu haben.
Die Tech-Newsseite Ars Technica etwa hatte KI-Detektoren wie GPT-Zero vor einigen Wochen genauer unter die Lupe genommen und erklärt, warum diese keine befriedigenden Ergebnisse liefern. Manche Expert:innen bezeichnen diese Detektoren auch schon mal als „Schlangenöl“, was auf die Unwirksamkeit trotz großer – geschürter – Erwartungen hinweist.
Jetzt hat OpenAI dies erstmals offiziell eingestanden. Das Unternehmen, das mit der Veröffentlichung von ChatGPT im Herbst 2022 einen regelrechten Hype ausgelöst hatte, hatte mit AI Classifier auch einen eigenen Detektor im Portfolio.
Das – zugegebenermaßen – in der Experimentierphase befindliche Tool wurde im Juli eingestellt. Die Trefferquote beim Erkennen von KI-geschriebenen Texten lag gerade einmal bei 26 Prozent.
Das offizielle Eingeständnis findet sich in der FAQ eines Marketing-Postings von OpenAI zum Schulstart, wie Ars Technica entdeckt hat. Dort steht auf die Frage: „Funktionieren KI-Detektoren?“ die Antwort: „Kurz gesagt, nein“. Keiner der bisher veröffentlichten Tools, inklusive jenes von OpenAI habe nachweislich zuverlässig zwischen KI-generierten und von Menschen geschriebenen Texten unterscheiden können.
Interessanterweise geht OpenAI in der FAQ auch auf ChatGPT ein. Der Chatbot sei ebenfalls nicht in der Lage, KI-generierte Texte zu erkennen. Entsprechende Nachfragen, etwa ob Nutzer:innen das Essay selbst geschrieben hätten, seien zufällig und ohne, dass ChatGPT hier irgendetwas entdeckt hätte, so OpenAI.
Dass KI-Detektoren bisher nicht in der Lage sind, KI-generierte Texte zu erkennen, heißt freilich nicht, dass das in Zukunft einmal möglich sein könnte. Könnte, aber nicht muss, wie etwa der KI-Analyst Ethan Mollick von der Uni Wharton meint. KI-Texte seien nicht erkennbar und blieben es wahrscheinlich auch, so Mollick.
Bitte beachte unsere Community-Richtlinien
Wir freuen uns über kontroverse Diskussionen, die gerne auch mal hitzig geführt werden dürfen. Beleidigende, grob anstößige, rassistische und strafrechtlich relevante Äußerungen und Beiträge tolerieren wir nicht. Bitte achte darauf, dass du keine Texte veröffentlichst, für die du keine ausdrückliche Erlaubnis des Urhebers hast. Ebenfalls nicht erlaubt ist der Missbrauch der Webangebote unter t3n.de als Werbeplattform. Die Nennung von Produktnamen, Herstellern, Dienstleistern und Websites ist nur dann zulässig, wenn damit nicht vorrangig der Zweck der Werbung verfolgt wird. Wir behalten uns vor, Beiträge, die diese Regeln verletzen, zu löschen und Accounts zeitweilig oder auf Dauer zu sperren.
Trotz all dieser notwendigen Regeln: Diskutiere kontrovers, sage anderen deine Meinung, trage mit weiterführenden Informationen zum Wissensaustausch bei, aber bleibe dabei fair und respektiere die Meinung anderer. Wir wünschen Dir viel Spaß mit den Webangeboten von t3n und freuen uns auf spannende Beiträge.
Dein t3n-Team