Anzeige
Anzeige
News

Sprache der KI: Welche Wörter entlarven künstlich generierte Texte?

Forscher:innen haben in einer Studie herausgefunden, dass künstliche Intelligenzen bestimmte Wörter besonders häufig nutzen. Laut den Wissenschaftler:innen können KI-generierte Texte dadurch leichter erkannt werden.

2 Min.
Artikel merken
Anzeige
Anzeige

Oft ist es schwierig, einen KI-generierten Text zu erkennen. Doch laut Forscher:innen geben einige Wörter die Quelle preis. (Foto: Ascannio / Shutterstock)

KI-generierte Texte zu erkennen, ist nicht immer ganz einfach. Zwar gibt es künstliche Intelligenzen, bei denen die Texte ziemlich offensichtlich KI-generiert sind, doch es gibt auch KI-Tools, die ziemlich menschlich schreiben. Aber selbst diese Tools lassen sich laut einer Studie von Forscher:innen der Universität Tübingen und der Northwestern University in Illinois enttarnen. Denn sie nutzen einige Wörter häufiger als andere.

Anzeige
Anzeige

Diese Wörter verraten KI-Texte

Um herauszufinden, welche Wörter besonders häufig von künstlichen Intelligenzen genutzt werden, haben die Wissenschaftler:innen sämtliche Kurzreferate der Datenbank Pubmed heruntergeladen, die bis Ende Juni 2024 erschienen sind. Nun konnten die Wissenschaftler:innen die Anzahl jedes Wortes für das jeweilige Jahr feststellen. Das Ergebnis: Seit der weiten Verfügbarkeit von KI treten bestimmte Wörter deutlich häufiger auf – und lassen deshalb auf eine gemeinsame KI-Quelle schließen.

So trat das Wort „delves“ (zu Deutsch: erforschen, vertiefen) etwa 25-mal so häufig auf wie vor dem Beginn der KI-Ära. Die Wörter „showcasing“ (zu Deutsch: präsentieren) und „underscores“ (zu Deutsch: unterstreichen) kommen etwa neunmal häufiger vor, seitdem einige Referate auf KI-generierte Texte zurückgreifen. Neben diesen Wörtern gab es auch noch „potential“ (Potenzial), „findings“ (Ergebnisse) und „crucial“ (ausschlaggebend, bedeutend), die mehrere Prozentpunkte in ihrer Häufigkeit nach oben geschossen sind.

Anzeige
Anzeige

Die Forscher:innen sind sich bewusst, dass solche Änderungen auch an der natürlichen Evolution der Sprache liegen könnten. Um das zu widerlegen, haben sie sich andere rasante Wortanstiege angeschaut, die in den vergangenen Jahren vorgekommen sind. Das Ergebnis: Ähnliche Anstiege gab es nur durch gravierende Ereignisse wie die Corona-Pandemie zwischen 2020 und 2022 sowie Ebola-Ausbrüche im Jahr 2015 und das Zika-Virus im Jahr 2017.

Sämtliche Wörter, die von den Forscher:innen in ihrer Studie entdeckt wurden, lassen sich nicht auf solche globalen Events zurückführen. Aufgrund ihrer Forschung gehen die Wissenschaftler:innen davon aus, dass rund zehn Prozent der Kurzreferate nach 2022 mit der Hilfe von KI erstellt wurden – sei es komplett oder nur teilweise. Die Forscher:innen gehen davon aus, dass die Zahl der KI-generierten Texte sogar noch höher ist. Andere Wissenschaftler:innen könnten die Füllwörter der KI erkannt haben und diese vor der Veröffentlichung entfernen, um die KI-Nutzung zu verschleiern.

Anzeige
Anzeige

Wie Googles KI-Suche nach hinten losgegangen ist

Googles neue KI-Suche geht nach hinten los Quelle:
Fast fertig!

Bitte klicke auf den Link in der Bestätigungsmail, um deine Anmeldung abzuschließen.

Du willst noch weitere Infos zum Newsletter? Jetzt mehr erfahren

Anzeige
Anzeige
Kommentare

Community-Richtlinien

Bitte schalte deinen Adblocker für t3n.de aus!
Hallo und herzlich willkommen bei t3n!

Bitte schalte deinen Adblocker für t3n.de aus, um diesen Artikel zu lesen.

Wir sind ein unabhängiger Publisher mit einem Team von mehr als 75 fantastischen Menschen, aber ohne riesigen Konzern im Rücken. Banner und ähnliche Werbemittel sind für unsere Finanzierung sehr wichtig.

Schon jetzt und im Namen der gesamten t3n-Crew: vielen Dank für deine Unterstützung! 🙌

Deine t3n-Crew

Anleitung zur Deaktivierung
Artikel merken

Bitte melde dich an, um diesen Artikel in deiner persönlichen Merkliste auf t3n zu speichern.

Jetzt registrieren und merken

Du hast schon einen t3n-Account? Hier anmelden

oder
Auf Mastodon teilen

Gib die URL deiner Mastodon-Instanz ein, um den Artikel zu teilen.

Community-Richtlinien

Wir freuen uns über kontroverse Diskussionen, die gerne auch mal hitzig geführt werden dürfen. Beleidigende, grob anstößige, rassistische und strafrechtlich relevante Äußerungen und Beiträge tolerieren wir nicht. Bitte achte darauf, dass du keine Texte veröffentlichst, für die du keine ausdrückliche Erlaubnis des Urhebers hast. Ebenfalls nicht erlaubt ist der Missbrauch der Webangebote unter t3n.de als Werbeplattform. Die Nennung von Produktnamen, Herstellern, Dienstleistern und Websites ist nur dann zulässig, wenn damit nicht vorrangig der Zweck der Werbung verfolgt wird. Wir behalten uns vor, Beiträge, die diese Regeln verletzen, zu löschen und Accounts zeitweilig oder auf Dauer zu sperren.

Trotz all dieser notwendigen Regeln: Diskutiere kontrovers, sage anderen deine Meinung, trage mit weiterführenden Informationen zum Wissensaustausch bei, aber bleibe dabei fair und respektiere die Meinung anderer. Wir wünschen Dir viel Spaß mit den Webangeboten von t3n und freuen uns auf spannende Beiträge.

Dein t3n-Team

Kommentar abgeben

Melde dich an, um Kommentare schreiben und mit anderen Leser:innen und unseren Autor:innen diskutieren zu können.

Anmelden und kommentieren

Du hast noch keinen t3n-Account? Hier registrieren

Anzeige
Anzeige