Google stellt sein Tool zur Erkennung von KI-Texten als Open Source bereit: So könnt ihr es nutzen
KI-Texte von herkömmlichen Texten zu unterscheiden, ist in einigen Fällen recht schwierig. Um dieses Problem anzugehen, hat das Team von Google Deepmind schon vor einer Weile ein neues Wasserzeichen-Tool angekündigt. Dieses ist für das menschliche Auge komplett unsichtbar und lässt sich nur durch das Tool SynthID erkennen. Jetzt stellen die Verantwortlichen das Tool einer breiten Masse von Entwickler:innen zur Verfügung.
SynthID von Google Deepmind wird Open Source
Ab sofort steht der Code von SynthID als Open Source bereit, wie das Unternehmen auf X verraten hat. Das Tool sowie eine Anleitung, wie es installiert werden kann, finden sich auf dessen Github-Seite. Neben der Installationsanleitung gibt euch Google auch ein Tutorial an die Hand, wie Wasserzeichen in KI-Texten angelegt werden und wie ihr sie mit dem Tool schließlich wieder erkennen könnt.
Google Deepmind betont, dass die Open-Source-Bereitstellung einer ganzen Reihe von Entwickler:innen helfen soll, KI verantwortungsvoll zu bauen. João Gante, ein Machine-Learning-Ingenieur bei Hugging Face sagt gegenüber MIT Technology Review: „Mit besserem Zugang und der Möglichkeit die Fertigkeiten des Tools selbst zu erleben, glaube ich, dass Wasserzeichen der neue Standard werden – und uns dabei helfen, den schädlichen Gebrauch von Sprachmodellen aufzudecken.“
So funktioniert SynthID
SynthID bedient sich der Art und Weise, wie Sprachmodelle funktionieren. Anhand der eingegebenen Prompts reihen LLMs mehrere Tokens (Wörter oder ganze Sätze) aneinander. Jedes Token hat eine bestimmte Wahrscheinlichkeit. Als Beispiel führt Google Deepmind den Satz „Meine liebsten tropischen Früchte sind …“. Die KI soll das letzte Wort – genauer gesagt das Token – einsetzen.
Tokens wie „Banane“ und „Mango“ haben dabei eine bestimmte Wahrscheinlichkeit, als Antwort aufzutauchen. SynthID verändert diese Wahrscheinlichkeit etwas, sodass sich ein Muster erkennen lässt. So wählt die KI statt der höheren Wahrscheinlichkeit von „Guave plus Lychee“ eben „Mango und Banane“ als Antwort. Diese Veränderung ändert den Output nur marginal, aber die Anpassungen lassen sich gerade bei längeren Texten nachvollziehen und erkennen.