Wurde mein Bild zum Training von KI-Modellen genutzt? Diese Website sagt es dir
Sie heißen Dall-E, Stable Diffusion oder Midjourney und machen im Grunde mehr oder weniger das Gleiche: Sie generieren aus Textvorgaben fertige Bilder. Damit das funktioniert, muss das zugrundeliegende KI-Modell mit Tausenden von Bildern und Fotos gefüttert werden. Das wirft nicht nur rechtliche und moralische Fragen auf, sondern eben auch die Frage, ob für das Training auch eigene Bilder verwendet wurden.
Genau diese Frage soll jetzt die Website Have I Been Trained beantworten. Über ein Suchfeld könnt ihr die Bilddatenbank LAION-5B durchsuchen. Die ist mit 5,85 Milliarden Bildern und dazugehörigen Beschreibungstexten einer der größten öffentlich verfügbaren Datensätze für das Training von Bild-KI.
Neben dem Suchfeld habt ihr außerdem die Möglichkeit, auch eigene Fotos hochzuladen, um basierend darauf Fotos von euch in dem Bilddatensatz zu finden. In unserem kurzen Test ließ Have I Been Trained aber noch einiges an Verbesserungspotenzial erkennen.
Suche nach Trainingsdaten für Bildgeneratoren hat ihre Schwächen
Prominente lassen sich über Have I Been Trained leicht im Datensatz aufspüren. Bei weniger bekannten Menschen wird es hingegen schon deutlich schwieriger. Selbst wenn das Foto einer Person eindeutig inklusive Namen im Datensatz erfasst ist, hat uns die Suche nach dem Namen nicht zu dem gewünschten Bild gebracht. Auf anderem Wege funktioniert es bisweilen aber schon.
Die Suche nach einem unserer Kollegen förderte zunächst Fotos von einer Reihe von Fußballprofis zutage. Darunter auch Nationaltorhüter Manuel Neuer, der – ohne einem von beiden zu nahe treten zu wollen – kaum Ähnlichkeit mit unserem Kollegen hat.
Gefunden haben wir unseren Kollegen dann aber doch noch. Und zwar indem wir sein aktuelles Profilbild bei Have I Been Trained hochgeladen haben. Auf die Art konnten wir dann zwischen Fotos anderer Herren auch ein älteres Bild von ihm finden.
Stable Diffusion: Der Bildgenerator im Einsatz
Fotograf:innen und Künstler:innen sollen die Wahl haben
Hinter Have I Been Trained steht ein Projekt namens Spawning. Die Macher:innen wollen Fotograf:innen und anderen Künstler:innen darüber die Möglichkeit geben, ihre Werke aus den Trainingsdaten für KI-Modelle herauszunehmen. Das entsprechende Tool befindet sich allerdings noch in der Beta-Phase. Außerdem bleibt unklar, wie eine Verweigerung der Künstler:innen an Firmen kommuniziert werden soll, die eigene nicht-öffentliche Trainingsdaten verwenden.
„Wir glauben, dass sowohl die KI-Forschungsgemeinschaft als auch die Künstlergemeinschaft davon profitieren werden, wenn das Training mit Einwilligung geschieht“, heißt es auf der Spawning-Website. Kritiker:innen dürften indes einwenden, dass die Ersteller:innen von Trainingsdaten vorab um Einwilligung bitten müssten.
Wie so oft bei technischen Umwälzungen dürfte es aber noch eine ganze Weile dauern, bis die ethischen und rechtlichen Fragen über die Nutzung fremder Inhalte als KI-Trainingsdaten zufriedenstellend geklärt sind. Bis dahin liefern Spwaning und Have I Been Trained immerhin einen ersten Lösungsansatz.