KI-Bilder ohne Plagiatsprobleme: Neues Framework soll großen Nachteil der Technik ausgleichen
KI-Bildgeneratoren werden in der Regel mit einem großen Datensatz, bestehend aus den unterschiedlichsten Bildern, trainiert. Viele dieser Bilder sind allerdings urheberrechtlich geschützt.
Das wird spätestens dann problematisch, wenn die KI diese Bilder einfach kopiert und die generierten Bilder genauso aussehen wie das Original oder ihm sehr ähnlich sind. Ein neues Framework namens Ambient Diffusion soll jetzt sicherstellen, dass KI-generierte Bilder die Trainingsdaten nicht einfach kopieren.
Dafür werden bis zu 90 Prozent der Originalbilder maskiert oder verzerrt, sodass die KI das komplette Originalbild gar nicht erst zu sehen bekommt.
Ambient Diffusion verhindert Plagiate
Anfangs haben die Forscher der University of California und des MIT einen Datensatz von 3.000 Bildern von Prominenten verwendet. Ohne die Verschleierung hat die KI diese Bilder auf Anfrage einfach kopiert.
Mit der Verschleierung allerdings hat die KI immer noch hochwertige Bilder generiert und menschliche Gesichter gelungen dargestellt. Die Bilder sahen jedoch deutlich anders aus als die Prominenten aus den Trainingsdaten.
Die Idee ist also, dass große Bildgeneratoren wie Dall‑E, Midjourney oder Stable Diffusion mit diesem Framework trainiert werden könnten. So können sie weiterhin hochwertige Ergebnisse liefern, ohne die Bilder aus den Trainingsdaten direkt zu kopieren.
Ambient Diffusion kann auch in der Forschung unterstützen
„Das Framework könnte sich auch für wissenschaftliche und medizinische Anwendungen als nützlich erweisen“, sagte Adam Klivans, Professor für Informatik, der an der Arbeit beteiligt war, Tech Xplore.
„Das gilt im Grunde für jede Forschung, bei der es teuer oder unmöglich ist, über einen vollständigen Satz unverfälschter Daten zu verfügen, von der Bildgebung von schwarzen Löchern bis hin zu bestimmten Arten von MRT-Scans.“
Ob das Framework wirklich in den großen Bildgeneratoren zum Einsatz kommen wird, wird sich zeigen müssen. Das Paper ist auf dem Preprint-Server Arxiv einsehbar.