KI-Bildbearbeitung per Drag & Drop: Löst DragGAN bald Photoshop ab?
Dall-E, Midjourney und Stable Diffusion ermöglichen es, die absurdesten Bildideen schnell umzusetzen – was man früher mühsam mit Photoshop zusammengebastelt hätte, setzen die Tools in Sekundenschnelle um. Auch in der Bildbearbeitung leisten künstliche Intelligenzen schon länger gute Dienste. Allerdings stoßen sie doch an ihre Grenzen, wenn es beispielsweise darum geht, ein fotografiertes Objekt aus einer ganz anderen Perspektive zu zeigen oder einen Gesichtsausdruck zu ändern.
Das soll künftig jedoch ganz einfach per Drag & Drop mit ein paar Mausbewegungen möglich sein – jedenfalls stellen das Wissenschaftler:innen des Max-Planck-Instituts für Informatik, des Saarbrücken Research Center for Visual Computing, Interaction and Artificial Intelligence, des MIT und der Universität Pennsylvania in Aussicht.
Bildbearbeitung per Drag & Drop mit DragGAN
DragGAN heißt das Tool, das sie jetzt vorgestellt haben. Nutzer:innen sollen damit mit wenigen Klicks Pose, Form, Ausdruck und Layout von diversen Objekten wie Tieren, Autos, Menschen oder Landschaften verändern können. Dazu müssen sie nur die relevanten Punkte – wie zum Beispiel Mundwinkel – markieren und können dann über Drag & Drop die gewünschten Veränderungen vornehmen.
Auf der Website zu DragGAN haben die Wissenschaftler:innen erste Resultate veröffentlicht, die Photoshop-Hasser:innen durchaus hoffen lassen könnten.
Nichtsdestotrotz stößt auch DragGAN an Grenzen:
Selbst ausprobieren können Interessierte das Tool jedoch nicht – auch der Quellcode ist bisher nicht einsehbar. Er soll allerdings laut der GitHub-Seite des Projekts im Juni veröffentlicht werden.
Zu den Hardwareanforderungen von DragGAN ist ebenfalls nichts bekannt; ansonsten setzt das Projekt laut Paper auf Pytorch, eine Python-Bibliothek, die für maschinelles Lernen optimiert ist.