Dall‑e zeigt euch jetzt, was außerhalb des Bildausschnitts berühmter Gemälde liegt
Der KI-Bildgenerator aus dem Hause Open AI beherrscht jetzt ein Feature, das die Entwickelnden als „Outpainting“ bezeichnen. Damit kann das Text-zu-Bild-KI-Modell Dall‑e Bilder generieren, die beliebige Bilder erweitern.
Dall-e entwickelt eigene Vorstellungen von Bildkontext
Im Kern „errät“ Dall‑e mit der Funktion, was sich möglicherweise außerhalb des gegebenen Rahmens eines Gemäldes oder eines anderen Bildes befinden könnte. Das obige Artikelbild etwa zeigt einen Vorschlag für den größeren Kontext rund um Jan Vermeers Porträt „Das Mädchen mit dem Perlenohrring“.
Dazu wurden textliche Anweisungen, die nach wie vor erforderlich sind, umgesetzt. Aber selbst mit den begrenzten Informationen aus den Textanweisungen in Kombination mit dem eigentlichen Porträt ist die KI in der Lage, Vermeers Stil nachzuahmen und sich eng an den Schatten und Lichtern des Originals zu orientieren.
Outpainting: Kaum Magie, dafür viel Arbeit
Mit algorithmischer Magie hat das Ergebnis indes nur wenig zu tun. In der folgenden Zeitrafferaufnahme zeigt der verantwortliche Künstler August Kamp seine Vorgehensweise.
So musste er das Bild sehr kleinschrittig erweitern und auch vorhandene Iterationen aus Dall‑e immer wieder überarbeiten, bis er das von ihm imaginierte Ergebnis erzielen konnte. Das Ergebnis ist also durchaus mehr der präzisen Beschreibung durch Kamp denn der KI allein zu verdanken.
Während beim Beispiel des Vermeer-Gemäldes „Outpainting“ als durchaus ernst zu nehmende Möglichkeit gesehen werden kann, den ursprünglichen Inhalt kreativ künstlerisch zu erweitern, haben sich andere Dall‑e-Nutzende mehr um den Spaßfaktor gekümmert.
So wollte einer offenbar wissen, wie das Umfeld der berühmten „Mona Lisa“ ausgesehen haben könnte. Das Ergebnis … erstaunt:
Dall‑e will sich von Wettbewerb absetzen
Mit der neuen Funktion hebt sich Dall‑e stärker von Wettbewerbern wie Midjourney und Stable Diffusion ab. Die können zwar prinzipiell ebenfalls für etwas outpaintingartiges verwendet werden. Das erfordert allerdings deutlich mehr Eingriffe als bei Dall‑e.
Open AIs Bild-KI scheint besonders mit Bedienkomfort punkten zu wollen. Dall‑e ist derzeit in einer auf etwas mehr als eine Million Nutzende begrenzten Betaversion verfügbar.
Betanutzende erhalten im ersten Monat 50 kostenlose generierte Bilder und danach jeden Monat 15 weitere. Zudem können 115 zusätzliche Bilder für 15 Dollar erworben werden.