Bei dem KI-Modell Dall-E 2 handelt es sich um die neue Version des im Januar vorgestellten und unter KI-Enthusiasten begeistert aufgenommenen Modells Dall-E. Das hatte seinerzeit versprochen, Bilder aus textlichen Beschreibungen erstellen zu können. Das funktionierte bereits ganz okay, ist jetzt aber noch mal deutlich besser.
Dall-E 2: Höhere Auflösung, mehr Performance, realistischere Bilder
Denn mit Dall-E 2 verspricht OpenAI Bilder mit höherer Auflösung und geringerer Wartezeit beim Rendering. Zudem kann die neue Version der KI Bilder nun erstmals bearbeiten – etwa, um Objekte im Bild anders zu platzieren. Nicht nur die höhere Auflösung soll dazu führen, dass die neuen Bilder realistischer wirken. OpenAI erklärt:
„Dall-E 2 hat die Beziehung zwischen Bildern und dem zu ihrer Beschreibung verwendeten Text gelernt. Es verwendet einen Prozess namens Diffusion, der mit einem Muster aus zufälligen Punkten beginnt und dieses Muster allmählich in Richtung eines Bildes ändert, wenn es bestimmte Aspekte dieses Bildes erkennt.“
Zugang nur für Forschende
Wer jedoch hofft, mit dem Modell etwas herumspielen zu können, sieht sich getäuscht. OpenAI behält die Nutzung vorerst Forschenden vor. Normalsterbliche können sich online in eine Warteliste eintragen und um Zutritt bewerben. In der Zukunft soll es indes eine API-Schnittstelle geben, um die KI programmlogisch von extern ansteuern zu können. Wer unter welchen Konditionen dazu Zugang erhält, bleibt abzuwarten.
Falls euch der Name wundert. Bei dem handelt es sich um ein sogenanntes Kofferwort, das sich einerseits am Namen des Künstlers Salvador Dalí und andererseits am Titel des Pixar-Films Wall-E bedient. Wall-E ist im Film ein intelligenter Roboter, der die Erde aufräumen muss – zunächst.
Bis die Version freigeschalten ist, ist die die Technik schon wieder überholt.
Das Missbrauchtspotential ist zudem echt riesig.