
Mit Stable Diffusion gibt es bereits einen quelloffene Bild-Generator, den Unternehmen und Einzelpersonen in ihre Apps und Dienste integrieren können, um aus Textvorgaben vollautomatisch realistische Bilder zu erzeugen. Ganz so weit geht Konkurrent OpenAI zwar nicht, mit der Offenlegung der Dall-E-API gibt es jetzt aber auch für diesen Bild-Generator eine einfache Möglichkeit, die Funktion in Apps zu integrieren.
Über die Programmierschnittstelle können Apps automatisiert Textvorgaben an Dall-E senden, der dann wiederum das fertige KI-generierte Bild zurückliefert. Damit wird die Integration von KI-Bildern enorm vereinfacht, weil im Gegensatz zu Stable Diffusion keine eigenen Cloud-Instanzen notwendig sind. Dafür will OpenAI allerdings auch Geld sehen.
Die Preise pro generiertem Bild variieren je nach Auflösung. In der höchsten der insgesamt drei Stufen kostet ein Bild 0,02 US-Dollar. Die Auflösung beträgt in dem Fall 1.024 x 1.024 Pixel. In der niedrigsten angebotenen Auflösung von 256 x 256 Pixeln fallen nur noch 0,016 Dollar an.
Dall-E-Zugriff per API: Was erlaubt ist – und was nicht
OpenAI verspricht API-Nutzer:innen die vollen Nutzungsrechte an den damit erzeugten Bildern. Auch der Verkauf damit erzeugter Bilder ist ausdrücklich gestattet. Allerdings sind nicht alle Arten von Bildern erlaubt.
Grundsätzlich verbietet OpenAI beispielsweise die Nutzung der Dall-E-Schnittstelle, wenn damit sexuelle oder gewalttätige Bilder erzeugt werden sollen. Auch Bilder, die diskriminierend sind, illegale Handlungen oder öffentliche Persönlichkeiten zeigen, sind nicht gestattet. Außerdem darf Dall-E nicht für Spam oder politische Inhalte genutzt werden.
Sollte jemand die Regeln brechen, kann die Person oder Organisation über das Help Center gemeldet werden. Außerdem sollen automatisierte Schutzmechanismen vorab dabei helfen, entsprechende Anfragen zu blockieren.
Dall-E dürfte als Cloud-Dienst deutlich besser in der Lage sein, Missbrauch der Technik zu verhindern, als die Open-Source-Alternative Stable Diffusion. Wie gut OpenAI am Ende aber wirklich bei der Kontrolle ist, wird sich noch zeigen müssen.
Bildergalerie: Dall-E „malt“ unsere Headlines
Microsoft und andere wollen Dall-E einsetzen
Während Dall-E die Türen für die unterschiedlichsten Apps und Dienste öffnet, nutzen einige Firmen die Bild-KI bereits oder planen entsprechende Lösungen. Microsoft will Dall-E beispielsweise in eine neue Grafikdesign-App namens Designer integrieren. Das Tool soll zur Generierung von Social-Media-Bildern, Einladungen oder anderen Grafiken genutzt werden können. Auch die Stockfoto-Website Shutterstock hat bereits angekündigt, zukünftig auch Dall-E einzusetzen.