Stable Diffusion: Warum KI-generierte Bilder bald wirklich überall sind

Analyse

Stable Diffusion: Warum KI-generierte Bilder bald wirklich überall sind

Eine KI, die nach Textvorgaben Bilder generiert: Dall-E hat das Konzept populär gemacht. Jetzt schickt sich jedoch Stable Diffusion an, dem Prinzip endgültig zum Durchbruch zu verhelfen.

Von Kim Rixecker

04.09.2022, 10:00 Uhr • 3 Min.

Stable Diffusion: Warum KI-generierte Bilder bald wirklich überall sind — Dieses Bild haben wir mit Stable Diffusion erstellt. (Grafik: Dreamstudio Beta)

Auf den ersten Blick macht das von dem Startup Stability.ai veröffentlichte KI-Modell Stable Diffusion das Gleiche, was auch schon Bildgeneratoren wie Dall-E, Midjourney, Nightcafe oder Pixelz machen. Nutzer:innen geben die Beschreibung eines Bildes ab, woraufhin die KI dieses Bild mehr oder weniger exakt wirklich werden lässt.

Stable Diffusion beherrscht aber noch einen weiteren Trick: Zusätzlich zur Bildbeschreibung in Textform kann der KI auch eine Vorlage in Bildform mitgegeben werden. Ihr könntet also quasi die grobe Bildkomposition skizzenhaft aufmalen und Stable Diffusion dann erklären, wie das fertige Bild aussehen soll. Aus einer kruden MS-Paint-Skizze entsteht so mit wenigen Klicks ein hyperrealistisches Gemälde. Aber auch dieses Feature ist am Ende nicht der Grund dafür, dass Stable Diffusion eine Revolution im Bereich digitaler Grafiken auslösen könnte.

Vorher/Nachher: Eine krude Zeichnung und ein bisschen Text reichen aus, um mit Stable Diffusion beeindruckende Bilder zu generieren. (Grafik: argaman123 / Reddit)

Denn im Unterschied zu bestehenden Lösungen hat Stability.ai das KI-Modell vollständig offengelegt. Die zugrundeliegende Lizenz erlaubt sogar den Einsatz von Stable Diffusion in kommerziellen Produkten. Diese Offenheit trägt schon jetzt erste Blüten und hat eine ganze Reihe von Entwickler:innen dazu inspiriert, die Technik für eigene Projekte zu verwenden.

Stable Diffusion: KI-Bildgenerator direkt in Photoshop nutzen

Wer möchte, kann Stable Diffusion im Web beispielsweise über das derzeit noch kostenfreie Web-Interface Dreamstudio von Stability.ai testen. Alternativ könnt ihr aber auch über die Cloud-Dienste Replicate und Hugging Face im Web mit dem Modell experimentieren.

Das Open-Source-Projekt stable-diffusion-webui wiederum baut ein Web-Interface, das ihr selbst hosten könnt. Ein:e Reddit-Nutzer:in hat derweil auch ein einfach zu installierendes grafisches Interface für Windows angekündigt. All das ist aber nur der Anfang.

Unter dem Namen Alpaca entsteht bereits ein Photoshop-Plugin, mit dem ihr direkt in dem beliebten Bildbearbeitungsprogramm Bilder mithilfe von Stable Diffusion generieren könnt. Ein auf Reddit veröffentlichtes Video zeigt bereits das enorme Potenzial, das sich für Designer aus Stable Diffusion ergeben könnte. Der Entwickler Nicolay Mausz entwickelt derweil ein entsprechendes Plugin für das quelloffene Zeichenprogramm Krita.

Alpaca: Das Photoshop-Plugin soll euch einen KI-Zeichner direkt in das Grafikprogramm holen. (Screenshot: getalpaca.io)

Obwohl Stable Diffusion erst am 22. August 2022 wirklich vollständig offengelegt wurde, gibt es darüber hinaus bereits eine ganze Reihe weiterer Projekte, die auf die zugrundeliegende Technik setzen. Damit könnte Stability.ai das Prinzip endgültig massentauglich gemacht haben – mit allen potenziellen Risiken.

Empfehlungen der Redaktion

News

Dall-E Mini: Diese KI kreiert faszinierende und zugleich gruselige Bilder

News

Bild-KI: Mit Dall-E 2 können Künstler bald Geld machen

News

Meta baut seine eigene Bild-KI, die nicht nur mit Texteingaben arbeitet

Stability.ai: Einhaltung rechtlicher und ethischer Normen obliegt den Nutzer:innen

Theoretisch ließe sich Stable Diffusion im Kontext von Fake News einsetzen. Ebenfalls denkbar wären Bilder mit rassistischen oder sonst wie diskriminierenden Inhalten. Die Stable-Diffusion-Lizenz untersagt zwar explizit den Einsatz des Modells für solche Zwecke, wirklich kontrollieren könnte Stability.ai das im Fall selbst-gehosteter Instanzen allerdings nicht.

Das kann der Bild-Generator:

Erstellt mit Stable Diffusion — Stable Diffusion: Das kann der Bildgenerator Quelle: Dreamstudio / t3n

Auch der Verstoß gegen im eigenen Land geltendes Recht untersagt die Lizenz. Wer aber Stable Diffusion gezielt für kriminelle Zwecke einsetzt, dem dürfte ein Lizenzverstoß herzlich egal sein.

Am Ende war es aber nun mal absehbar, dass die zugrundeliegende Technik irgendwann einer breiten Masse zugänglich gemacht wird. Wie bei allen technischen Innovationen bleibt es am Ende Aufgabe von Staat und Gesellschaft, mit potenziellen negativen Auswirkungen umzugehen.

Das rege Interesse von Entwickler:innen zeigt jedenfalls, dass das zugrundliegende Konzept noch viel Potenzial birgt, aus dem eine Vielzahl von spannenden Tools hervorgehen könnte.

Bildergalerie ansehen

Mehr zu diesem Thema

MIT Technology Review Photoshop Künstliche Intelligenz Stable Diffusion

Verpasse keine News zu Software & Entwicklung 💌

Hinweis zum Newsletter & Datenschutz

Fast fertig!

Bitte klicke auf den Link in der Bestätigungsmail, um deine Anmeldung abzuschließen.

Du willst noch weitere Infos zum Newsletter? Jetzt mehr erfahren