Anzeige
Anzeige
Ratgeber

Midjourney, Dall-E, Stable Diffusion: Was ist der beste KI-Bildgenerator?

It’s magic: Eine kurze Bildbeschreibung und schon zaubert euch eine KI ein fertiges Bild. Aber welcher Bildgenerator eignet sich für wen? Wir vergleichen für euch die drei wichtigsten Anbieter.

5 Min.
Artikel merken
Anzeige
Anzeige
Welcher KI-Bildgenerator ist der beste? (Bild: Midjourney / t3n)

Ob auf den sozialen Medien oder in der Presse: KI-generierte Bilder begegnen uns mittlerweile überall. Das ist auch verständlich, denn dank entsprechender Tools reicht eine simple Texteingabe, um innerhalb von Sekunden ein passendes Bild zu erhalten. Und dabei ist es egal, ob es fotorealistisch oder in einem x-beliebigen anderen Stil gehalten sein soll.

Anzeige
Anzeige

Wer Bilder mithilfe einer KI erstellen will, der hat heute die Wahl aus einer ganzen Reihe an KI-Modellen und Plattformen. Um euch die Auswahl eines geeigneten Tools zu erleichtern, stellen wir euch im Folgenden die drei wichtigsten Anbieter vor und erläutern die jeweiligen Vor- und Nachteile.

Wie funktioniert eine Bild-KI?

Aus Nutzersicht funktionieren Bildgeneratoren denkbar einfach: Ihr beschreibt, was ihr gerne sehen möchtet, und die KI liefert euch ein passendes Bild. Dabei könnt ihr beispielsweise auch einen bestimmten Zeichenstil wählen, die Farben festlegen oder auch eine Aufnahme durch einen spezifischen Kameratyp nachahmen lassen.

Anzeige
Anzeige

Technisch betrachtet ist der Prozess hingegen deutlich komplexer. Grundsätzlich gibt es mehrere Methoden, um Bilder mithilfe einer KI zu erzeugen. Am weitesten verbreitet sind mittlerweile aber sogenannte Diffusionsmodelle. Dabei wird einem künstlichen neuronalen Netzwerk beigebracht, wie es Bildrauschen von Bildern entfernt. Dieser Prozess wird nach dem Training quasi umgedreht und das Diffusionsmodell kann dann aus zufällig generiertem Rauschen ein neues Bild erzeugen.

Was ist der beste KI-Bildgenerator?

Grundsätzlich könnt ihr mit Dall-E 3, Midjourney und Stable Diffusion XL überzeugende Bilder in den verschiedensten Stilen generieren. Ein direkter Vergleich der Bildqualität fällt daher schwer. In manchen Fällen versteht eines der KI-Modelle bestimmte Prompts besser als die anderen. Beispielsweise wollte nur Dall-E einen Ballon-Hund auch wirklich als einen aus Ballons geknoteten Hund darstellen. Am Ende können einzelne Prompts aber kaum als Entscheidungskriterium herangezogen werden.

Anzeige
Anzeige

Selber Prompt, drei unterschiedliche KI-Interpretationen. (Bild v.l.n.r.: Stable Diffusion, Midjourney, Dall-E)

Im redaktionellen Alltag hat uns Midjourney überzeugt. Abhängig vom eigenen Nutzungsverhalten könnte aber auch Dall-E 3 eine gute Wahl sein. Denn wer bereits für ChatGPT Plus bezahlt, der kann den Bildgenerator ohne zusätzliche Kosten einsetzen. Alternativ dazu gibt euch Microsoft kostenfreien Zugriff auf Dall-E 3 über den Bing Image Creator – dabei gibt es aber gewisse Einschränkungen. Stable Diffusion XL wiederum überzeugt durch eine große Anzahl an zusätzlichen Features.

Dall-E 3, Midjourney und Clipdrop im Überblick

Dall-E 3: Das kann der Bildgenerator von OpenAI

Das Vorgängermodell Dall-E 2 hat maßgeblich dazu beigetragen, die Produktkategorie überhaupt erst populär zu machen. Erstmals konnten Nutzer:innen qualitativ überzeugende Bilder anhand von Texteingaben erzeugen. Qualitativ wurde das KI-Modell in der Folgezeit aber deutlich von einigen Konkurrenten überholt. Erst mit der Einführung von Dall-E 3 im August 2023 spielt OpenAI auch wieder an der Spitze mit.

Anzeige
Anzeige

Derzeit gibt es zwei Möglichkeiten, Dall-E 3 zu verwenden. Bei der ersten könnt ihr direkt aus ChatGPT heraus Bilder erzeugen. Allerdings geht das nur, wenn ihr ein kostenpflichtiges ChatGPT-Plus-Abonnement habt. Das schlägt mit 20 US-Dollar pro Monat zu Buche. Zusätzlich zur priorisierten Nutzung von OpenAIs Chatbot könnt ihr damit täglich bis zu 50 Bilder von Dall-E 3 generieren lassen.

KI-Bildgeneratoren: Midjourney ist links, Dall-E 3 ist rechts. (Bild: Midjourney / Dall-E)

Das Angebot lohnt sich nur dann, wenn ihr auch ChatGPT regelmäßig nutzt. Denn zum einen sind Midjourney und Stable Diffusion günstiger zu haben, und zum anderen könnt ihr Dall-E 3 auch kostenfrei über Microsofts Suchmaschine Bing nutzen.

Wenn ihr Dall-E 3 über Bing verwendet, müsst ihr allerdings leider gewisse Einschränkungen in Kauf nehmen. Für jeden Prompt erzeugt euch der Bing Image Creator vier Bildvarianten. Dafür wird euch jeweils ein sogenannter „Boost“ abgezogen. Das sind Punkte, von denen ihr pro Woche maximal 15 erhaltet. Wenn alle aufgebraucht sind, könnt ihr zwar weiterhin Bilder generieren, das dauert dann aber mitunter deutlich länger.

Anzeige
Anzeige

Der Umweg über Bing lohnt sich daher vor allem dann, wenn ihr nur eine überschaubare Anzahl an Bildern per KI generieren wollt.

Midjourney: Extrem gute Bild-KI mit gewissen Usability-Nachteilen

Midjourney liefert unserem – zugegebenermaßen subjektivem – Eindruck nach konsistent die besten Ergebnisse aller Anbieter. Allerdings hat das Tool aus Nutzungssicht einen erheblichen Nachteil: Im Gegensatz zur Konkurrenz verfügt Midjourney über kein eigenes Web-Interface. Vielmehr erfolgt der Zugriff über den Chat-Dienst Discord. Dort könnt ihr über den Befehl /imagine eure Bildvorstellung an Midjourney übermitteln und erhaltet dann jeweils vier Bildvarianten.

Anschließend könnt ihr eine Variante wählen und dann beispielsweise „herauszoomen“, was bedeutet, dass Midjourney das Ursprungsbild an den Rändern erweitert. Auch hier erhaltet ihr wieder vier Auswahlmöglichkeiten. Außerdem könnt ihr gezielt Bildbereiche markieren und mit einem neuen Prompt weiter verändern.

Anzeige
Anzeige

Die Bedienung in Discord geht grundsätzlich schnell von der Hand. Nutzer:innenfreundlich ist das Ganze aber nicht wirklich. Immerhin arbeitet Midjourney an einem eigenen Web-Interface. Darüber könnt ihr derzeit aber noch keine eigenen Bilder generieren.

Bildergalerie: Midjourney verwandelt Harry-Potter-Charaktere in Wes-Anderson-Ikonen

Midjourney verwandelt „Harry Potter“-Charaktere in Wes-Anderson-Ikonen Quelle:

Auch das Preismodell von Midjourney ist relativ kompliziert. Los geht es mit dem Basic-Plan für 10 Dollar monatlich oder 96 Dollar jährlich. Bei dem Plan seid ihr auf 3,3 Rechenstunden pro Monat begrenzt. Für 30 Dollar pro Monat oder 288 Dollar pro Jahr erhöht sich die für die Bildberechnung notwendige GPU-Zeit auf 15 Stunden.

Beide Pläne bringen euch aber nichts, wenn ihr ein Unternehmen mit mehr als einer Million Dollar Jahresumsatz seid. Denn dann dürft ihr mit den beiden Plänen erstellte Bilde laut Nutzungsrichtlinien des Anbieters nicht verwenden. Das geht nur, wenn ihr den Pro- oder den Mega-Plan abschließt. Die Kosten dafür beginnen bei 48 Dollar im Monat.

Anzeige
Anzeige

Stable Diffusion XL mit Clipdrop nutzen

Stable Diffusion XL ist die aktuelle Variante der wohl bekanntesten quelloffenen Bild-KI. Weil das Modell unter einer Open-Source-Lizenz steht, könnt ihr es auch selbst hosten, lokal auf eurem Rechner einsetzen oder einen der vielen kommerziellen Web-Anbieter nutzen, um damit Bilder zu generieren. Um einen besseren Vergleich mit den vorangegangenen Anbietern zu gewährleisten, wollen wir uns aber vor allem Clipdrop anschauen.

Unter dem Namen Clipdrop bieten die Stable-Diffusion-Entwickler von Stability AI eine kostenpflichtige Web-App für die Nutzung der Bild-KI an. Dort könnt ihr nicht nur Bilder erzeugen, sondern auch verschiedene KI-Tools für die Bildbearbeitung nutzen. Das Angebot umfasst vergleichsweise simple Tools, die beispielsweise ein Objekt freistellen oder die Auflösung verlustfrei erhöhen können. Aber es gibt auch ein paar komplexere Features.

Bei Stable Diffusion gibt es neben dem eigentlichen Prompt, in dem ihr das gewünschte Bild beschreib, auch den sogenannten Negativ-Prompt. Hier legt ihr fest, was auf dem Bild nicht zu sehen sein soll. So sollt ihr genauer definieren können, was ihr eigentlich sehen wollt.

Anzeige
Anzeige

Je nach gewünschtem Endergebnis ist auch die Stable-Doodle-Funktion enorm hilfreich. Hier legt ihr eurem Prompt eine kleine Skizze bei. Die muss nicht sonderlich gut gezeichnet sein. In Kombination mit dem richtigen Punkt werden hier aus ein paar Rechtecken schnell eine Skyline. Grundsätzlich habt ihr durch die Funktion eine Möglichkeit, um die Bildkomposition selbst zu bestimmen.

Clipdrop bietet ein aufgeräumtes Interface und auch bei den Preisen folgt Stability AI einem einfachen Prinzip: Sämtliche Funktionen kosten euch bei monatlicher Zahlweise 13 Dollar pro Monat. Bei Abschluss eines Jahresvertrag sinkt der Betrag auf monatlich 9 Dollar.

Bildergalerie: Midjourney feiert Hogwarts-Party

Midjourney feiert Hogwarts-Party Quelle: LateNightCoffeeShop/ Reddit
Fast fertig!

Bitte klicke auf den Link in der Bestätigungsmail, um deine Anmeldung abzuschließen.

Du willst noch weitere Infos zum Newsletter? Jetzt mehr erfahren

Anzeige
Anzeige
Schreib den ersten Kommentar!
Bitte beachte unsere Community-Richtlinien

Wir freuen uns über kontroverse Diskussionen, die gerne auch mal hitzig geführt werden dürfen. Beleidigende, grob anstößige, rassistische und strafrechtlich relevante Äußerungen und Beiträge tolerieren wir nicht. Bitte achte darauf, dass du keine Texte veröffentlichst, für die du keine ausdrückliche Erlaubnis des Urhebers hast. Ebenfalls nicht erlaubt ist der Missbrauch der Webangebote unter t3n.de als Werbeplattform. Die Nennung von Produktnamen, Herstellern, Dienstleistern und Websites ist nur dann zulässig, wenn damit nicht vorrangig der Zweck der Werbung verfolgt wird. Wir behalten uns vor, Beiträge, die diese Regeln verletzen, zu löschen und Accounts zeitweilig oder auf Dauer zu sperren.

Trotz all dieser notwendigen Regeln: Diskutiere kontrovers, sage anderen deine Meinung, trage mit weiterführenden Informationen zum Wissensaustausch bei, aber bleibe dabei fair und respektiere die Meinung anderer. Wir wünschen Dir viel Spaß mit den Webangeboten von t3n und freuen uns auf spannende Beiträge.

Dein t3n-Team

Melde dich mit deinem t3n Account an oder fülle die unteren Felder aus.

Bitte schalte deinen Adblocker für t3n.de aus!
Hallo und herzlich willkommen bei t3n!

Bitte schalte deinen Adblocker für t3n.de aus, um diesen Artikel zu lesen.

Wir sind ein unabhängiger Publisher mit einem Team von mehr als 75 fantastischen Menschen, aber ohne riesigen Konzern im Rücken. Banner und ähnliche Werbemittel sind für unsere Finanzierung sehr wichtig.

Schon jetzt und im Namen der gesamten t3n-Crew: vielen Dank für deine Unterstützung! 🙌

Deine t3n-Crew

Anleitung zur Deaktivierung
Artikel merken

Bitte melde dich an, um diesen Artikel in deiner persönlichen Merkliste auf t3n zu speichern.

Jetzt registrieren und merken

Du hast schon einen t3n-Account? Hier anmelden

oder
Auf Mastodon teilen

Gib die URL deiner Mastodon-Instanz ein, um den Artikel zu teilen.

Anzeige
Anzeige