Go, grab ’em all: Erschaffe mit Stable Diffusion deine eigenen Pokémon

Dieses Tool fällt eindeutig unter die Kategorie Spaß, denn einen seriösen Nutzen kann man „Text-to-Pokémon“ beim besten Willen nicht andichten. Dafür ist die Ausgabe des per Dialog zu steuernden Progrämmchens höchst unterhaltsam.
Zunächst benötigt ihr einen kostenlosen Github-Account. Denn ohne den lässt euch das Tool nicht an die Regler. Alles, was ihr dann noch tun müsst, ist, einen Namen oder eine sonstige Beschreibung in das als Prompt gekennzeichnete Feld einzugeben.
Nun könnt ihr noch wählen, wie viele Bilder generiert werden sollen. Das Maximum pro Durchlauf liegt bei vier Vorschlägen und bringt tatsächlich in der Regel völlig verschiedene Ergebnisse.
KI-Bastler Pinkney schlägt wieder zu
Dem Tool liegt ein KI-Modell von Justin Pinkney zugrunde. Pinkney ist Forscher für maschinelles Lernen und hat bereits eine ganze Reihe von visuellen KI-Tools entwickelt. Hinter dem Pokémon-Generator steckt der KI-Kunstgenerator und Dall‑e-Wettbewerber Stable Diffusion.

Humor hat das Tool auch: Ich wollte einen blinden Adler generieren. (Grafik: Text-to-Pokémon)
Der hat nämlich im Vergleich zum bereits genannten Dall-e und dem weiteren Wettbewerber Midjourney den Vorteil, dass er quelloffen und jedermann zugänglich ist. So konnte Pinkney der KI eine kleine Trainingsdatenbank mit Pokémon unterjubeln und den spaßigen Generator kreieren.
Auf Twitter hat Pinkney grob erläutert, wie er das Tool entwickelt hat.
„Stable Diffusion ist ein großartiges Generalistenmodell, aber es ist ziemlich knifflig, eine bestimmte Art von Output zu erhalten, es braucht normalerweise ein ernsthaftes Prompt-Engineering (in dem ich eine Niete bin)“, schreibt er. „Die Feinabstimmung des Modells selbst ist ein einfacher Ansatz, um sich auf genau das zu konzentrieren, was man will, wenn man einige Daten hat. Ich habe die Stable Diffusion an einem Pokémon-Datensatz feinabgestimmt.“

Bill Gates als Pokémon. (Bild: Text-to-Pokémon)
KI-Bildgeneratoren: Nicht per se harmlos
Während Anwendungsfälle wie der hier besprochene Pokémon-Generator zweifelsfrei eine lustige Nutzung der KI darstellen, darf indes nicht vergessen werden, dass es ebenso gute Gründe gibt, Bilder erzeugende KI nicht so frei zugänglich anzubieten.
Inzwischen ist die nämlich so gut, dass sie alle möglichen Darstellungen erzeugen kann. Nicht auszuschließen ist daher, dass sie genutzt wird, um gewalttätige und/oder sexuell eindeutige Bilder oder Fehlinformationen sowie pornografische Fakes zu erzeugen.