Go, grab ’em all: Erschaffe mit Stable Diffusion deine eigenen Pokémon

Dieses Tool fällt eindeutig unter die Kategorie Spaß, denn einen seriösen Nutzen kann man „Text-to-Pokémon“ beim besten Willen nicht andichten. Dafür ist die Ausgabe des per Dialog zu steuernden Progrämmchens höchst unterhaltsam.
Zunächst benötigt ihr einen kostenlosen Github-Account. Denn ohne den lässt euch das Tool nicht an die Regler. Alles, was ihr dann noch tun müsst, ist, einen Namen oder eine sonstige Beschreibung in das als Prompt gekennzeichnete Feld einzugeben.
Nun könnt ihr noch wählen, wie viele Bilder generiert werden sollen. Das Maximum pro Durchlauf liegt bei vier Vorschlägen und bringt tatsächlich in der Regel völlig verschiedene Ergebnisse.
Dem Tool liegt ein KI-Modell von Justin Pinkney zugrunde. Pinkney ist Forscher für maschinelles Lernen und hat bereits eine ganze Reihe von visuellen KI-Tools entwickelt. Hinter dem Pokémon-Generator steckt der KI-Kunstgenerator und Dall‑e-Wettbewerber Stable Diffusion.

Humor hat das Tool auch: Ich wollte einen blinden Adler generieren. (Grafik: Text-to-Pokémon)
Der hat nämlich im Vergleich zum bereits genannten Dall-e und dem weiteren Wettbewerber Midjourney den Vorteil, dass er quelloffen und jedermann zugänglich ist. So konnte Pinkney der KI eine kleine Trainingsdatenbank mit Pokémon unterjubeln und den spaßigen Generator kreieren.
Auf Twitter hat Pinkney grob erläutert, wie er das Tool entwickelt hat.
„Stable Diffusion ist ein großartiges Generalistenmodell, aber es ist ziemlich knifflig, eine bestimmte Art von Output zu erhalten, es braucht normalerweise ein ernsthaftes Prompt-Engineering (in dem ich eine Niete bin)“, schreibt er. „Die Feinabstimmung des Modells selbst ist ein einfacher Ansatz, um sich auf genau das zu konzentrieren, was man will, wenn man einige Daten hat. Ich habe die Stable Diffusion an einem Pokémon-Datensatz feinabgestimmt.“

Bill Gates als Pokémon. (Bild: Text-to-Pokémon)
Während Anwendungsfälle wie der hier besprochene Pokémon-Generator zweifelsfrei eine lustige Nutzung der KI darstellen, darf indes nicht vergessen werden, dass es ebenso gute Gründe gibt, Bilder erzeugende KI nicht so frei zugänglich anzubieten.
Inzwischen ist die nämlich so gut, dass sie alle möglichen Darstellungen erzeugen kann. Nicht auszuschließen ist daher, dass sie genutzt wird, um gewalttätige und/oder sexuell eindeutige Bilder oder Fehlinformationen sowie pornografische Fakes zu erzeugen.
Bitte beachte unsere Community-Richtlinien
Wir freuen uns über kontroverse Diskussionen, die gerne auch mal hitzig geführt werden dürfen. Beleidigende, grob anstößige, rassistische und strafrechtlich relevante Äußerungen und Beiträge tolerieren wir nicht. Bitte achte darauf, dass du keine Texte veröffentlichst, für die du keine ausdrückliche Erlaubnis des Urhebers hast. Ebenfalls nicht erlaubt ist der Missbrauch der Webangebote unter t3n.de als Werbeplattform. Die Nennung von Produktnamen, Herstellern, Dienstleistern und Websites ist nur dann zulässig, wenn damit nicht vorrangig der Zweck der Werbung verfolgt wird. Wir behalten uns vor, Beiträge, die diese Regeln verletzen, zu löschen und Accounts zeitweilig oder auf Dauer zu sperren.
Trotz all dieser notwendigen Regeln: Diskutiere kontrovers, sage anderen deine Meinung, trage mit weiterführenden Informationen zum Wissensaustausch bei, aber bleibe dabei fair und respektiere die Meinung anderer. Wir wünschen Dir viel Spaß mit den Webangeboten von t3n und freuen uns auf spannende Beiträge.
Dein t3n-Team