Reddit feiert stylische QR-Codes mit Stable Diffusion – weil sie funktionieren
Im Reddit-Thread r/StableDiffusion teilte eine Person mit dem Nutzungsnamen u/nhciao eine Reihe von Bildern. Darauf waren QR-Codes zu sehen. Das Besondere daran ist: Es sind Bilder in verschiedenen Kunststilen; ein QR-Code beinhaltet eine Anime-Frau, wieder ein anderer mit Pinselstrichen gemalten Bambus. Das Verrückte dabei ist, dass sie funktionieren. Hinterlegt wurde dabei ein Link zu einem chinesischen QR-Code-Erstellungs-Tool.
Mit Stable Diffusion zu schicken QR-Codes
Im Reddit-Post selbst hat u/nhciao keine Details dazu genannt, wie die QR-Codes erstellt wurden. Allerdings wurde anhand von einem Blogpost und dem Titel des Posts klar: Es handelt sich hier um Controlnet, das Stable-Diffusion-Modell. Es wurden mehrere Controlnet-Modelle trainiert, die jeweils QR-Codes in verschiedenen Stilen generieren – beispielsweise traditionelle chinesische Muster, der Ukiyo-e-Stil oder ein zweidimensionaler Illustrationsstil, wozu auch Anime gehört. Dazu kommt Lora, kurz für Low-Rank Adaptation of Large Language Models, für die Feinanpassung.
Die generierten QR-Codes werden dann in Stable Diffusion eingespeist, wahrscheinlich mit einem schriftlichen Prompt – und Controlnet wird verwendet, damit die Datenpunkte des QR-Codes beibehalten werden, obwohl um sie herum ein Bild generiert wird.
Reddit-Reaktionen: Wo ist die Rickroll?
Die Menschen auf Reddit zeigen sich begeistert: Ja, sie sehen schön aus, aber dass die QR-Codes dabei funktionstüchtig bleiben, ist der eigentliche Clou.
Dabei überlegen sie sich bereits einige Use-Cases. So schreibt u/andzlatin: „Ich stelle mir Anzeigen oder Banner vor mit QR-Codes, die so flüssig und nahtlos eingebunden werden können. Das wäre unglaublich.“ Wichtig wäre nur, dass Menschen trotz des nahtlosen Einblendens auch erkennen, dass es sich um einen scanbaren QR-Code handelt. Eine weitere Person betont, dass das eine gute Möglichkeit sei, QR-Codes mehr an die eigene Marke anzupassen und das Corporate Design auch dort umzusetzen. Logos beispielsweise könnten so auch als QR-Codes umgesetzt werden.
Auf der anderen Seite fragt u/lakySK: „Gehört es nicht zur UX von QR-Codes, dass sie als solche erkennbar sind?“ Wieder andere versuchen, mit anderen Modellen ähnliche Workflows zu entwickeln.
Nur eine Person kritisiert: „Große Chance verpasst, uns alle zu rickrollen.“ Und u/MasterScrat fragt: „Okay, wer von uns wird noch vor Ende der Woche einen entsprechenden Dienst einrichten?“