
Mit erkennbarer Begeisterung und Ehrfurcht twittert der Code-Künstler Kyle McDonald über die Ergebnisse neuer Forschung des Unternehmens OpenAI: „Beeindruckend. Die Verwendung von Machine Learning zum Generieren von Bildern aus Text … wird dank der neuesten @openai-Forschung noch viel unheimlicher.“
Dazu hängt er eine Galerie mit Screenshots an, die auf den ersten Blick unspektakulär wirken. Wenn wir uns indes klarmachen, wie sie entstanden sind, wird deutlich, wieso McDonald sie als „unheimlich“ bezeichnet.
Die Bilder wurden nämlich von der KI geschaffen, nachdem sie per Texteingabe dazu aufgefordert wurde. So hat die KI aus dem Kommandozeilen-Input „ein Igel, der einen Taschenrechner nutzt“ das oberste linke Bild erstellt. Dabei könnte es sich noch um ein flugs herbei gegoogeltes Bild handeln.
Ergebnisse wie die „Roboter in Vipassana-Meditation“ oder das „surrealistische Ölbild einer Dame-spielenden Katze im Stil von Salvador Dáli“ zeigen indes, dass es sich tatsächlich um den kreativen Akt der Erschaffung von Bildern durch Algorithmen des maschinellen Lernens handelt.
Die Darstellungen stammen aus einer OpenAI-Studie, die am Montag auf dem Arxiv-Server der privaten Cornell University im US-Bundesstaat New York unter dem (übersetzten) Titel „Glide: Fotorealistische Bilderzeugung und -bearbeitung mit textgesteuerten Diffusionsmodellen“ erschienen ist.
Eine abgespeckte Version des Glide-KI-Modells hat OpenAI auf GitHub veröffentlicht. Mit diesem Modell konnte McDonald selbst experimentieren. Dabei hat er allerdings deutlich schlechtere Ergebnisse erzielt, wie das folgende Bild aus seinem Twitter-Account zeigt:

Kleineres Glide-Modell mit schwächeren Ergebnissen. (Bild: Kyle McDonald / Twitter)
Im Twitter-Thread wird daher die Vermutung laut, die von OpenAI veröffentlichten Ergebnisse seien „stark kuratiert“, also einer intensiven Vorselektion unterzogen worden. Klar ist aber ebenso, dass das kleinere, rein filterbasierte KI-Modell nicht die gleichen Ergebnisse bringen kann. Die wahren Fähigkeiten werden derzeit wohl in der Mitte zwischen den beiden Bildergalerien liegen.
Das von Elon Musk mitbegründete Forschungslabor OpenAI ist vor allem durch sein weithin als bahnbrechend empfundenes KI-Sprachmodell GPT-3 bekannt geworden. Das wohl komplexeste Maschine-Learning-Sprachmodell am Markt hatte Microsoft, schon seit 2019 Großinvestor von OpenAI, exklusiv zur Integration in die eigene Produktpalette lizenziert. OpenAI setzt dabei voll auf die Azure Cloud.
Habt ihr nun Lust bekommen, ebenfalls ein wenig mit KI-Kunst zu experimentieren, könntet ihr euch einmal die für iOS und Android verfügbare App Dream by Wombo ansehen. Die Ergebnisse sind zwar etwas psychedelisch, aber machen durchaus Spaß.
Bitte beachte unsere Community-Richtlinien
Wir freuen uns über kontroverse Diskussionen, die gerne auch mal hitzig geführt werden dürfen. Beleidigende, grob anstößige, rassistische und strafrechtlich relevante Äußerungen und Beiträge tolerieren wir nicht. Bitte achte darauf, dass du keine Texte veröffentlichst, für die du keine ausdrückliche Erlaubnis des Urhebers hast. Ebenfalls nicht erlaubt ist der Missbrauch der Webangebote unter t3n.de als Werbeplattform. Die Nennung von Produktnamen, Herstellern, Dienstleistern und Websites ist nur dann zulässig, wenn damit nicht vorrangig der Zweck der Werbung verfolgt wird. Wir behalten uns vor, Beiträge, die diese Regeln verletzen, zu löschen und Accounts zeitweilig oder auf Dauer zu sperren.
Trotz all dieser notwendigen Regeln: Diskutiere kontrovers, sage anderen deine Meinung, trage mit weiterführenden Informationen zum Wissensaustausch bei, aber bleibe dabei fair und respektiere die Meinung anderer. Wir wünschen Dir viel Spaß mit den Webangeboten von t3n und freuen uns auf spannende Beiträge.
Dein t3n-Team