Mit erkennbarer Begeisterung und Ehrfurcht twittert der Code-Künstler Kyle McDonald über die Ergebnisse neuer Forschung des Unternehmens OpenAI: „Beeindruckend. Die Verwendung von Machine Learning zum Generieren von Bildern aus Text … wird dank der neuesten @openai-Forschung noch viel unheimlicher.“
Dazu hängt er eine Galerie mit Screenshots an, die auf den ersten Blick unspektakulär wirken. Wenn wir uns indes klarmachen, wie sie entstanden sind, wird deutlich, wieso McDonald sie als „unheimlich“ bezeichnet.
KI leistet kreativen Prozess per Textbefehl
Die Bilder wurden nämlich von der KI geschaffen, nachdem sie per Texteingabe dazu aufgefordert wurde. So hat die KI aus dem Kommandozeilen-Input „ein Igel, der einen Taschenrechner nutzt“ das oberste linke Bild erstellt. Dabei könnte es sich noch um ein flugs herbei gegoogeltes Bild handeln.
Ergebnisse wie die „Roboter in Vipassana-Meditation“ oder das „surrealistische Ölbild einer Dame-spielenden Katze im Stil von Salvador Dáli“ zeigen indes, dass es sich tatsächlich um den kreativen Akt der Erschaffung von Bildern durch Algorithmen des maschinellen Lernens handelt.
Die Darstellungen stammen aus einer OpenAI-Studie, die am Montag auf dem Arxiv-Server der privaten Cornell University im US-Bundesstaat New York unter dem (übersetzten) Titel „Glide: Fotorealistische Bilderzeugung und -bearbeitung mit textgesteuerten Diffusionsmodellen“ erschienen ist.
Abgespecktes Open-Source-Modell auf GitHub veröffentlicht
Eine abgespeckte Version des Glide-KI-Modells hat OpenAI auf GitHub veröffentlicht. Mit diesem Modell konnte McDonald selbst experimentieren. Dabei hat er allerdings deutlich schlechtere Ergebnisse erzielt, wie das folgende Bild aus seinem Twitter-Account zeigt:
Im Twitter-Thread wird daher die Vermutung laut, die von OpenAI veröffentlichten Ergebnisse seien „stark kuratiert“, also einer intensiven Vorselektion unterzogen worden. Klar ist aber ebenso, dass das kleinere, rein filterbasierte KI-Modell nicht die gleichen Ergebnisse bringen kann. Die wahren Fähigkeiten werden derzeit wohl in der Mitte zwischen den beiden Bildergalerien liegen.
Das ist OpenAI
Das von Elon Musk mitbegründete Forschungslabor OpenAI ist vor allem durch sein weithin als bahnbrechend empfundenes KI-Sprachmodell GPT-3 bekannt geworden. Das wohl komplexeste Maschine-Learning-Sprachmodell am Markt hatte Microsoft, schon seit 2019 Großinvestor von OpenAI, exklusiv zur Integration in die eigene Produktpalette lizenziert. OpenAI setzt dabei voll auf die Azure Cloud.
Habt ihr nun Lust bekommen, ebenfalls ein wenig mit KI-Kunst zu experimentieren, könntet ihr euch einmal die für iOS und Android verfügbare App Dream by Wombo ansehen. Die Ergebnisse sind zwar etwas psychedelisch, aber machen durchaus Spaß.