In 4 Minuten trainiert: Bild-KI von Nvidia passt auf eine Floppy Disk

Nvidia macht mit eigener Bild-KI Midjourney Konkurrenz. (Bild: Konstantin Savusia/Shutterstock)
Midjourney und Stable Diffusion gehören zu den beliebtesten Text-zu-Bild-Generatoren mit KI-Support. Ihre Ergebnisse sind teils spektakulär – man erinnere sich an den Papst in extravaganter weißer Jacke – und zeigen, wozu die Technologie in der Lage ist.
Jetzt macht sich Nvidia daran, eine „leichtgewichtige“ und einfache Alternative auf den Markt zu bringen, die den Branchenschwergewichten in nichts nachstehen soll. Besonderes Merkmal: Der Code der gemeinsam mit der Universität von Tel Aviv entwickelte Bild-KI Perfusion soll gerade einmal 100 Kilobyte umfassen.
Damit würde das Tool locker auf eine Floppy Disk passen. Zudem verspricht Nvidia, dass sich die Bild-KI in nur vier Minuten trainieren lässt. Bei der Effizienz in bestimmten Bereichen soll Perfusion Midjourney und Stable Diffusion sogar übertreffen können.
Eines der wichtigsten Merkmale von Nvidias neuer Bild-KI ist ein „Key-Locking“ genanntes Feature, wie Decrypt schreibt. Das ermöglicht es, dass von Nutzer:innen hinzugefügte spezifische Inhalte wie eine Katze während der Bildgenerierung mit einer allgemeineren Vorstellung von Katzen verknüpft werden.

Mit der Bild-KI Perfusion erstellter Cat-Content. (Bilder: Nvidia)
Dadurch soll die sogenannte Überanpassung verhindert werden. Dabei würde sich die Bild-KI zu sehr auf die genauen Trainingsbeispiele konzentrieren, was die Kreativität in Bezug auf die Erzeugung neuer Versionen hemmen würde.
Darüber hinaus soll Perfusion es beherrschen, ganz verschiedene personalisierte Konzepte mit natürlichen Interaktionen in einem einzelnen Bild zu kombinieren. Bisher bestehende Tools sollen sich dabei schwertun, weil sie mit isolierten Konzepten trainiert werden.
Bisher lässt sich Perfusion allerdings nicht ausprobieren, weil Nvidia zwar das entsprechende Forschungspapier, nicht aber den Code veröffentlicht hat. Die in dem Papier gezeigten Beispiele sehen aber schon recht vielversprechend aus.
Bitte beachte unsere Community-Richtlinien
Wir freuen uns über kontroverse Diskussionen, die gerne auch mal hitzig geführt werden dürfen. Beleidigende, grob anstößige, rassistische und strafrechtlich relevante Äußerungen und Beiträge tolerieren wir nicht. Bitte achte darauf, dass du keine Texte veröffentlichst, für die du keine ausdrückliche Erlaubnis des Urhebers hast. Ebenfalls nicht erlaubt ist der Missbrauch der Webangebote unter t3n.de als Werbeplattform. Die Nennung von Produktnamen, Herstellern, Dienstleistern und Websites ist nur dann zulässig, wenn damit nicht vorrangig der Zweck der Werbung verfolgt wird. Wir behalten uns vor, Beiträge, die diese Regeln verletzen, zu löschen und Accounts zeitweilig oder auf Dauer zu sperren.
Trotz all dieser notwendigen Regeln: Diskutiere kontrovers, sage anderen deine Meinung, trage mit weiterführenden Informationen zum Wissensaustausch bei, aber bleibe dabei fair und respektiere die Meinung anderer. Wir wünschen Dir viel Spaß mit den Webangeboten von t3n und freuen uns auf spannende Beiträge.
Dein t3n-Team