In 4 Minuten trainiert: Bild-KI von Nvidia passt auf eine Floppy Disk -

News

In 4 Minuten trainiert: Bild-KI von Nvidia passt auf eine Floppy Disk

Nvidia hat gemeinsam mit der Universität von Tel Aviv eine Bild-KI entwickelt, die in mehreren Bereichen leistungsstärker sein soll als Midjourney und Stable Diffusion. Dabei ist Perfusion ein echtes „Leichtgewicht“ und passt auf eine Floppy Disk.

Von Jörn Brien

02.08.2023, 12:28 Uhr • 1 Min.

Nvidia Bild-KI — Nvidia macht mit eigener Bild-KI Midjourney Konkurrenz. (Bild: Konstantin Savusia/Shutterstock)

Midjourney und Stable Diffusion gehören zu den beliebtesten Text-zu-Bild-Generatoren mit KI-Support. Ihre Ergebnisse sind teils spektakulär – man erinnere sich an den Papst in extravaganter weißer Jacke – und zeigen, wozu die Technologie in der Lage ist.

Leichtgewichtige Midjourney-Alternative

Jetzt macht sich Nvidia daran, eine „leichtgewichtige“ und einfache Alternative auf den Markt zu bringen, die den Branchenschwergewichten in nichts nachstehen soll. Besonderes Merkmal: Der Code der gemeinsam mit der Universität von Tel Aviv entwickelte Bild-KI Perfusion soll gerade einmal 100 Kilobyte umfassen.

Empfehlungen der Redaktion

Bildergalerie

Harry Potter hat Geburtstag: Bild-KI schmeißt Party in Hogwarts

Bildergalerie

Bild-KI: So würden Videospiel-Helden IRL aussehen

News

Open-Access-KI-Bildgenerator: Das kann Stable Diffusion XL 1.0

Damit würde das Tool locker auf eine Floppy Disk passen. Zudem verspricht Nvidia, dass sich die Bild-KI in nur vier Minuten trainieren lässt. Bei der Effizienz in bestimmten Bereichen soll Perfusion Midjourney und Stable Diffusion sogar übertreffen können.

Nvidias Bild-KI kommt mit Key-Locking

Eines der wichtigsten Merkmale von Nvidias neuer Bild-KI ist ein „Key-Locking“ genanntes Feature, wie Decrypt schreibt. Das ermöglicht es, dass von Nutzer:innen hinzugefügte spezifische Inhalte wie eine Katze während der Bildgenerierung mit einer allgemeineren Vorstellung von Katzen verknüpft werden.

Mit der Bild-KI Perfusion erstellter Cat-Content. (Bilder: Nvidia)

Dadurch soll die sogenannte Überanpassung verhindert werden. Dabei würde sich die Bild-KI zu sehr auf die genauen Trainingsbeispiele konzentrieren, was die Kreativität in Bezug auf die Erzeugung neuer Versionen hemmen würde.

Barbenheimer liegt im Trend Quelle: (Bild: Reddit)

Darüber hinaus soll Perfusion es beherrschen, ganz verschiedene personalisierte Konzepte mit natürlichen Interaktionen in einem einzelnen Bild zu kombinieren. Bisher bestehende Tools sollen sich dabei schwertun, weil sie mit isolierten Konzepten trainiert werden.

Nvidia: Perfusion-Code kommt bald

Bisher lässt sich Perfusion allerdings nicht ausprobieren, weil Nvidia zwar das entsprechende Forschungspapier, nicht aber den Code veröffentlicht hat. Die in dem Papier gezeigten Beispiele sehen aber schon recht vielversprechend aus.

Bildergalerie ansehen

Mehr zu diesem Thema

MIT Technology Review Künstliche Intelligenz Bild-KI Midjourney Stable Diffusion

Verpasse keine News zu Software & Entwicklung 💌

Hinweis zum Newsletter & Datenschutz

Fast fertig!

Bitte klicke auf den Link in der Bestätigungsmail, um deine Anmeldung abzuschließen.

Du willst noch weitere Infos zum Newsletter? Jetzt mehr erfahren

Brands

Themen

Magazine

Skills

In 4 Minuten trainiert: Bild-KI von Nvidia passt auf eine Floppy Disk

Leichtgewichtige Midjourney-Alternative

Nvidias Bild-KI kommt mit Key-Locking

Nvidia: Perfusion-Code kommt bald