Fotorealistische Bilder in 90 Millisekunden: Wie diese Bild-KI an der Konkurrenz vorbeizieht -

News

Fotorealistische Bilder in 90 Millisekunden: Wie diese Bild-KI an der Konkurrenz vorbeizieht

KI-Modelle wie Stable Diffusion liefern teilweise beeindruckende Bilder. Eine neue Methode soll diesen Prozess jetzt aber deutlich beschleunigen – daraus ergeben sich ganz neue Potenziale.

Von Kim Rixecker

26.03.2024, 15:45 Uhr • 2 Min.

Fotorealistische Bilder in 90 Millisekunden: Wie diese Bild-KI an der Konkurrenz vorbeizieht — Neue Bild-KI von MIT-Forschern erzeugt extrem schnell Bilder. (Symbolbild: Midjourney / t3n)

Ein Team von Forschern des Massachusetts Institute of Technology (MIT) und Adobe hat einen KI-Bildgenerator entwickelt, der Bilder in einer mit Stable Diffusion 1.5 vergleichbaren Qualität erzeugen soll, dabei aber 30-mal so schnell ist.

Auf Basis dieser Technik können Bilder nahezu in Echtzeit generiert werden. Das eröffnet einige interessante Möglichkeiten. Laut dem Paper der Wissenschaftler kann das Modell bereits bis zu 20 Bilder pro Sekunde erzeugen. Zum Vergleich: Kinofilme haben üblicherweise eine Bildrate von 24 Bildern pro Sekunde.

So funktioniert die pfeilschnelle Bild-KI

Diffusionsmodelle wie Stable Diffusion funktionieren vereinfacht ausgedrückt so: Einem klaren Bild wird beim Training nach und nach visuelles Rauschen zugesetzt, bis es völlig unkenntlich gemacht wurde. Anhand dieses Trainings lernt das Diffusionsmodell, diesen Prozess in umgekehrter Richtung auszuführen und macht so aus Bildrauschen jedes gewünschte Bild.

Empfehlungen der Redaktion

Ratgeber

Midjourney, Dall-E, Stable Diffusion: Was ist der beste KI-Bildgenerator?

News

Air Head: OpenAIs Sora erschafft Kurzfilm – und zeigt, wie KI die Filmbranche verändern könnte

News

Zwei Drittel aller Games entstehen mit KI: Wie künstliche Intelligenz bei der Entwicklung hilft

Dieser Prozess verläuft über mehrere Schritte, um am Ende ein möglichst realistisches Bild zu erzeugen. All diese Schritte kosten jedoch Zeit und nicht zuletzt auch Rechenkapazität. Genau da setzt das Team vom MIT jetzt an.

Ihr Bildgenerator wurde zum einen an echten Bildern trainiert, zum anderen aber auch an den Bildern, die von der KI wieder „entrauscht“ wurden. Anschließend wird die Differenz aus beidem dafür genutzt, das erzeugte Bild mehr wie das Original aussehen zu lassen. So sollen überzeugende Ergebnisse in deutlich weniger Zeit entstehen.

Die Vorteile einer immer schnelleren Bild-KI

Wenn sich realistische Bilder mit KI in Echtzeit erstellen ließen, würde das eine ganze Reihe von neuen Möglichkeiten eröffnen. Erst kürzlich hatte beispielsweise Nvidia-CEO Jensen Huang prognostiziert, dass wir in fünf bis zehn Jahren vollständig KI-generierte Spielszenen sehen werden.

Ob das so kommt, bleibt abzusehen. Das Potenzial ist aber klar: Wenn Videospiele in Echtzeit Bildern fotorealistische Bilder erzeugen könnten, wie es jetzt bereits OpenAIs Video-KI Sora kann, dann würde das den Realitätsgrad dieser Spiele noch einmal deutlich erhöhen, und es gäbe kaum mehr einen Unterschied zwischen Spielfilmen und Video-Games.

Sora: Das sind die besten Clips von OpenAIs Video-KI

Bildergalerie ansehen

Mehr zu diesem Thema

MIT Technology Review Künstliche Intelligenz Bild-KI Stable Diffusion

Verpasse keine News zu Software & Entwicklung 💌

Hinweis zum Newsletter & Datenschutz

Fast fertig!

Bitte klicke auf den Link in der Bestätigungsmail, um deine Anmeldung abzuschließen.

Du willst noch weitere Infos zum Newsletter? Jetzt mehr erfahren

Brands

Themen

Magazine

Skills

Fotorealistische Bilder in 90 Millisekunden: Wie diese Bild-KI an der Konkurrenz vorbeizieht

So funktioniert die pfeilschnelle Bild-KI

Die Vorteile einer immer schnelleren Bild-KI

Sora: Das sind die besten Clips von OpenAIs Video-KI