Stable Diffusion für Videos: Das kann das neue KI-Modell von Stability AI

News

Stable Diffusion für Videos: Das kann das neue KI-Modell von Stability AI

Eine kurze Szenenbeschreibung und schon generiert euch eine KI ein fertiges Video. Das neue KI-Modell von Stability AI macht das möglich. Ganz perfekt sind die Ergebnisse aber noch nicht.

Von Kim Rixecker

22.11.2023, 13:30 Uhr • 2 Min.

Stable Diffusion für Videos: Das kann das neue KI-Modell von Stability AI — Ersetzt KI bald die Filmkamera? (Foto: Skreidzeleu / Shutterstock.com)

Stability AI, eines der Startups hinter der quelloffenen Bild-KI Stable Diffusion, hat ein KI-Modell für die Erstellung kurzer Videoclips vorgestellt. Das Stable Video Diffusion getaufte Modell funktioniert im Grunde wie sein auf statische Bilder ausgelegter Vorgänger: Ihr gebt eine Bildbeschreibung ein und die KI erzeugt euch daraus einen fertigen Videoclip.

Stability AI bleibt seiner bisherigen Vorgehensweise treu und macht auch für Stable Video Diffusion den Code und die für die Ausführung notwendigen Modellgewichte frei zugänglich. Damit unterscheidet sich das Startup deutlich von OpenAI und anderen KI-Anbietern, die ihre Forschungsergebnisse zunehmend für sich behalten.

Stable Video Diffusion: Das kann die Video-KI – und das nicht

Stability AI weist auf der Code-Plattform GitHub darauf hin, dass Stable Video Diffusion in seiner jetzigen Form nur zu Forschungszwecken und nicht für den kommerziellen Einsatz gedacht sei. Tatsächlich gibt es bei der Nutzung noch einige technische Einschränkungen.

Von Stable Video Diffusion gibt es zwei Modelle, die jeweils Video-Clips mit Bildrate von 14 beziehungsweise 25 Bildern pro Sekunde erzeugen. Die Auflösung liegt bei 576 zu 1.024 Pixeln. Doch es gibt noch weitere Einschränkungen.

Empfehlungen der Redaktion

News

Stell dir vor, du hast einen Videocall mit deinem Chef – aber er ist es gar nicht

News

Lebensechte KI-Videos: Sogar Experten können den Unterschied nicht mehr sehen

News

Neue KI-Technologie lernt von Video, Audio und Text für Google-ähnliche Suche

Mit Stable Video Diffusion erzeugte Videos sind kürzer als vier Sekunden. Außerdem erreicht das Modell nach Angaben der Macher:innen keinen perfekten Fotorealismus. Darüber hinaus kann es passieren, dass Stable Video Diffusion Videos ohne jedwede Bewegung erzeugt. Auch lesbaren Text kann das KI-Modell derzeit nicht erzeugen.

Wie schlägt sich Stable Video Diffusion im Vergleich zur Konkurrenz?

Stability AI ist längst nicht das einzige Unternehmen, das sich derzeit mit der KI-Generierung von Bewegtbildern beschäftigt. Aktiv in dem Sektor ist unter anderem auch Runway. Das Unternehmen war wie Stability AI an der Entwicklung des ursprünglichen Stable-Diffusion-Modells beteiligt und hat mit Gen1 und Gen2 bereits zwei Video-KI-Modelle veröffentlicht. Ein weiterer Anbieter in dem Bereich ist Pika Labs.

Laut einem von Stability AI durchgeführten Test soll das Video-Modell zumindest bei Clips mit 25 Frames pro Sekunde besser abgeschnitten haben als die Modelle von Runway und Pika Labs. Unabhängige Vergleiche der Modelle gibt es bislang aber noch nicht.

Mehr zu diesem Thema

MIT Technology Review Künstliche Intelligenz Stable Diffusion

Verpasse keine News zu Software & Entwicklung 💌

Hinweis zum Newsletter & Datenschutz

Fast fertig!

Bitte klicke auf den Link in der Bestätigungsmail, um deine Anmeldung abzuschließen.

Du willst noch weitere Infos zum Newsletter? Jetzt mehr erfahren

Brands

Themen

Magazine

Skills

Stable Diffusion für Videos: Das kann das neue KI-Modell von Stability AI

Stable Video Diffusion: Das kann die Video-KI – und das nicht

Wie schlägt sich Stable Video Diffusion im Vergleich zur Konkurrenz?