Mammuts im Schnee, eine Frau, die durch Tokio läuft: Das sind die ersten Videos, die mit dem neuen OpenAI-Tool Sora erstellt wurden.
Noch ist das KI-Modell, das aus geschriebenen Prompts Bewegtbilder macht, nicht für die breite Masse verfügbar. Wer nicht zu den auserwählten Testpersonen gehört, kann sich derweil einen Überblick über die Konkurrenz-Tools verschaffen.
Sora-Alternative für die Forschung: Stable Video Diffusion
Die Macher:innen der Bild-KI Stable Diffusion haben Ende 2023 ihr Tool Stable Video Diffusion vorgestellt. Das Spannende daran: Stability AI bleibt sich treu und hat den Code des Video-Tools, das es in zwei Versionen gibt, öffentlich gemacht.
Anders als Sora sind die beiden Modelle von Stable Video Diffusion allerdings vor allem für Forscher:innen gemacht und derzeit noch von einer Vielzahl an Einschränkungen geprägt.
Die Bildraten der Videos liegen beispielsweise nur bei 14 beziehungsweise 25 Bildern pro Sekunde, die Auflösung bei 576 x 1.024 Pixeln. Und: Die Videos sind kürzer als vier Sekunden, teilweise entstehen Clips ganz ohne Bewegung.
Sora hingegen soll fotorealistische Clips erzeugen, die bis zu eine Minute lang sein können.
KI-Videos von Meta: Make-a-Video
Mark Zuckerbergs Meta hat tatsächlich schon 2022 ein KI-Video-Tool vorgestellt. Make-a-Video erstellt bis zu fünf Sekunden lange Clips.
Die sind allerdings noch ohne Ton und wirkten bei der Präsentation 2022 noch relativ künstlich und verzerrt. Pro Sekunde werden 16 Bilder mit einerAuflösung von maximal 64 x 64 Pixeln ausgegeben. Bei Sora macht OpenAI noch keine Angaben zu den genauen technischen Daten.
Videopräsentation aus dem KI-Baukasten: Quinvio AI
Ein KI-Tool für kurze Erklärvideos bietet das Startup Quinvio AI.
Hier geht es weniger um cineastisch beeindruckende Szenen wie die Mammuts im Schnee, die OpenAI mit Sora generiert hat. Stattdessen vertonen KI-generierte Sprecher:innen vor schlichtem Hintergrund zuvor erstellte Präsentationsskripte.
Die kostenlose Probeversion von Quinvio ermöglicht aber immerhin das Erstellen eines Clips, der bis zu 30 Sekunden lang ist.
Text zu Video mit Gen-2 von Runway
Anfang 2023 hat das KI-Startup Runway sein KI-Video-Tool Gen-2 ins Rennen geschickt. Wer die Software ausprobieren möchte, muss sich dafür in Runways iOS-App oder im Browser anmelden.
Die Demovideos, die Runway bei der Vorstellung von Gen-2 gezeigt hat, waren nicht fotorealistisch und wiesen teilweise noch kleinere Fehler auf – mit etwas Zeit könnte die Software aber eine spannende Sora-Alternative werden.
KI-generierte Videos von Google: Lumiere und Videopoet
Google arbeitet derzeit an gleich zwei Video-KI-Tools. Videopoet erstellt nicht nur Videos aus Text-Prompts, sondern kann auch bereits bestehende Clips vertonen oder Bilder in Videos umwandeln.
Ähnlich sieht das bei Lumiere aus, hier gibt es aber auch Features zur Videobearbeitung. Zu den Tools, die beide im Januar 2024 vorgestellt wurden, gibt es bislang hauptsächlich Demomaterial – genauere Infos oder sogar die Möglichkeit zum Ausprobieren dürften in nächster Zeit folgen.