Gen-2: Runway präsentiert Text-zu-Video-KI

Es hat nicht lange gedauert, bis Text-zu-Bild-Anbieter in der Welt der Künstlichen Intelligenzen zum Mainstream geworden sind. KI-Start-up Runway hat mit Gen-1 zudem bereits eine Software kreiert, die anhand von bestehendem Videomaterial ein neues Video erschaffen konnte – und nun folgt mit Text-zu-Video der nächste Schritt.
Die erste Text-zu-Video-KI ist auf dem Markt
Runway, das bereits am Bild-Generator Stable Diffusion mitgearbeitet hat, hat nun Gen-2 veröffentlicht. Es ist damit die erste öffentlich zugängliche KI, die Videos allein anhand von Textvorgaben erstellen kann.
Gen-2 kann Runway zufolge „realistisch und einheitlich neue Videos synthetisieren“. Es kombiniert dabei einige Merkmale von Gen-1 wie die Video-zu-Video-Funktion, funktioniert vor allem aber auch allein mit Text.
Film ohne filmen: Erste Beispiele
Damit, so Runway, könne man „etwas Neues filmen, ohne überhaupt etwas zu filmen“. Erste Beispiele zeigt das Unternehmen ebenfalls auf seiner Website sowie in dem Vorstellungsvideo, darunter eine Berglandschaft aus der Vogelperspektive oder einen Sonnenuntergang, betrachtet aus einer New Yorker Wohnung.
Wie schon bei Gen-1 scheint Runway darauf zu bauen, dass sich die KI nach ihrer Veröffentlichung weiterentwickelt. Die bisherigen Beispiele von Runway sind bislang noch nicht fotorealistisch und weisen bei komplexeren Clips wie dem Sonnenuntergang kleinere Fehler auf.
Der Zugang ist bislang beschränkt
Womöglich wollte Runway auch der Konkurrenz zuvorkommen, denn das Unternehmen ist nicht das einzige, das an dem Konzept Text-zu-Video arbeitet. Obwohl Google oder Meta ihre Programme noch nicht veröffentlicht haben, haben sie bereits einen Vorgeschmack darauf gegeben, was diese können werden.
Zudem schränkt Runway den Zugang zu Gen-2 bislang noch ein. Wie Bloomberg berichtet, müssen Interessierte sich vorerst über den Discord-Server des Unternehmens auf eine Warteliste setzen lassen, um den Text-zu-Video-Generator nutzen zu können.