Veo 3 ist ein so eindrucksvolles KI-Videomodell, dass auf diversen Plattformen dieser Welt in den vergangenen Wochen zahlreiche AI-generierte Clips aus der Veo-Kreation viral gingen. Mehr als 40 Millionen Videos wurden bereits erstellt. Nachdem Google das Modell, welches kurze Videos mit Sound aus Prompts und Bildvorgaben erstellen kann, zuletzt in Deutschland launchte, haben auch hierzulande viele Creator und Marketer mit der Option gearbeitet. Jetzt können die Creator auch direkt Bilder in Videos umwandeln und den einst statischen Visuals sogar Sprache oder einen Dialog hinzufügen. Dank umfassender Verfügbarkeit haben inzwischen deutlich mehr Menschen weltweit Zugriff – sodass Veo 3 auch in naher Zukunft den Digitalraum mit sehr viel Content versorgen dürfte.

Veo 3: Vom Bild zum Video, so geht’s

Im Mai erst launchte Google Veo 3 als Nachfolgeversion von Veo 2. Wenige Monate später ist das KI-Videomodell leistungsfähiger denn je. Das neueste Feature dürfte erneut für viele Kreationsexperimente sorgen. Denn ab jetzt lassen sich statische Bilder einfach in Videos verwandeln. Dazu erklärt Google:

„Select ‘video‘ from the tool menu in the prompt box, upload a photo, then describe the scene and audio you imagine and watch as your still image transforms.“

Damit dieser Prozess noch etwas greifbarer und visuell ansprechend deutlich wird, hat Google CEO Sundar Pichai auf X ein Beispielvideo veröffentlicht. Darin lässt er das Dinosaurierskelett, welches auf dem Google Campus als eine Art Maskottchen mit dem Namen Stan fungiert, einfach loslaufen – und brüllen.

Diese besondere Funktion ist ab sofort für Abonnent:innen von Google AI Ultra und Pro verfügbar, zunächst aber nur in ausgewählten Ländern. Testen können Creator das Feature via gemini.google.com. In Deutschland ist es schon zu nutzen. Der KI-Experte Jens Polomski zeigt auf Linkedin seine Kreation, die aus Bildern Videos hervorbringt.

Passend zur Ankündigung dieser kreativen Neuerung hat Google ebenfalls verkündet, dass Google AI Ultra in 76 weitere Länder kommt und in über 140 Ländern verfügbar sein wird. Überdies wird der Zugriff auf Flow auf noch mehr Länder ausgeweitet. Eine Übersicht der Länder, in denen du das Filmmaking-Tool nutzen kannst, findest du auf Googles Hilfeseite – Deutschland ist mit dabei. Mit Flow können User zu Videos animierten Bildern, einfach einen passenden Sound und sogar Monolog oder Dialog hinzufügen.

Veo 3 hat Riesenpotential und birgt ein enormes Risiko

Bei bestimmten Fotos soll die Animation und Sound-Unterlegung laut Google jedoch nicht möglich sein. Das könnte ein Hinweis auf die Sicherheitsmaßnahmen des Unternehmens sein. Immerhin betont Google, dass man etwaigen Missbrauch des Tools schon mit Red-Teaming vorbeugen wolle und man die Content-Richtlinien – etwa zu gewaltvollen oder explizit sexuellen Inhalten – streng überwacht. Auch werden alle mit Veo 3 generierten Videos mit dem SynthID-Wasserzeichen versehen und als KI-generiert gekennzeichnet. Dennoch besteht die Gefahr, dass die simple Umwandlung von Fotos in Videos mit Sound von einigen für unlautere Zwecke eingesetzt wird. Eine Reihe rassistischer und sexistischer Videos ist mithilfe des Modells schon in Umlauf gekommen.

Mit jeder technologischen Neuerung größeren Ausmaßes für die KI-Kreation gehen derlei Risiken einher, deren Auswirkungen als Gegengewicht zum großen Potenzial der Funktionen noch kaum zu ermessen sind. Derweil optimiert Google die eigene Sucherfahrung ebenfalls mit Nachdruck und bringt beispielsweise den AI-Mode in die visuelle Suche mit Circle to Search – ein Tool, das auch für Videos eingesetzt werden kann, künftig wohl auch für KI-Videos.

