Für 275 Dollar pro Monat: Googles Video-KI Veo 3 vertont Clips mit perfekter Lippensynchronisation

Erst Ende 2024 hatte Google seine Video-KI Veo aktualisiert. Damals versprach das Unternehmen etliche Verbesserungen für Filmemacher:innen, die mit dem Tool kurze Clips erstellen können. Jetzt steht Veo 3 in den Startlöchern, das noch einmal deutlich mehr Möglichkeiten bietet. Das liegt unter anderem daran, dass Googles KI-Modell jetzt die Clips automatisch vertont.
Veo 3 in Flow: Was die Video-KI schon jetzt leistet
In der Ankündigung zu Veo 3 heißt es von Google, dass die KI in der Lage ist, alle Sounds „von Verkehrsgeräuschen im Hintergrund einer Straßenszene über das Zwitschern von Vögeln im Park bis hin zu Dialogen zwischen den Charakteren“ zu erstellen. Das beweist Google auch in einigen kurzen Clips, in denen sich etwa eine Eule und ein Dachs unterhalten oder Hunderte Origami-Kraniche in die Luft abheben.
Um den Ton zu generieren, können User:innen nach wie vor auf Textprompts zurückgreifen. Sie müssen der KI lediglich mitteilen, welche Geräusche oder Dialoge während der Szene zu hören sein sollen. Veo 3 erstellt diese zusammen mit dem eigentlichen Clip und passt gerade bei Charakteren die Lippenbewegungen so an, dass sie zu dem gesprochenen Dialog passen. Gegenüber The Verge verriet Matthieu Lorrain, Creative Lead bei Google DeepMind, dass Veo 3 jetzt auch in der Lage ist, deutlich längere Prompts zu verarbeiten und die genaue Reihenfolge der Szene zu beachten.
Neben Veo 3 hat Google auch noch ein neues Tool namens Flow angekündigt. ES kombiniert die Fertigkeiten von Veo, Gemini und Imagen, um Filmemacher:innen mehr kreative Möglichkeiten zu geben. Mit Flow ist es etwa möglich, mehrere Bilder hochzuladen und diese zu einer Szene in einem Video zusammensetzen zu lassen. So landen etwa Quallen auf dem Rücksitz eines Autos, das sich unter Wasser befindet. Im Beispielvideo zeigt Google zudem eine Person mit Lavalampe als Torso, die durch ein zerstörtes Dorf läuft.
Clips kürzen und per Prompt das Ende verändern
Zudem lässt euch Flow bestehende Clips bearbeiten. So ist es möglich, einen Clip zu kürzen und dann einen neuen Prompt einzugeben, um das Ende zu verändern. Durch eine Änderung in Flow läuft die Person aus dem Beispielvideo stattdessen durch hell erleuchtete Straßen, in denen ein Fest mit anderen Lavalampen-Leuten stattfindet.
Obwohl Veo 3 bislang nur für ausgewählte User:innen verfügbar ist, gibt es auf X zahlreiche Beispiele, was die KI leisten kann. Wie gut die Synchronisation von verschiedenen KI-Charakteren funktioniert, zeigt etwa das Video „We can talk!“, das über diesem Absatz zu sehen ist. Ferner gibt es auch Videos von Seminaren mit GenZ-Sprache über Muffins, die sich anschreien bis zu dem obligatorischen KI-Spaghetti-Video – wenn auch mit einem Staubsauger.
Neben den neuen Funktionen von Veo 3 verpasst Google aber auch dem Vorgänger ein paar Neuerungen. Veo 2 wird also nicht demnächst verschwinden. Stattdessen bietet die KI jetzt eine Kamerasteuerung und das Entfernen von Objekten aus einem Video.
Der Nachfolger Veo 3 steht zunächst nur Abonnent:innen in den USA zur Verfügung, die die neue Google-AI-Ultra-Abostufe kaufen. Diese kostet in den ersten drei Monaten 140 US-Dollar monatlich. Danach steigt der Preis auf 275 Dollar im Monat. Flow gibt es schon etwas günstiger mit dem Google-AI-Pro-Abo. Hier liegt der Preis bei 21,99 Dollar monatlich. Allerdings gibt es dafür nur Zugriff auf Veo 2.