Microsoft zeigt eine KI, die Videos von euch anhand eines Fotos erstellt

News

Microsoft zeigt eine KI, die Videos von euch anhand eines Fotos erstellt – doch das birgt Risiken

Microsoft hat ein KI-Modell vorgestellt, das nur mit einem Foto und einer Audiodatei ein Video von euch machen kann, in dem ihr in die virtuelle Kamera sprecht. Und die Ergebnisse sind schon jetzt überzeugend.

Von Marvin Fuhrmann

19.04.2024, 13:00 Uhr • 2 Min.

Microsoft zeigt eine KI, die Videos von euch anhand eines Fotos erstellt – doch das birgt Risiken — Mit Vasa-1 wird euer Foto zu einem KI-Video. (TSViPhoto/Shutterstock)

Vasa-1 heißt die neue KI von Microsoft, die das Unternehmen in einem ausführlichen Blogbeitrag vorstellt. Die künstliche Intelligenz ist in der Lage, Fotos von Personen in Videos zu verwandeln. Wie das in Aktion aussieht, seht ihr in diesem Video:

Wie funktioniert Vasa-1?

Sobald ein Foto in Vasa-1 hochgeladen wurde, erstellt die KI daraus ein Modell, das animiert werden kann. Im Gegensatz zu anderen künstlichen Intelligenzen könnt ihr dieses Modell sogar bewegen und drehen. Selbst ohne eine Fotovorlage – etwa von der Seite des Kopfes – erstellt Vasa-1 ein komplettes Modell.

Sobald ihr nun eine Audiodatei in Vasa-1 einspeist, fangen die Modelle an, diesen Text nachzusprechen. Die Lippenbewegungen sind dabei schon sehr akkurat. Zudem spielen die animierten Gesichter mit ihrer Mimik, schauen in Pausen nicht mehr direkt in die virtuelle Kamera oder neigen den Kopf. Sogar unterschiedliche Einstellungen zu Emotionen sind laut Microsoft möglich.

Empfehlungen der Redaktion

News

Falsche Gesichter, echte Gefühle: Wie Betrüger Deepfakes für Romance-Scams nutzen

News

Stable Diffusion 3: Entwickler erhalten API-Zugriff auf neuen KI-Bildgenerator

News

Boston Dynamics: Das ist der neue Atlas-Roboter

Über diese neue Technik kann Microsoft Videos von 512 mal 512 Pixeln bei 45 Bildern pro Sekunde anfertigen. Vasa-1 könnte sogar einen Online-Streaming-Modus bieten, der dann Videos mit bis zu 40 Bildern pro Sekunde ermöglicht. Denkbar wäre also etwa, dass Livestreamer die Technik nutzen können, um ihr Gesicht durch ein virtuelles Abbild auszutauschen, aber Lippensynchronität beizubehalten.

Wofür soll Vasa-1 genutzt werden?

Künftig könnte die neue KI zum Einsatz kommen, wenn Charaktere in Videospielen, Filmen und Musikvideos animiert werden sollen. Zudem spricht das Unternehmen davon, dass Vasa-1 die Barrierefreiheit für Menschen mit Spracheinschränkungen erhöhen oder als therapeutischer Support dienen könnte.

Microsoft betont allerdings, dass es sich hierbei bislang nur um ein Forschungsprojekt handelt. Vasa-1 ist (noch) nicht für die Öffentlichkeit gedacht. Denn neben den Möglichkeiten gibt es auch Risiken, derer sich Microsoft bewusst ist. So könnte Vasa-1 missbraucht werden, um Menschen hinters Licht zu führen und Falschinformationen zu streuen.

Microsoft möchte zunächst sicherstellen, dass solche Videos einwandfrei identifiziert werden können – selbst wenn die Technologie weiter voranschreitet und die Clips noch realistischer aussehen.

Sora: Das sind die besten Clips von OpenAIs Video-KI Quelle:

Bildergalerie ansehen

Mehr zu diesem Thema

MIT Technology Review Künstliche Intelligenz Microsoft

Verpasse keine News zu Software & Entwicklung 💌

Hinweis zum Newsletter & Datenschutz

Fast fertig!

Bitte klicke auf den Link in der Bestätigungsmail, um deine Anmeldung abzuschließen.

Du willst noch weitere Infos zum Newsletter? Jetzt mehr erfahren

Kommentare (1)

Kommentieren

Ralf Zschemisch

19.04.2024, 17:05 Uhr

Die UNO lädt KI Entwickler zur Lösung der dringenden Probleme der Menschheit ein. Hungersnot, Klimawandel… “AI for Good Global Summit”

Was interessiert das die KI-Entwickler oder die Berichterstatter? Sie „lösen“ andere Probleme und bekommen dafür Publicity. Welches Problem wollten die KI-Entwickler von Microsoft jetzt mit „Videos von euch nach einem Foto“ endlich gelöst haben? Was soll der Müll? Wer braucht DAS?