Anzeige
Anzeige
News

Microsoft zeigt eine KI, die Videos von euch anhand eines Fotos erstellt – doch das birgt Risiken

Microsoft hat ein KI-Modell vorgestellt, das nur mit einem Foto und einer Audiodatei ein Video von euch machen kann, in dem ihr in die virtuelle Kamera sprecht. Und die Ergebnisse sind schon jetzt überzeugend.

2 Min.
Artikel merken
Anzeige
Anzeige

Mit Vasa-1 wird euer Foto zu einem KI-Video. (TSViPhoto/Shutterstock)

Vasa-1 heißt die neue KI von Microsoft, die das Unternehmen in einem ausführlichen Blogbeitrag vorstellt. Die künstliche Intelligenz ist in der Lage, Fotos von Personen in Videos zu verwandeln. Wie das in Aktion aussieht, seht ihr in diesem Video:

Anzeige
Anzeige

Wie funktioniert Vasa-1?

Sobald ein Foto in Vasa-1 hochgeladen wurde, erstellt die KI daraus ein Modell, das animiert werden kann. Im Gegensatz zu anderen künstlichen Intelligenzen könnt ihr dieses Modell sogar bewegen und drehen. Selbst ohne eine Fotovorlage – etwa von der Seite des Kopfes – erstellt Vasa-1 ein komplettes Modell.

Sobald ihr nun eine Audiodatei in Vasa-1 einspeist, fangen die Modelle an, diesen Text nachzusprechen. Die Lippenbewegungen sind dabei schon sehr akkurat. Zudem spielen die animierten Gesichter mit ihrer Mimik, schauen in Pausen nicht mehr direkt in die virtuelle Kamera oder neigen den Kopf. Sogar unterschiedliche Einstellungen zu Emotionen sind laut Microsoft möglich.

Anzeige
Anzeige

Über diese neue Technik kann Microsoft Videos von 512 mal 512 Pixeln bei 45 Bildern pro Sekunde anfertigen. Vasa-1 könnte sogar einen Online-Streaming-Modus bieten, der dann Videos mit bis zu 40 Bildern pro Sekunde ermöglicht. Denkbar wäre also etwa, dass Livestreamer die Technik nutzen können, um ihr Gesicht durch ein virtuelles Abbild auszutauschen, aber Lippensynchronität beizubehalten.

Wofür soll Vasa-1 genutzt werden?

Künftig könnte die neue KI zum Einsatz kommen, wenn Charaktere in Videospielen, Filmen und Musikvideos animiert werden sollen. Zudem spricht das Unternehmen davon, dass Vasa-1 die Barrierefreiheit für Menschen mit Spracheinschränkungen erhöhen oder als therapeutischer Support dienen könnte.

Anzeige
Anzeige

Microsoft betont allerdings, dass es sich hierbei bislang nur um ein Forschungsprojekt handelt. Vasa-1 ist (noch) nicht für die Öffentlichkeit gedacht. Denn neben den Möglichkeiten gibt es auch Risiken, derer sich Microsoft bewusst ist. So könnte Vasa-1 missbraucht werden, um Menschen hinters Licht zu führen und Falschinformationen zu streuen.

Microsoft möchte zunächst sicherstellen, dass solche Videos einwandfrei identifiziert werden können – selbst wenn die Technologie weiter voranschreitet und die Clips noch realistischer aussehen.

Sora: Das sind die besten Clips von OpenAIs Video-KI Quelle:
Fast fertig!

Bitte klicke auf den Link in der Bestätigungsmail, um deine Anmeldung abzuschließen.

Du willst noch weitere Infos zum Newsletter? Jetzt mehr erfahren

Anzeige
Anzeige
Ein Kommentar
Bitte beachte unsere Community-Richtlinien

Wir freuen uns über kontroverse Diskussionen, die gerne auch mal hitzig geführt werden dürfen. Beleidigende, grob anstößige, rassistische und strafrechtlich relevante Äußerungen und Beiträge tolerieren wir nicht. Bitte achte darauf, dass du keine Texte veröffentlichst, für die du keine ausdrückliche Erlaubnis des Urhebers hast. Ebenfalls nicht erlaubt ist der Missbrauch der Webangebote unter t3n.de als Werbeplattform. Die Nennung von Produktnamen, Herstellern, Dienstleistern und Websites ist nur dann zulässig, wenn damit nicht vorrangig der Zweck der Werbung verfolgt wird. Wir behalten uns vor, Beiträge, die diese Regeln verletzen, zu löschen und Accounts zeitweilig oder auf Dauer zu sperren.

Trotz all dieser notwendigen Regeln: Diskutiere kontrovers, sage anderen deine Meinung, trage mit weiterführenden Informationen zum Wissensaustausch bei, aber bleibe dabei fair und respektiere die Meinung anderer. Wir wünschen Dir viel Spaß mit den Webangeboten von t3n und freuen uns auf spannende Beiträge.

Dein t3n-Team

Ralf Zschemisch

Die UNO lädt KI Entwickler zur Lösung der dringenden Probleme der Menschheit ein. Hungersnot, Klimawandel… “AI for Good Global Summit”

Was interessiert das die KI-Entwickler oder die Berichterstatter? Sie „lösen“ andere Probleme und bekommen dafür Publicity. Welches Problem wollten die KI-Entwickler von Microsoft jetzt mit „Videos von euch nach einem Foto“ endlich gelöst haben? Was soll der Müll? Wer braucht DAS?

Antworten

Melde dich mit deinem t3n Account an oder fülle die unteren Felder aus.

Bitte schalte deinen Adblocker für t3n.de aus!
Hallo und herzlich willkommen bei t3n!

Bitte schalte deinen Adblocker für t3n.de aus, um diesen Artikel zu lesen.

Wir sind ein unabhängiger Publisher mit einem Team von mehr als 75 fantastischen Menschen, aber ohne riesigen Konzern im Rücken. Banner und ähnliche Werbemittel sind für unsere Finanzierung sehr wichtig.

Schon jetzt und im Namen der gesamten t3n-Crew: vielen Dank für deine Unterstützung! 🙌

Deine t3n-Crew

Anleitung zur Deaktivierung
Artikel merken

Bitte melde dich an, um diesen Artikel in deiner persönlichen Merkliste auf t3n zu speichern.

Jetzt registrieren und merken

Du hast schon einen t3n-Account? Hier anmelden

oder
Auf Mastodon teilen

Gib die URL deiner Mastodon-Instanz ein, um den Artikel zu teilen.

Anzeige
Anzeige