Anzeige
Anzeige
News

Fugatto: Nvidia stellt neues Audio-KI-Modell vor

Der Chip-Hersteller Nvidia hat ein neues KI-Modell vorgestellt, das sich an Produzent:innen von Musik, Filmen und Videospielen richtet. Das bleibt aber vorerst unter Verschluss.

2 Min.
Artikel merken
Anzeige
Anzeige

Nvidia-Chef Jen-Hsun Huang tritt beim Thema KI mächtig aufs Gas. (Foto: Shutterstock/QubixStudio)

 

 

 

 

 

 

 

Nvidia, wertvollstes Unternehmen der Welt und Marktführer bei Chips, die für Künstliche Intelligenz genutzt werden können, hat ein KI-Modell entwickelt, das nicht nur in der Lage ist, aus einem Textprompt Musik und sonstige Audio-Klänge zu erstellen. Fugatto (Foundational Generative Audio Transformer Opus 1), so der Name des neuen Modells, kann auch bestehende Audioaufnahmen modifizieren und komplett neuartige Klänge erzeugen.

Anzeige
Anzeige

Text-zu-Sound-KI stößt auf kommerzielles Interesse

Das dürfte sicherlich für die kommerzielle Nutzung höchst interessant sein. Dazu wird es aber vorerst nicht kommen. Nvidia hat vielmehr angegeben, dass es keine unmittelbaren Pläne für eine Veröffentlichung der Technologie gibt, wie Reuters berichtet.

Auch andere Unternehmen, darunter das Startup Runway, aber ebenso die Branchengrößen Meta und OpenAI, haben Audio-KI im Portfolio. Was Fugatto von anderen unterscheidet, ist zugleich das größte Problem des neuen KI-Modells.

Anzeige
Anzeige

Fugatto mit massivem Unterscheidungsmerkmal

Denn Fugatto generiert aus einer Textbeschreibung nicht nur Soundeffekte, wie die anlässlich der Präsentation vorgestellte Trompete, die klingt wie ein bellender Hund. Sie ist zudem in der Lage, vorhandene Audiodaten aufzunehmen und zu modifizieren.

So könnte sie beispielsweise eine auf einem Klavier gespielte Melodie in eine von einer menschlichen Stimme gesungene Melodie umwandeln. Ebenso könnte sie eine Sprachaufnahme nehmen und etwa den verwendeten Akzent oder die ausgedrückte Stimmung ändern.

Anzeige
Anzeige

„Wenn wir an synthetische Klänge in den vergangenen 50 Jahren denken, klingt Musik heute anders, dank Computern und Synthesizern“, so Bryan Catanzaro, Vizepräsident für angewandte Deep-Learning-Forschung bei Nvidia. „Ich denke, dass die generative KI neue Möglichkeiten für Musik, Videospiele und ganz normale Menschen bieten wird, die etwas erschaffen wollen.“

Das neue Modell von Nvidia wurde mit Open-Source-Daten trainiert. Ob und wie es zugänglich gemacht werden soll, muss sich Nvidia noch genauestens überlegen. Catanzaro dazu: „Jede generative Technologie birgt immer gewisse Risiken, da Menschen sie nutzen könnten, um Dinge zu generieren, die wir lieber nicht hätten. Wir müssen vorsichtig sein, weshalb wir keine unmittelbaren Pläne haben, dies zu veröffentlichen.“

Anzeige
Anzeige

Fugattos Kehrseite: Deepfakes Tür und Tor geöffnet

Der bevorstehende Konflikt ist offensichtlich. Wenn Fugatto Stimmen ändern oder sogar austauschen oder deren Aussagen in einer anderen Stimmung erscheinen lassen kann, wie ist sichergestellt, dass das Modell nicht missbraucht wird?

Die Diskussion darüber ist bereits in vollem Gange. Vor einigen Monaten hatte Hollywood-Star Scarlett Johansson OpenAI beschuldigt, ihre Stimme künstlich zu imitieren. OpenAI steht bereits in Verhandlungen mit Hollywood-Studios darüber, ob und wie die KI in der Unterhaltungsindustrie eingesetzt werden könnte. Die Künstler:innen zeigen sich wenig begeistert.

Auch OpenAI und Meta haben sich bisher nicht dazu geäußert, wann sie planen, ihre Modelle, die Audio oder Video generieren, der Öffentlichkeit zugänglich zu machen.

Anzeige
Anzeige

 

 

 

Anzeige
Anzeige

 

 

 

Fast fertig!

Bitte klicke auf den Link in der Bestätigungsmail, um deine Anmeldung abzuschließen.

Du willst noch weitere Infos zum Newsletter? Jetzt mehr erfahren

Anzeige
Anzeige
Kommentare

Community-Richtlinien

Bitte schalte deinen Adblocker für t3n.de aus!
Hallo und herzlich willkommen bei t3n!

Bitte schalte deinen Adblocker für t3n.de aus, um diesen Artikel zu lesen.

Wir sind ein unabhängiger Publisher mit einem Team von mehr als 75 fantastischen Menschen, aber ohne riesigen Konzern im Rücken. Banner und ähnliche Werbemittel sind für unsere Finanzierung sehr wichtig.

Schon jetzt und im Namen der gesamten t3n-Crew: vielen Dank für deine Unterstützung! 🙌

Deine t3n-Crew

Anleitung zur Deaktivierung
Artikel merken

Bitte melde dich an, um diesen Artikel in deiner persönlichen Merkliste auf t3n zu speichern.

Jetzt registrieren und merken

Du hast schon einen t3n-Account? Hier anmelden

oder
Auf Mastodon teilen

Gib die URL deiner Mastodon-Instanz ein, um den Artikel zu teilen.

Community-Richtlinien

Wir freuen uns über kontroverse Diskussionen, die gerne auch mal hitzig geführt werden dürfen. Beleidigende, grob anstößige, rassistische und strafrechtlich relevante Äußerungen und Beiträge tolerieren wir nicht. Bitte achte darauf, dass du keine Texte veröffentlichst, für die du keine ausdrückliche Erlaubnis des Urhebers hast. Ebenfalls nicht erlaubt ist der Missbrauch der Webangebote unter t3n.de als Werbeplattform. Die Nennung von Produktnamen, Herstellern, Dienstleistern und Websites ist nur dann zulässig, wenn damit nicht vorrangig der Zweck der Werbung verfolgt wird. Wir behalten uns vor, Beiträge, die diese Regeln verletzen, zu löschen und Accounts zeitweilig oder auf Dauer zu sperren.

Trotz all dieser notwendigen Regeln: Diskutiere kontrovers, sage anderen deine Meinung, trage mit weiterführenden Informationen zum Wissensaustausch bei, aber bleibe dabei fair und respektiere die Meinung anderer. Wir wünschen Dir viel Spaß mit den Webangeboten von t3n und freuen uns auf spannende Beiträge.

Dein t3n-Team

Kommentar abgeben

Melde dich an, um Kommentare schreiben und mit anderen Leser:innen und unseren Autor:innen diskutieren zu können.

Anmelden und kommentieren

Du hast noch keinen t3n-Account? Hier registrieren

Anzeige
Anzeige