MusicLM: Neue Google-KI erzeugt ganze Musikstücke auf Zuruf
Dass Künstliche Intelligenzen (KI) automatisch Musik erzeugen, ist nicht neu. Die KI MusicLM, die Google jetzt vorgestellt hat, soll ihre Vorgängersysteme aber sowohl bei der Audioqualität als auch der Fähigkeit, die Textvorgaben korrekt umzusetzen, übertreffen.
Musikstücke aus Textvorgaben oder Melodien
Ihren Entwickler:innen zufolge soll die KI aus Song-Vorgaben wie „eine beruhigende Geigenmelodie, unterlegt von einem verzerrten Gitarrenriff“ echte Hifi-Musikstücke machen können. Auch vorgesummte Melodien könne MusicLM verarbeiten.
In einem noch nicht von anderen Wissenschaftler:innen überprüften Preprint haben die Google-Forscher:innen einige Beispiele veröffentlicht – inklusive der jeweiligen textlichen Anweisungen oder Vorgaben hinsichtlich des Genres oder sonstiger Angaben.
Die Ergebnisse lassen jedoch insgesamt noch etwas zu wünschen übrig – insbesondere was die Erstellung von menschlichem Gesang angeht. Zudem finden sich auch einige verzerrt klingende Beispiele in den veröffentlichten Samples.
MusicLM: Unzureichende Trainingsdaten für Google-KI
Die Wissenschaftler:innen erklären das unter anderem mit der Schwierigkeit, hochwertige und kohärente Audiosignale zu erzeugen. Darüber hinaus mangele es an kombinierten Audio-Text-Daten – ganz anders als im Bildbereich, etwa bei Dall-E.
Ein weiteres Problem von MusicLM, das auf dem im Herbst 2022 vorgestellten Soundschnipsel-Generator AudioLM basiert, sehen die Forscher:innen in den in den Trainingsdaten vorhandenen Verzerrungen, was die Vielfalt der genutzten Musik angeht.
Die Musikgenerierung könne aufgrund unzureichender Trainingsdaten eine mögliche Unterrepräsentierung bestimmter Stile oder Kulturen spiegeln. Auch Fragen potenzieller kultureller Aneignung stellten sich, so die Forscher:innen.
Musik-KI kopiert eigenmächtig Songs
Darüber hinaus könnte sich bei weitergehender Benutzung der KI die Urheberrechtsfrage stellen. Bei immerhin einem Prozent der Beispiele habe MusicLM kreative Schöpfungen übernommen, quasi eigenmächtig, wie heise.de schreibt.
Der Herausforderung der unerlaubten Verwendung urheberrechtlich geschützter Werke menschlicher Künstler:innen, wie sie gerade bei Text-Bild-Generatoren heiß diskutiert wird, entzieht sich Google bei MusicLM – noch. Es gebe aktuell keine Pläne, das KI-System zu veröffentlichen, heißt es.