MIT Technology Review News
KI-Musik mit lizenzierten Songs: Wie sich die größten Plattenlabels der Welt wehren

Universal Music und Sony Music haben zusammen einen Großteil der weltweiten Musik unter ihren Lizenzen. Jetzt setzen auch sie auf KI – um kleinste Elemente dieser geschützten Titel in KI-Musik aufzuspüren.

Von Jenny Lepies
2 Min.
Das neuronale Fingerprinting-Tool setzt daher beim Abgleich von menschengemachter und maschinengemachter Musik an. (KI-generiertes Bild: Midjourney / MIT Technology Review)

Die Musikbranche steht angesichts der Verbreitung von Musik generierenden KI-Tools unter Zugzwang. Künstler:innen und Bands fordern die Sicherung ihrer lizenzierten Werke, damit Nutzer:innen von Software wie Suno AI oder Udio keine Titel auf Basis ihres geistigen Eigentums – ohne die erforderliche Lizenz – erzeugen. Jetzt haben sich zwei der drei weltweit größten Musiklabels zusammengetan, um Urheberrechtsverletzungen durch KI-generierte Musik auf die Schliche zu kommen. Dafür haben die Universal Music Group und Sony Music mit einem Spinoff der Stanford University namens Soundpatrol zusammengearbeitet. Das Ergebnis ist ein KI-basiertes Fingerprinting-Tool, das speziell für Audio- und Video-Content angepasst wurde. Es soll einzelne Elemente von lizenzierter Musik in KI-generierter Musik erkennen.

Songs erraten: KI oder nicht KI?

„Es ist einfach, einen KI-Song unter Nicht-KI-Songs auszumachen“, sagt Walter de Brouwer, Mitgründer und CEO von Soundpatrol. „Aber es ist sehr schwer, in einem Song zu sagen, dieser Teil kommt aus diesem Originaltitel, dieser Teil kommt aus jenem“, erklärt er die Problematik.

Das neuronale Fingerprinting-Tool setzt daher beim Abgleich von menschengemachter und maschinengemachter Musik an. Die Technologie dafür existiert bereits, basiert auf künstlichen neuronalen Netzen und wird etwa in der Medizin eingesetzt. Dort dient sie beispielsweise dazu, unter einer Gruppe von Menschen einzelne Individuen zu identifizieren. Dieses Vorgehen nutzt Soundpatrol, um es auf eine Masse an Musik anzuwenden. Doch für das Training des neuronalen Netzes war ein Pool an lizenzierter Musik erforderlich, um Urheberrechtsverletzungen zu erkennen. „Deswegen war die Partnerschaft mit den Major-Labels so wichtig, schließlich haben sie einen Großteil der lizensierten Musik zur Verfügung. Ihre Songs bilden sozusagen das Rückgrat der populären Musik, die auf der ganzen Welt bekannt ist“, so de Brouwer.

Experten-Modelle für Melodien, Harmonien und Musiktext

Ergänzt wird das neuronale Fingerprinting von Soundpatrol durch eine Gruppe von unterschiedlichen Experten-Modellen. Sie untersuchen Melodien, Harmonien, Rhythmen, Metadaten und Songtexte. Das Ziel ist es schließlich, eine Variante eines Originalsongs im Internet zu entdecken. Das Vorgehen ist ein wenig wie die App Shazam. Mit der Anwendung können Nutzer:innen Songs, die sie hören, analysieren lassen und erfahren, welcher Titel und Interpret dahintersteckt. Bei der Entwicklung von Soundpatrol funktioniert es ähnlich, allerdings mit dem Unterschied, dass die Software aus dem ganzen Song einzelne Versatzstücke verschiedener lizenzierter Songs erkennen muss.

Das Tool ist nach Angaben von de Brouwer bereits bei den Labels im Einsatz, es werde aber weiterhin in Rücksprache mit Universal und Sony verbessert. „Denn schließlich lernen auch die KI-Modelle, gegen die wir arbeiten, dazu“, sagt de Brouwer über den Prozess. Idealerweise müsste aber eine solche Software, wie sie derzeit im Einsatz ist, frühzeitig zum Einsatz kommen. So präzisiert de Brouwer gegenüber Forbes: „In einer KI-gesteuerten Musikwirtschaft muss die Erkennung vorgelagert erfolgen, vor der Veröffentlichung, vor der Monetarisierung, bevor der Schaden entsteht.“

