Wer räumt bei den nächsten Grammys ab? Diese KI weiß es vor der Jury
„I Can’t Breathe“ von der Sängerin H.E.R. gewann 2021 den Grammy in der Kategorie „Song des Jahres“. Das kam durchaus überraschend, denn nicht nur setzte sich die R&B-Sängerin in der Kategorie gegen Superstars wie Taylor Swift und Dua Lipa durch, sondern verblüffte auch die Wettanbieter, die dem Protestsong gegen Polizeigewalt vor der Preisverleihung lediglich Außenseiterchancen eingeräumt hatten.
Besser machte es ein KI-Modell, das Forscher:innen der New York University (NYU) entwickelt haben. Das sagte nämlich rückwirkend nicht nur den Sieg für „I Can’t Breathe“ voraus, sondern auch alle anderen Gewinner in den Kategorien „Song des Jahres“, „Album des Jahres“ und „Rap-Song des Jahres“ zwischen 2021 und 2023. Das Modell hatte das Team bereits im März auf einer Fachkonferenz vorgestellt, seit vergangener Woche ist das Paper online verfügbar.
Wie der Informatik-Professor und Studienleiter Anasse Bari sagt, zeige das Beispiel von H.E.R., dass die Auswahl der Grammy-Gewinnner:innen zwar immer subjektiv sei und letztlich im Ermessen der Fachjury liege. Aber wenn man die Zusammensetzung der nominierten Lieder betrachte, könne man durchaus Aussagen über mögliche spätere Gewinner treffen. Und nicht nur das: „Wir glauben, dass dieses KI-Tool dabei helfen kann, aufstrebende Künstler und Trends zu identifizieren“, sagt Bari.
Songs, in Einzelteile zerlegt
Um die Zusammensetzung eines Songs bestimmen zu können, müssen zunächst möglichst viele Informationen darüber erfasst werden, was ein einzelnes Lied und dessen Beliebtheit ausmacht. In der Vergangenheit gab es bereits Versuche, Preisträger mithilfe von Streamingdaten von Spotify, mit Chartplatzierungen des US-Medienkonzerns Billboard sowie mit algorithmischer Stimmungserkennung auf Basis der Songtexte vorherzusagen. Die Arbeit der NYU-Forscher baut darauf auf und geht noch einen Schritt weiter.
Um die Datengrundlage zu schaffen, hat das Team zunächst alle nominierten Titel in den drei erwähnten Kategorien zwischen 2004 und 2020 in ihre Datenbank aufgenommen. Diese wurden anschließend mithilfe der API von Spotify auf ihre musikalischen Merkmale hin untersucht: Spotify weiß nämlich, ob ein Lied vermehrt auf akustische Instrumente oder auf elektronische Beats setzt, wie geeignet es zum Tanzen ist, wie viel Text es enthält und welche „Energie“ es hat, basierend auf Eigenschaften wie Timbre und Tonleiter.
Im dritten Schritt ging es darum, die Texte der Songs zu analysieren. Dazu haben sich die Forscher:innen bereits vorhandenen Modellen der sogenannten Sentimentanalyse bedient, um herauszufinden, ob ein Lied anhand seiner Lyrics eher negativ oder positiv ist, welche Emotionen es bei den Hörer:innen auslöst und wie viel Profanität es enthält. Als letztes kamen noch Daten über die Chartplatzierungen hinzu, über die Suchanfragen in Google, sowie eine Textanalyse der Kommentare auf YouTube und Reddit, die nach der Nominierung der Songs für die Grammys verfasst wurden: Damit wollten die Forscher:innen herausfinden, ob positive oder negative Rückmeldungen in der Community womöglich etwas über die spätere Platzierung aussagen.
Das KI-Modell übertrifft Vorhersagen von Wettanbietern
Mit all diesen Daten gespickt, ließen die Wissenschaftler das Modell dann noch einmal die Grammy-Gewinner:innen zwischen 2021 und 2023 tippen. Tatsächlich lag das Modell in allen insgesamt neun Fällen richtig, wenn auch mit einer Einschränkung: Bei der Auswertung kam eine Top-N-Anfrage zum Einsatz (n=3): Für jede Kategorie sagte das Modell also nicht einen definitiven, sondern immer drei mögliche Gewinner-Titel voraus – und unter diesen drei war in allen Fällen der letztendliche Gewinner. Dennoch lag die Trefferquote den Forscher:innen zufolge über den Vorhersagen der Wettanbieter in den jeweiligen Jahren.
Die Ergebnisse seien ein „vielversprechender Beweis für die Nützlichkeit der Anwendung von Algorithmen auf mehrere Datenquellen und neue Datenmerkmale in der Musikindustrie“, heißt es in der Studie. So konnte das Team anhand der Auswertung sehen, welche Merkmale eines Songs denn mutmaßlich die Entscheidung der Jury beeinflussen – und welche eher nicht.
Energie, Lyrics, Happiness – worauf die KI achtet
In der Kategorie „Song des Jahres“ kommt es demnach vor allem auf Energie, die Akustik und die Chartplatzierung an. Das „Album des Jahres“ dagegen besticht unter anderem durch das Vorhandensein von Texten, also Lyrics, und der „Rap-Song des Jahres“ zeichnet sich durch die Vielfalt des Vokabulars, und, was vielleicht überraschend ist, seinen „Happiness“-Faktor aus. Sprich: Rap-Songs, die positiv wirken, haben womöglich bessere Chancen, bei den Grammys abzuräumen.
„Unsere Ergebnisse zeigen, wie wichtig es ist, bei der Vorhersage der Gewinner:innen von Musikpreisen Faktoren wie die Popularität und musikspezifische Merkmale zu berücksichtigen“, sagt Anesse Bari. Und womöglich nicht nur dort: Plattformen wie TikTok und Streamingdienste wie Spotify verändern durch ihre algorithmische Auswahl die Art und Weise, wie Musik produziert und konsumiert wird. Längst ist es nicht mehr nur das Talent einer Musikerin oder das geschulte Ohr eines Produzenten, das über den Erfolg entscheidet. Sondern immer häufiger auch eine KI.