Gema gegen OpenAI: Die Juristin Silke von Lewinski sieht in dem Urteil ein "positives Signal" für Musiker und andere Kreative. (Foto: AnnaStills / Shutterstock)

Neun Liedtexte von bekannten deutschen Songs waren lediglich nötig, um ChatGPT und dessen Anbieter OpenAI vorzuführen und eine unzulässige Vervielfältigung und Wiedergabe von lizenzierten Texten ohne Erlaubnis anzulasten. Damit hatte das Landgericht München der Klägerin, der Gema, in seinem Urteil in der vergangenen Woche recht gegeben. Die Verwertungsgesellschaft konnte anhand von Liedern wie Atemlos der Songschreiberin Kristina Bach oder Männer von Herbert Grönemeyer zeigen, dass es beim Modell GPT 4 und 4o möglich war, durch gezielte Prompts die genauen oder weitgehend genauen Liedtexte als Output zu erhalten.

Die Gema sieht das als Beweis dafür, und das Gericht folgte dieser Argumentation, dass die Liedtexte innerhalb des Modells memorisiert, verarbeitet und damit vervielfältigt wurden. OpenAI hingegen setzte auf die Schranke des sogenannten „Text- und Dataminings“, die die Verarbeitung der lizenzierten Songs abdecke. Zudem seien die jeweiligen Nutzerinnen und Nutzer für den Prompt und auch für den Output verantwortlich.

Das Urteil ist nicht rechtskräftig und wird wahrscheinlich an einer höheren Instanz (Bundesgerichtshof oder Europäischer Gerichtshof) erneut verhandelt werden. Warum dieses Urteil ein positives Signal für Künstlerinnen und Künstler ist und warum die Gema klug vorgegangen ist, erklärt Silke von Lewinski. Sie ist Juristin am Max-Planck-Institut für Innovation und Wettbewerb in München, forscht unter anderem zu KI, Urheberrecht und Vergütungs- und Lizenzmodellen im Kreativbereich und hat den Fall verfolgt.

MIT Technology Review (TR): Warum war die Gema in einer guten Ausgangsstellung in dem Prozess, etwa im Vergleich zu Medienhäusern, die ebenso viel Material im Netz haben, und an dem sich OpenAI ebenso bedient hat?

Silke von Lewinski: Auch Medienhäuser haben – gerade in den USA – geklagt, beziehungsweise versuchen teils erfolgreich, Lizenzverträge abzuschließen. Die Gema hat aber einen Musterfall konstruiert. Sie ist sehr überlegt vorgegangen, hat sich auf klare Fakten gestützt, die Rechte der einzelnen Textdichterinnen und -dichter eingeholt, sodass ihr Vorgehen niet- und nagelfest war. Die Gema hat genau dokumentiert, wie sie versucht hat, durch einfache Prompts diese Liedtexte aus der KI wieder herauszubekommen. Das Vorgehen wurde an verschiedenen Computern und mit verschiedenen Modellen durchgeführt. So konnte sie sehr gut zeigen, dass die Texte in der Regel 1:1 wiedergegeben werden konnten – oder mit ganz kleinen Veränderungen. Insofern sind die Fakten schon relativ klar und die Klage ist auch gut begründet.

Diese neun Texte sind dann gewissermaßen Stichproben gewesen?

Ja, das sind Beispiele gewesen. Das ist das übliche Vorgehen, wenn man eine Musterklage macht, mit der man eine grundsätzliche Klärung vom Gericht haben möchte. Dazu wählt man ganz bestimmte Beispiele aus. In diesem Fall waren die neun Texte absolut ausreichend, bei denen man die Urheberrechtsverletzung demonstrieren konnte.

OpenAI berief sich unter anderem auf die Text- und Datamining-Schranke. Was hat es damit auf sich?

Im Urheberrecht gilt erst mal immer der Grundsatz, dass die Urheberin oder der Urheber ein ausschließliches Recht zur Verwertung, wie hier zur Vervielfältigung und öffentlichen Wiedergabe, hat. Nutzerinnen und Nutzer müssen erst mal um Erlaubnis bitten, es sei denn, das Gesetz sieht eine Ausnahme vor. Und diese Ausnahme ist beispielsweise die Text- und Datamining-Schranke. Das heißt, das Eigentumsrecht kann in diesem Ausnahmefall vom Gesetz beschränkt werden. Das Text- und Datamining ist definiert als eine Technik zur Analyse etwa von Texten, um bestimmte Muster herauszufinden. Diese Muster sind dann das Ergebnis, der Output.

Sah das Gericht, dass die Text- und Datamining-Schranke in diesem Fall griff?

Das Gericht hat entschieden, dass in diesem Fall eben nicht solche Strukturen oder Muster als Ergebnis herauskommen, sondern ganze Werke vervielfältigt werden, also die vollständigen Texte der Output sind, sodass die Schranke nicht greift.

„Das Ziel von Lizenzverhandlungen ist eine gerechte Vergütung, eine Gegenleistung für die Urheberinnen und Urheber.“

Wie bewerten Sie das Urteil des Landgerichts?

Ich finde es erstens juristisch richtig und klar nachvollziehbar begründet, und zweitens ist es auch für die Kreativen ein sehr positives Signal, das ihnen Rückenwind gibt. Dadurch sind sie in einer stärkeren Position, auch wenn das natürlich nur eine erstinstanzliche Entscheidung ist. Aber wenn diese in der letzten Instanz bestätigt würde, hätten die Kreativen einfach eine starke Verhandlungsposition. Sie können dann KI-Unternehmen gegenüber aufgrund der rechtlichen Klärung auf ihrem Recht bestehen und Lizenzen verhandeln. Wenn die KI-Firmen keine Erlaubnis einholen und das Werk dennoch nutzen, fällt ein Schadensersatz an, den die Unternehmen zahlen müssen. Das Ziel von Lizenzverhandlungen ist eine gerechte Vergütung, eine Gegenleistung für die Urheberinnen und Urheber, die das „Öl“ für die KI liefern.

Welche offenen Fragen sehen Sie außerhalb des Urteils noch?

Fragen, die nicht in dem Sachverhalt vorkamen, sind natürlich noch offen. Zum Beispiel, wenn die Gema den Fall angeführt hätte, in dem sie eben nicht wiedererkennbare Outputs gehabt hätte, sondern andere Songtexte, bei denen man nicht mehr erkennen kann: Ist das jetzt von Kristina Bach oder nicht? Dafür müsste man einen neuen Gerichtsfall konstruieren, auch wenn man aus der Urteilsbegründung zum hier besprochenen Fall sicher auch Rückschlüsse auf diesen anderen Sachverhalt ziehen kann, zum Beispiel auch eine Vervielfältigung im Modell selbst annehmen kann.

„Warum sollten sie nicht auch die Kosten für das Wesentliche bei der generativen KI aufbringen können?“

Die Gema bietet seit September 2024 ein Lizenzmodell für generative künstliche Intelligenz, damit die Unternehmen rechtlich abgesichert Liedtexte für das Training nutzen dürfen und die Folgenutzungen abdecken. Denkt man an die Massen von Daten, die die Modelle verwenden, ist es denkbar, dass es die Gema ist, die KI-Anbieter in die Knie zwingt und ihr Geschäftsmodell torpediert?

Das Geschäftsmodell der KI-Unternehmen wird sicher nicht torpediert. Man liest andauernd, wie viele Milliarden US-Dollar diese Unternehmen in die generative KI investieren. Sie benötigen immense Rechenkapazitäten und Strom, bauen Server für das Training der Modelle und zahlen ihre Mitarbeiterinnen und Mitarbeiter. Die Unternehmen haben also diverse Kosten. Warum sollten sie nicht auch die Kosten für das Wesentliche bei der generativen KI aufbringen können? Denn ohne diesen Input, ohne die Werke von Menschen geht es nicht. Sie sind ganz wesentlich bei diesen Modellen: Wenn die Unternehmen keine menschlichen Werke als Trainingsmaterial einspeisen, dann kommt auch nichts Gescheites dabei heraus. Es liegt auf der Hand: Wenn die Unternehmen diesen Input brauchen, können sie nicht damit rechnen, dass sie ihn gratis verwerten dürfen. Die Firmen wollen damit Geld machen, und da müssen sie die Werklizenzen einfach als Kosten, genauso wie alle anderen Kosten, einkalkulieren.

Die Gema hat parallel noch ein Verfahren gegen Suno AI laufen, ebenfalls vor dem Landgericht München. Das Unternehmen liefert mit seiner Software KI-Musik auf Basis von Prompts. Sehen Sie durch das aktuelle Urteil gegen OpenAI auch eine gestärkte Ausgangslage für den Prozess gegen Suno?

Ich glaube schon, dass das eine Signalwirkung hat und die Richterinnen und Richter, wenn es in dem Fall andere sind, sich den Prozess und das Urteil genau anschauen werden. Sind es sogar dieselben Richterinnen, dürften sie grundsätzlich ihrer Argumentation folgen – es sei denn, sie sehen wesentliche Unterschiede in den Fakten. Aber vom Urheberrecht her werden die Musikwerke so wie Texte behandelt. Sie haben denselben Status. Ich glaube, der Fall ist schon sehr ähnlich, sodass das Urteil eine Präzedenzwirkung haben müsste.

