Meta soll KI an raubkopierten Büchern trainiert haben – jetzt schlagen englische Schriftsteller Alarm

„Schützen Sie die Existenzgrundlage von Autor:innen vor der unlizenzierten Nutzung ihrer Werke für das Training von KI“ lautet der – zugegebenermaßen etwas sperrige – Titel einer Petition, die namhafte Autor:innen wie Kazuo Ishiguro, Val McDermid, Sarah Waters und Richard Osman Ende März veröffentlicht haben. Adressat:innen der Petition sind Lisa Nandy, die britische Ministerin für Kultur, Medien und Sport, sowie Chris Bryant, Minister für Kreativwirtschaft, Kunst und Tourismus. Sie sollen dafür sorgen, dass Meta dafür zur Rechenschaft gezogen wird.
Mark Zuckerberg soll den Einsatz von LibGen selbst freigegeben haben
Der Facebook-Konzern soll seine Sprach-KI Llama 3 mit einer Datenbank trainiert haben, die aus rund 7,5 Millionen Büchern und 81 Millionen wissenschaftlichen Papern besteht – und die illegal zustande gekommen ist. Library Genesis lautet ihr Name, und die Freigabe dafür soll nach Recherchen von The Atlantic von Mark Zuckerberg selbst gekommen sein.
In der Entwicklung von Llama 3 hatte sich gezeigt, dass große Mengen an qualitativ hochwertigem Text nötig sein würden – und dass es „unverhältnismäßig teuer“ wäre und „unglaublich lange“ dauern würde, für jeden Text eine entsprechende Lizenz einzuholen. Zudem befürchtete man, so einen Präzedenzfall zu schaffen: „Wenn wir ein einziges Buch lizenzieren, können wir keine Fair-Use-Strategie mehr anwenden“, soll ein:e Meta-Entwickler:in in einem internen Chat argumentiert haben. Also griff man auf Library Genesis – kurz LibGen – zurück.
The Atlantic hat eine umfassende Datenbank zur Verfügung gestellt, in der Autor:innen und Interessierte nach bestimmten Titeln und Verfasser:innen suchen können. Darin finden sich unter anderem auch Werke der britischen Autor:innen, die sich jetzt an ihre Regierung wenden, um Meta für die unerlaubte Verwendung raubkopierter Inhalte zur Rechenschaft zu ziehen.
„Wir sehen hier das skrupellose Verhalten global agierender Tech-Unternehmen, die urheberrechtlich geschütztes Material zu verwenden scheinen – in der Gewissheit, nicht zur Rechenschaft gezogen zu werden. Das muss sich ändern, und global agierende Tech-Unternehmen müssen zur Rechenschaft gezogen werden und für den Nutzen bezahlen, den sie aus den Werken von Autor:innen ziehen“, schreiben die Ersteller:innen dementsprechend in der Petition an die britische Labour-Regierung.
Meta soll sich vor dem Parlament erklären – und Besserung geloben
Hochrangige Mitarbeiter:innen von Meta sollten vor das britische Parlament zitiert werden und dort Stellung beziehen müssen. Die Unterzeichner:innen fordern zudem, dass Meta die Urheberrechtsverletzungen zugibt und zusichert, das Copyright der Autor:innen künftig zu achten, illegale Praktiken in Zukunft zu unterlassen und die Betroffenen für alle bisherigen Urheberrechtsverletzungen zu entschädigen.
Meta selbst hat zu den Vorwürfen bisher keine Stellung bezogen. Zuvor hatte der Konzern vor Gericht argumentiert, die Nutzung von nicht lizenziertem Material beim Training von KI sei „Fair Use“, weil Large-Language-Modelle das Originalmaterial zu neuen Werken verarbeiten würden. Eine einheitliche Rechtsprechung gibt es diesbezüglich noch nicht – Gerichte und Gesetzgebung arbeiten in einem Tempo, das mit der Geschwindigkeit neuer technologischer Entwicklungen nicht immer mithalten kann.
Bereits im Februar dieses Jahres haben zahlreiche Musiker:innen gegen eine geplante Änderung des britischen Urheberrechts protestiert, indem sie auf Spotify ein Album namens Is This What We Want? veröffentlicht haben, das zwölf Titel enthält. Das Besondere: Zu hören sind nur Tonaufnahmen leerer Konzertsäle und Veranstaltungsorte. Die Künstler:innen wollen sich damit gegen eine Gesetzesänderung positionieren, die es Unternehmen erlauben würde, künstliche Intelligenzen an öffentlich zugänglicher Musik zu trainieren – ohne dafür ein Einverständnis einholen oder bezahlen zu müssen.