Meta soll KI an raubkopierten Büchern trainiert haben – jetzt schlagen englische Schriftsteller Alarm - t3n

News

Meta soll KI an raubkopierten Büchern trainiert haben – jetzt schlagen englische Schriftsteller Alarm

Meta hat seine Sprach-KI Llama 3 mithilfe von Millionen von Büchern trainiert – illegal, ohne Rücksicht auf die Urheberrechte und das Einverständnis der Autor:innen. In Großbritannien wehren diese sich nun dagegen.

Von Claudia Wieschollek

01.04.2025, 16:00 Uhr • 3 Min.

Meta soll KI an raubkopierten Büchern trainiert haben – jetzt schlagen englische Schriftsteller Alarm — Meta soll seine Sprach-KI Llama 3 mithilfe von raubkopiertem Material trainiert haben. (Bild: Robert Way/Shutterstock)

„Schützen Sie die Existenzgrundlage von Autor:innen vor der unlizenzierten Nutzung ihrer Werke für das Training von KI“ lautet der – zugegebenermaßen etwas sperrige – Titel einer Petition, die namhafte Autor:innen wie Kazuo Ishiguro, Val McDermid, Sarah Waters und Richard Osman Ende März veröffentlicht haben. Adressat:innen der Petition sind Lisa Nandy, die britische Ministerin für Kultur, Medien und Sport, sowie Chris Bryant, Minister für Kreativwirtschaft, Kunst und Tourismus. Sie sollen dafür sorgen, dass Meta dafür zur Rechenschaft gezogen wird.

Mark Zuckerberg soll den Einsatz von LibGen selbst freigegeben haben

Der Facebook-Konzern soll seine Sprach-KI Llama 3 mit einer Datenbank trainiert haben, die aus rund 7,5 Millionen Büchern und 81 Millionen wissenschaftlichen Papern besteht – und die illegal zustande gekommen ist. Library Genesis lautet ihr Name, und die Freigabe dafür soll nach Recherchen von The Atlantic von Mark Zuckerberg selbst gekommen sein.

Empfehlungen der Redaktion

Fundstück

Stille als Protest: Warum 1.000 Top-Musiker ein leeres Album veröffentlicht haben

News

KI-Training mit deinen privaten Daten? So kannst du Ebay davon abhalten

MIT Technology Review Listicle

KI-Training mit deiner Kunst? Diese 4 Tricks schützen deine Werke vor Datenklau

In der Entwicklung von Llama 3 hatte sich gezeigt, dass große Mengen an qualitativ hochwertigem Text nötig sein würden – und dass es „unverhältnismäßig teuer“ wäre und „unglaublich lange“ dauern würde, für jeden Text eine entsprechende Lizenz einzuholen. Zudem befürchtete man, so einen Präzedenzfall zu schaffen: „Wenn wir ein einziges Buch lizenzieren, können wir keine Fair-Use-Strategie mehr anwenden“, soll ein:e Meta-Entwickler:in in einem internen Chat argumentiert haben. Also griff man auf Library Genesis – kurz LibGen – zurück.

The Atlantic hat eine umfassende Datenbank zur Verfügung gestellt, in der Autor:innen und Interessierte nach bestimmten Titeln und Verfasser:innen suchen können. Darin finden sich unter anderem auch Werke der britischen Autor:innen, die sich jetzt an ihre Regierung wenden, um Meta für die unerlaubte Verwendung raubkopierter Inhalte zur Rechenschaft zu ziehen.

„Wir sehen hier das skrupellose Verhalten global agierender Tech-Unternehmen, die urheberrechtlich geschütztes Material zu verwenden scheinen – in der Gewissheit, nicht zur Rechenschaft gezogen zu werden. Das muss sich ändern, und global agierende Tech-Unternehmen müssen zur Rechenschaft gezogen werden und für den Nutzen bezahlen, den sie aus den Werken von Autor:innen ziehen“, schreiben die Ersteller:innen dementsprechend in der Petition an die britische Labour-Regierung.

Meta soll sich vor dem Parlament erklären – und Besserung geloben

Hochrangige Mitarbeiter:innen von Meta sollten vor das britische Parlament zitiert werden und dort Stellung beziehen müssen. Die Unterzeichner:innen fordern zudem, dass Meta die Urheberrechtsverletzungen zugibt und zusichert, das Copyright der Autor:innen künftig zu achten, illegale Praktiken in Zukunft zu unterlassen und die Betroffenen für alle bisherigen Urheberrechtsverletzungen zu entschädigen.

Meta selbst hat zu den Vorwürfen bisher keine Stellung bezogen. Zuvor hatte der Konzern vor Gericht argumentiert, die Nutzung von nicht lizenziertem Material beim Training von KI sei „Fair Use“, weil Large-Language-Modelle das Originalmaterial zu neuen Werken verarbeiten würden. Eine einheitliche Rechtsprechung gibt es diesbezüglich noch nicht – Gerichte und Gesetzgebung arbeiten in einem Tempo, das mit der Geschwindigkeit neuer technologischer Entwicklungen nicht immer mithalten kann.

Bereits im Februar dieses Jahres haben zahlreiche Musiker:innen gegen eine geplante Änderung des britischen Urheberrechts protestiert, indem sie auf Spotify ein Album namens Is This What We Want? veröffentlicht haben, das zwölf Titel enthält. Das Besondere: Zu hören sind nur Tonaufnahmen leerer Konzertsäle und Veranstaltungsorte. Die Künstler:innen wollen sich damit gegen eine Gesetzesänderung positionieren, die es Unternehmen erlauben würde, künstliche Intelligenzen an öffentlich zugänglicher Musik zu trainieren – ohne dafür ein Einverständnis einholen oder bezahlen zu müssen.

Mehr zu diesem Thema

MIT Technology Review Künstliche Intelligenz Meta Mark Zuckerberg

Verpasse keine News zu Software & Entwicklung 💌

Hinweis zum Newsletter & Datenschutz

Fast fertig!

Bitte klicke auf den Link in der Bestätigungsmail, um deine Anmeldung abzuschließen.

Du willst noch weitere Infos zum Newsletter? Jetzt mehr erfahren