Training von KI-Modellen: Hat Mark Zuckerberg die Nutzung von Raubkopien genehmigt?

Mark Zuckerberg, der CEO von Meta, steht erneut im Zentrum einer Kontroverse: In einem laufenden US-Rechtsstreit werfen prominente Autor:innen dem Unternehmen vor, ihre urheberrechtlich geschützten Werke illegal für das Training von Metas KI-Modellen genutzt zu haben. Wie Heise jetzt berichtet, hat Zuckerberg angeblich persönlich die Nutzung von Daten aus der Plattform Libgen genehmigt. Dabei handelt es sich um eine bekannte Sammlung von Raubkopien.
Zuckerberg soll sich gegen Bedenken seines Teams durchgesetzt haben
Die Klage, die von den US-Autor:innen Sarah Silverman, Richard Kadrey und Christopher Golden eingereicht wurde, basiert auf der Behauptung, dass Meta ohne die Zustimmung der Rechteinhaber:innen geschützte Inhalte für das Training von Llama-Modellen verwendet habe. Aus Gerichtsunterlagen geht hervor, dass Metas Entwickler:innen zunächst Bedenken hatten, Inhalte von Libgen zu nutzen, da es sich um Raubkopien handelte. Nach einer internen Eskalation hätten sie aber die Freigabe von „MZ“ – also von CEO Mark Zuckerberg – erhalten.
Außerdem habe Meta die Copyright-Hinweise aus den Trainingsdaten entfernt, um sicherzustellen, dass die KI-Modelle keine entsprechenden Hinweise in ihren Antworten generieren. Dieser Schritt könnte laut den Anwält:innen der Autor:innen dazu gedient haben, rechtliche Risiken zu minimieren. Besonders gravierend ist der Vorwurf, dass Meta-Entwickler:innen gezwungen worden sein sollen, selbst urheberrechtlich geschütztes Material in Tauschbörsen hochzuladen, um weitere Daten für das Training herunterladen zu können.
Der Kampf um urheberrechtlich geschützte Inhalte
Der Rechtsstreit, den Meta derzeit führt, ist kein Einzelfall. Auch OpenAI sieht sich mit ähnlichen Vorwürfen konfrontiert: Zahlreiche Autor:innen und Medienunternehmen haben das Unternehmen verklagt und werfen OpenAI vor, ihre Inhalte ohne Erlaubnis für das Training seiner KI-Modelle genutzt zu haben. Im Zentrum der Debatte steht eine Frage, die es zu klären gilt: Dürfen KI-Unternehmen öffentlich verfügbare Inhalte, darunter auch urheberrechtlich geschützte Werke, für das Training ihrer Modelle verwenden?
In den USA gibt es dazu noch keine klare gesetzliche Regelung. Viele Unternehmen berufen sich auf das Prinzip des „Fair Use“, das die Nutzung geschützter Inhalte unter bestimmten Umständen erlaubt. Ob diese Argumentation auch für das massenhafte Training von KI-Modellen gilt, ist aber bislang ungeklärt. Die derzeit verhandelten Fälle könnten daher wegweisend für die Zukunft der KI-Entwicklung sein.
Der Meta-CEO ist bereits bekannt für seine umstrittenen Strategien
Mark Zuckerberg steht nicht zum ersten Mal wegen fragwürdiger Entscheidungen in der Kritik. In der Vergangenheit musste Meta, der Mutterkonzern von Facebook, bereits zahlreiche Skandale aushalten – von Datenschutzverletzungen über die gezielte Verbreitung von Desinformationen bis hin zu den Auswirkungen der Plattform auf die psychische Gesundheit junger Nutzer:innen. Allein in den vergangenen Tagen hat Meta zwei grundlegende Neuerungen verkündet: Nachdem Facebook in den USA den Faktencheck abschaffen will, plant das Unternehmen jetzt auch, seine Bemühungen um mehr Diversität und Inklusion zurückzufahren.
Sollten sich die Vorwürfe gegen Meta bestätigen, könnte dem Unternehmen einer der größten Prozesse seiner Geschichte bevorstehen. Angesichts der Milliarden, die Meta in KI-Technologien investiert hat, wären die Folgen einer Niederlage erheblich – sowohl finanziell als auch für die Reputation des Konzerns. Gleichzeitig zeigt der Fall, wie dringend notwendig eine klare gesetzliche Regelung für den Umgang mit urheberrechtlich geschützten Inhalten im Kontext des KI-Trainings ist. Ohne solche Vorgaben bleibt die Rechtslage unklar und Unternehmen wie Meta oder OpenAI können weiterhin Grauzonen ausnutzen.