Eine vor einem kalifornischen Gericht eingereichte Sammelklage wirft Microsoft, deren Firmentochter GitHub und der von Elon Musk mitgegründeten KI-Schmiede OpenAI vor, die Rechte einer Vielzahl von Open-Source-Entwicklern zu verletzten. Konkret geht es dabei um die KI-gestützte Programmierhilfe GitHub Copilot, der wiederum auf einem von OpenAI entwickelten KI-Modell basiert.
„Indem sie ihre KI-Systeme auf öffentlichen GitHub-Repositories trainiert haben, haben die Beklagten unserer Ansicht nach die Rechte einer großen Anzahl von Urhebern verletzt“, erläutert Matthew Butterick, der Initiator der Klage, auf einer extra dafür eingerichteten Website. Nach Ansicht des Entwicklers, Autors und Juristen verletzt das Vorgehen die Lizenzen vieler Open-Source-Projekte, denn die setzen meist voraus, dass die Original-Autor:innen genannt werden, wenn ihr Code weiterverwendet wird.
GitHub-Klage könnte Auswirkungen auf die gesamte KI-Branche haben
Bislang vertreten Microsoft und viele andere Firmen im KI-Sektor die Auffassung, dass die Nutzung urheberrechtlich geschützter Inhalte zum Training von KI-Modellen nach US-amerikanischem Recht erlaubt sei. Nur: Vor Gericht wurde diese Rechtsauffassung bislang nicht getestet. Dementsprechend dürften auch viele andere KI-Unternehmen gespannt auf den Ausgang des Rechtsstreites blicken.
Neben der Frage, ob der Copilot Urheberrecht verletzt, geht es Butterick und seinen Anwälten auch um das Verhältnis zwischen Microsoft/GitHub und OpenAI. Buttericks Vorwurf: Microsoft nutze die von einer gemeinnützigen Organisation kontrollierte KI-Firma, um sich vor etwaigen rechtlichen Problemen zu distanzieren. Microsoft habe immerhin nicht nur eine Milliarde US-Dollar in OpenAI investiert, sondern dient auch als Cloud-Provider für die Organisation und halte die exklusiven Lizenzen für einige ihrer Produkte.
Auch dieser Vorwurf ließe sich auf andere KI-Firmen übertragen. Die Firma hinter der Bild-KI Stable Diffusion entwickelt ihr Modell beispielsweise auch nicht selbst, sondern finanziert dazu Forschungsinstitutionen. Kritiker:innen bezeichnen dieses Vorgehen analog zur Geldwäsche als „Datenwäsche“. Auch im Bezug auf diese Praxis der Branche könnte die Klage enorme Auswirkungen haben.
Kläger fordern eine bessere Lösung für das Training von KI-Modellen
In einem Interview mit der US-Publikation The Verge vergleicht Butterick die jetzige Situation mit den Musik-Tauschbörsen der frühen 2000er Jahre. Am Anfang habe es Napster gegeben, was komplett illegal war, aber daraus habe sich dann später iTunes und Spotify entwickelt. „Und wie sind diese Systeme entstanden? Indem Unternehmen Lizenzvereinbarungen getroffen haben und Inhalte auf legale Weise einbringen“, so Butterick.
Die Vorstellung, dass im KI-Bereich nicht auch einfach alle Stakeholder zusammenkommen und eine für beide Seiten funktionierende Lösung finden könnten, bezeichnet Butterick als katastrophal. „Ich bevorzuge Spotify und iTunes, und ich hoffe, dass die nächste Generation dieser KI-Tools besser und fairer für alle ist.“