Microsoft: KI-Chef sieht das Internet als Freeware – warum ihm das viel Gegenwind einbringt

Wer eine KI trainieren will, benötigt Daten. Diese zu bekommen, ist oftmals gar nicht so einfach. Denn eigentlich sollte vorher geklärt sein, dass die Daten genutzt werden dürfen. Dafür gibt es mittlerweile sogar Verträge zwischen großen Websites und KI-Entwickler:innen wie OpenAI.
Umso überraschender ist die Aussage des Microsoft-KI-Chefs Mustafa Suleyman in einem Interview auf dem Aspen Ideas Festival. Dort behauptete der CEO von Microsoft AI, dass nahezu alle Inhalte im Internet für KI-Trainings frei genutzt werden könnten.
Das Internet ist „Freeware“
CNBC-Moderator Andrew Ross Sorkin fragte Suleyman, ob KI-Unternehmen im Grunde das geistige Eigentum des Internets gestohlen hätten, weil viele Modelle anhand der frei verfügbaren Daten trainiert wurden. Daraufhin antwortete der KI-CEO: „Mit Respekt für den Content, der im freien Netz verfügbar ist: Der soziale Vertrag dieses Contents ist seit den Neunzigern, dass er ‚Fair Use‘ ist.“
Er führt weiter aus: „Jeder kann diese Inhalte kopieren, damit weitere Inhalte kreieren, Inhalte reproduzieren. Diese Inhalte sind Freeware, wenn man es so bezeichnen will.“ Laut Suleyman gibt es eine „Ausnahme“. Und das sind Websites wie News-Publisher, die explizit gesagt haben, dass ihre Seiten nicht für das Training von künstlichen Intelligenzen genutzt werden sollen. Laut Suleyman war das bislang eine Grauzone, die jetzt rechtlich geklärt werden muss. Allerdings wüsste Suleyman nicht, welche KI-Unternehmen das bislang nicht einfach trotzdem gemacht hätten.
Warum diese Aussagen für Kritik sorgen
Gerade in den USA haben die Aussagen Suleymans für viel Gegenwind gesorgt. So berichtet etwa The Verge, dass Inhalte nicht einfach kopiert werden können, nur weil sie im Internet landen. Alle erstellten Werke sind von Grund auf durch das Urheberrecht der USA geschützt, auch ohne vorherige Anmeldung. Wäre dem nicht so, würden vermutlich viele Autor:innen und andere Content-Creator:innen ihre Werke nicht mehr ins Internet stellen.
Die Ausnahmen, auf die sich der Microsoft-KI-CEO bezieht, werden vor allem über das sogenannte Robots Exclusion Protocol geregelt. Das ist eine Textdatei, die Websitebetreiber:innen auf ihrer Domain hinterlegen können. Diese beinhaltet URLs, die nicht von Bots gescannt werden dürfen. Der Verdacht, dass sich einige KI-Unternehmen nicht daran halten, ist nicht neu. Zuletzt geriet Perplexity AI in die Kritik, weil sie angeblich gegen das Protokoll verstoßen hat. Zudem gab es Ende 2023 eine Klage der New York Times gegen Microsoft und OpenAI. Der Vorwurf: Urheberrechtsverletzung durch unrechtmäßiges KI-Training mit den Inhalten der Website.