Google aktualisiert AGB: Deine Online-Inhalte unterstützen das Training von KI
Google hat seine Datenschutzerklärung aktualisiert. Darin heißt es nun, dass das Unternehmen alle öffentlich zugänglichen Informationen zum Training von KI-Produkten wie Bard und Cloud AI verwenden wird.
Damit schnappt sich das Unternehmen quasi alle Informationen, die es kriegen kann, und packt sie in die Trainingsdatenbank. „Google nutzt Informationen, um unsere Dienste zu verbessern und neue Produkte, Funktionen und Technologien zu entwickeln, die unseren Nutzern und der Öffentlichkeit zugutekommen“, heißt es in der neuen Google-Richtlinie.
„Wir nutzen beispielsweise öffentlich verfügbare Informationen, um die KI-Modelle von Google zu trainieren und Produkte und Funktionen wie Google Translate, Bard und Cloud-AI-Funktionen zu entwickeln.“
Kleine, aber entscheidende Änderung
Dabei ist Googles Politik zu öffentlich verfügbaren Informationen nicht gänzlich neu. Das Unternehmen zeigt die Änderungen der Datenschutzerklärung auf der entsprechenden Seite an.
Bisher hatte Google öffentlich verfügbare Informationen ebenfalls weiterverwendet, allerdings nur für Sprachmodelle für Google Translate. Neu in dem Absatz ist, dass Google die Informationen nun auch für KI-Modelle verwendet, und Bard sowie Cloud AI werden explizit erwähnt.
Gizmodo findet diesen Absatz in der Datenschutzerklärung dennoch etwas seltsam. Denn normalerweise wird darin erklärt, wie das Unternehmen mit Daten verfährt, die Nutzer an die eigene Seite übermitteln. Google verkündet hier allerdings, wie es mit Daten umgeht, die frei im Internet verfügbar sind.
Probleme mit den Trainingsdaten für KI
Die Thematik wirft einige Fragen zu den Trainingsdaten für KI-Modelle auf. Momentan streiten Gerichte darüber, wer eigentlich die Rechte an den Daten hat und ob sie für das Training von KI verwendet werden dürfen.
OpenAI zum Beispiel hat erst vor ein paar Tagen eine neue Sammelklage in den Briefkasten bekommen. Diese merkt an, dass OpenAI Daten von Menschen ohne deren Einwilligung nutzt, um ChatGPT zu trainieren. Wie die Frage letztendlich geklärt wird und welche Daten die Unternehmen verwenden dürfen, ist bisher unklar.