Der auf Large Language Models (LLMs) basierende KI-Chatbot ChatGPT bedient sich an unterschiedlichen Stellen, um sich stetig weiterzuentwickeln.

ChatGPT wird mit großen Textmengen aus dem Internet gefüttert

Der Chatbot basiert mittlerweile auf dem Sprachmodell GPT-4 von OpenAI, das auf die Deep-Learning-Technologie setzt und mit Algorithmen trainiert wird, die mit großen Textmengen aus dem Internet gefüttert werden.

Dazu gehören Wikipedia, Nachrichtenseiten und Portale für wissenschaftliche Fachartikel. Insgesamt soll der dem Sprachmodell zugrunde liegende Textkorpus etwa 500 Milliarden Wörter umfassen.

Wenn ihr verhindern möchtet, dass ChatGPT auch mit euren Daten gefüttert wird, könnt ihr das tun. Und zwar, indem ihr sie von den Servern von OpenAI, dem Mutterkonzern von ChatGPT, entfernen lässt. Im Prinzip teilt ihr ChatGPT mit, dass ihr nicht möchtet, dass OpenAI eure Nachrichten zum Trainieren seines Chatbots verwendet und euren Verlauf löscht, sodass auch eure Nachrichten den Chatbot nicht weiter trainieren.

Was ihr dafür tun müsst? Klickt in ChatGPT unten links am Bildschirm auf euren Profilnamen und öffnet die Registerkarte „Datenkontrollen“. Dort könnt ihr den Punkt „Chatverlauf und Training“ deaktivieren. Laut Cnet speichert OpenAi eure Chats auch nach der Deaktivierung 30 Tage lang, um sie auf „Missbrauch zu überwachen“, ehe sie dann dauerhaft zu löschen.

So bleibt euer Chatverlauf erhalten

Ihr könnt auch eine Variante wählen, bei der euer Chat-Verlauf erhalten bleibt. Geht auf das Datenschutzportal von OpenAI und klickt oben rechts am Bildschirm auf die Schaltfläche „Datenschutzanfrage stellen“. Dort wählt ihr die Option „Ich habe ein OpenAI-Konto“ und dort angelangt könnt ihr „Nicht mit meinen Inhalten trainieren“ aktivieren. So bleibt euer Chatverlauf erhalten, während das Modelltraining deaktiviert wird.

Kürzlich hat ChatGPT damit begonnen, seinen Chatbot auch für Nutzer:innen ohne Konto zu öffnen. Damit sollen mehr Menschen dazu bewegt werden, sich doch ein Konto zu erstellen. OpenAI erhofft sich davon aber auch mehr Trainingsdaten. Daran sieht man, wie wichtig dieser Teil für die KI ist.

