Wenn ein Data-Scientist auf andere Data-Scientists schaut
„Facebook sammelt nicht nur Daten über dich, wenn du es benutzt. Es sammelt sogar jeden Tastaturanschlag, den du tätigst. Facebook ist fast schon eine erkennungsdienstliche Behandlung, ganz ohne Rechtsgrundlage.“
Zusammengefasst diese Einschätzung trifft Vicki Boykis, Data-Scientist aus dem US-amerikanischen Philadelphia, in einem sehr ausführlichen Blogbeitrag, den sie im Februar 2017, also auf aktueller Erkenntnisbasis, verfasste. Boykis arbeitet für eine Firma, deren Dienstleistung darin besteht, Data-Mining zu betreiben, um ihren Kunden empirische Daten für diverse Geschäftsentscheidungen zu liefern. Wir dürfen also davon ausgehen, dass Boykis weiß, wovon sie redet, wenn sie das Datamining des blauen Netzwerks aus Palo Alto untersucht.
Dabei geht es ihr nicht darum, den Menschen die Nutzung von Facebook komplett auszureden. Vielmehr will sie lediglich transparent machen, worauf wir uns einlassen, wenn wir das soziale Netzwerk nutzen und was selbst dann passiert, wenn wir Facebook nicht nutzen. Ihre Erkenntnisse sind durchaus bedenklich.
Facebook as usual: Gespeichert wird, was wir preisgeben
Klar sein dürfte wohl eines: Wenn wir unser Schnitzel, unsere neue Frisur, unsere neue Beziehung, unser neues Auto, unseren letzten Urlaub oder unsere politische Gesinnung auf Facebook posten, dann speichert das Netzwerk diese Informationen auch. Das wird niemanden überraschen.
Überraschen könnte indes, dass Facebook diese Informationen vermutlich nie wieder löscht, zumindest nicht vollständig und nicht ohne sehr nachdrückliches, aktives Tätigwerden unsererseits. Diesen Schluss lässt die Analyse der Datentabellen zu, in denen sich Feldbezeichner wie etwa „deleted_comments“ finden.
Überraschen könnte auch, dass Facebook marketingrelevante Daten aus unseren Posts nicht nur selber nutzt, sondern offenbar an Drittanbieter zu deren Werbezwecken verkauft, wie es umgekehrt auch Daten über uns, die bei Drittanbietern vorliegen, kauft und aggregiert. Das sind aber nur die harmloseren Überraschungen, mit denen Boykis uns konfrontiert.
Weniger usual: Facebook speichert auch, was du nicht preisgibst
Womit wir eher nicht rechnen würden, ist wohl, dass Facebook bereits dann anfängt, unsere Posts zu speichern, wenn wir den ersten Buchstaben tippen. Der blaue Riese wartet offenbar nicht einmal ab, ob wir einen Beitrag letztlich wirklich absenden oder ihn kurz vorher noch löschen. Alles, was wir eintippen, bleibt nach Boykis Analyse der Facebook-Datentabellen in Facebook gespeichert.
Offenbar aggregiert Facebook auch personenbezogene Informationen, die wir selber gar nicht eingegeben haben. Dazu nutzt das Netzwerk die Hilfe unserer „Freunde“, die möglicherweise etwas gepostet haben, das mit uns in Relation zu bringen ist. Auch bei Drittanbietern vorliegende Daten soll Facebook zur Vervollständigung solcher so genannter Schattenprofile nutzen.
Selbst wenn wir also relativ zurückhaltend sind mit dem, was wir selber posten, schützt uns das nicht vor Transparenz. Ein übermäßig mitteilungsbedürftiger „Freund“ könnte unser Schattenprofil schneller füllen als wir selbst.
Schon mal gehört: Facebook speichert deinen Weg durchs Internet
Dass Facebook unser komplettes Browserverhalten trackt, wenn wir beim blauen Riesen eingeloggt sind, ist zwar seltsam, aber nicht völlig unbekannt. Manch einem mag allerdings bislang entgangen sein, dass Facebook das auch tut, wenn wir nicht eingeloggt sind – und zwar mittels Cookies. Boykis Empfehlung lautet daher, separate Browser für Facebook und alles andere zu nutzen.
Biometrische Erkennung: Deepface
Facebook legt großen Wert auf die Gesichtserkennung. Das geht soweit, dass eine biometrische Erkennung durchgeführt wird, die ein Gesicht so wiedererkennbar wie einen Fingerabdruck macht. Nach der ersten Gesichtserkennung wird der User, ebenso wie die Freunde dieses Users, aufgefordert, sein Gesicht auf anderen Fotos zu „taggen“, also zu bestätigen. Das ermöglicht Facebook das Erlernen der Erkennung unter schwierigeren Bedingungen, etwa in schlecht belichteten Fotos oder auf Gruppenbildern.
Deepface soll in die Lage versetzt werden, Gesichter quasi im Vorbeigehen mit Personendaten in Verbindung zu bringen. So könnten wir schon beim Betreten eines Geschäfts von der dortigen Überwachungskamera namentlich und hinsichtlich unserer Bonität evaluiert werden. Dass das keine besonders erstrebenswerte Perspektive für den Einzelnen ist, dürfte keiner Diskussion bedürfen.
Deepface soll übrigens in der EU derzeit nicht zum Einsatz kommen.
Facebooks interne Verwendung
Völlig unklar ist, wie Facebook intern mit den Nutzerdaten umgeht. Darauf lassen etliche Aussagen ehemaliger Mitarbeiter schließen. Eine Kontrolle gibt es immerhin nicht.
So fiel verschiedenen Usern etwa auf, dass Facebook-Mitarbeiter Zugriff auf Konten nehmen konnten, ohne das jeweilige Passwort zu kennen. Ebenso existieren Berichte über schwierige Diskussionen innerhalb von Facebook, wenn es darum ging, Berichte zu publizieren, die auf Userdaten beruhten.
Die Diskussion drehte sich dabei nicht um das Veröffentlichen an sich, sondern nur um die Frage, wie viel man wohl würde veröffentlichen können, ohne mit dem Datenschutz in Konflikt zu geraten. Der Zugriff auf die potenziell sensiblen Daten muss ja zu diesem Zeitpunkt bereits stattgefunden haben, sonst würde sich eine solche Frage nicht stellen.
Facebooks Algorithmus oder die erzwungene Filterblase
Über die Filterblase wird viel diskutiert. Hier bei t3n gibt es eine Kolumne, die unsere Filterblasen als handgemacht identifiziert. Dass diese Einschätzung nicht der ganzen Wahrheit entsprechen kann, wird deutlich, wenn wir uns etwa das Experiment des Wall Street Journal (WSJ) namens „Blue Feed, Red Feed“ anschauen.
Nebeneinander präsentiert das WSJ die Feeds eines sehr liberalen und eines sehr konservativen Facebook-Users. Beide Feeds suchen nach dem gleichen Thema. Dennoch erstellt Facebooks Algorithmus zwei News-Ströme, die unterschiedlicher nicht sein könnten und erzeugt auf diese Weise Echokammern, in denen stets nur das eigene Weltbild genährt wird.
Das hat mit weltoffener und objektiver Information ganz offensichtlich nicht mehr viel zu tun. Wenn man wollte, könnte man solches Vorgehen mit Fug und Recht als manipulativ bezeichnen. Bedenken wir nun, dass für nicht wenige Menschen Facebook inzwischen äquivalent zu dem Begriff Internet geworden ist, können wir uns vorstellen, welche Macht hinter dem simplen Feed steckt.
Snowden lässt grüßen
Nur der Vollständigkeit halber sei erwähnt, dass NSA und Co. selbstverständlich Zugriff auf die geposteten und aggregierten Daten haben. Das mag uns in Deutschland nicht sonderlich erschrecken, ist aber für Bewohner anderer Länder ein nicht unerhebliches Risikoszenario, vor allem, wenn man bedenkt, wer seit einigen Wochen die USA regiert.
Die Vielreisenden unter uns sollten sich eine gewisse Facebook-Zurückhaltung auferlegen. Denn aggregierte Daten können unerwartete Ereignisverknüpfungen zeigen, die falsche Interpretationen implizieren. Plötzlich hängt man am Flughafen fest.
Was können wir tun?
Schlussendlich können wir nur wenig tun, um der Datensammelwut des Netzwerks aus Palo Alto zu entkommen. Boykis gibt sich und uns da keinen Illusionen hin. Es ist allerdings durchaus besser, immer wieder daran erinnert zu werden, was mit preisgegebenen Daten geschehen kann. Insofern dürfen wir uns jetzt alle besser informiert fühlen.
Wer übrigens viel mit Messengern arbeitet und ständig Bilder hochlädt, könnte vielleicht einmal intensiver darüber nachdenken, dass Whatsapp und Instagram ebenfalls Facebook gehören.
Noch mehr Informationen gibt es auf Vicki Boykis Github-Blog. Dort hat Boykis auch sämtliche Quellen verlinkt. Die Diskussion zum Beitrag findet auf Hacker News statt und ist, trotz des brisanten Themas, doch überraschend flach.
ad „Was können wir tun“:
Auch wenn nicht jeder auf Facebook verzichten will (ich selbst halte mich bewusst fern), so wäre es doch z. B. schon hilfreich, wenn unsere öffentlich-rechtlichen Anstalten, für die wir Bürger Zwangsabgaben leisten, nicht noch Facebook ständig fördern, indem sie am Ende einer TV-Sendung erwähnen, dass sie auf Facebook erreicht werden können, oder sogar ein Link eingeblendet wird. Diese (mutmaßlich kostenlose) Werbung bringt Facebook zusätzliche Glaubwürdigkeit. Einerseits gibt es hin und wieder kritische Sendungen zu Facebook zu sehen, andererseits steht dem das viel häufigere, völlig konträre, unterstützende Verhalten pro Facebook gegenüber – aus meiner Sicht ein Skandal.