Warum Big Data eine neue Kulturtechnik zum Umgang mit Daten erfordert: Die Macht der Algorithmen
Nie haben Menschen so viele und so diverse Daten produziert: Das Smartphone weiß, wo wir sind, wohin wir gehen, wie schnell wir gehen und wohin wir uns drehen. Wer eine Nachrichten-Seite aufruft, bringt Algorithmen auf Trab: In Millisekunden errechnen sie, wer vor dem Bildschirm sitzt, welche Anzeige mich interessieren soll und wer am meisten dafür bezahlt. Sensoren im Auto protokollieren Temperatur, Verschleiß und Verbrauch. Krankenhäuser, Schulen, Flugzeuge – die digital vernetzte Gesellschaft sammelt Daten, erzeugt Daten, atmet Daten. Diese Datenmassen können die Menschheit nach vorn bringen – oder enorme Probleme verursachen. Wenn wir die Potenziale nutzen und die Risiken minimieren wollen, müssen wir einiges anders machen.
Um aus den Datenbergen Informationen zu schürfen, haben wir Menschen uns mächtige Werkzeuge geschaffen. So durchsuchen zum Beispiel Algorithmen die Rohdaten nach Mustern und filtern: Welche deiner Milliarden gespeicherten Webseiten, liebes Google, passt am besten zu meinen drei Suchwörtern? Muss der Kaufhaus-Kunde an der Kasse eine PIN eingeben, liebes Kreditkarten-System, oder reicht uns seine Unterschrift, die uns billiger kommt, aber ein höheres Ausfallrisiko bedeutet? Bei welchen Zahlungsmustern sperren wir die Kreditkarte, weil wahrscheinlich ein Betrug vorliegt? Diese Fragen beantwortet der Computer stets nach dem gleichen Prinzip: Zunächst bringen ihm Menschen bei, welche Ergebnisse erwünscht sind. Für jedes neu eintreffende Datum wird anschließend eine Wahrscheinlichkeit errechnet, mit der es in eine Kategorie passt.
Big Data eröffnet nie gekannte Möglichkeiten
Mit diesen Datentechnologien sind großartige Sachen möglich. Wissenschaftler füttern Computer mit 100 Millionen Zeitungsartikeln und können sehen, wo wahrscheinlich demnächst eine Staatskrise ausbricht [1] ; Polizisten in Großbritannien lassen Rechner Kriminalstatistiken durchforsten und sehen, wo wahrscheinlich bald Verbrechen geschehen [2] ; Forscher werfen Algorithmen hunderttausende Übersetzungen von UNO und EU vor und bringen Computern das Dolmetschen bei – live und in der Stimme des Sprechers [3].
Neu an Big Data ist aber vor allem, dass wir so viele Informationen über uns selbst hinterlassen. Soziale Netzwerke, Mobilfunk-Daten, Krankenakten, Einkäufe und Tweets bilden ein globales Nervensystem, das von uns unbemerkt sehr viel über uns verrät: Vorlieben, Verhalten, Pläne. Denn in den Mustern der Vergangenheit können Computer auch die Zukunft sehen. Aus Suchanfragen wie „Hartz IV“, „Arbeitsamt“ und „Jobvermittlung“ kann Google Arbeitsmarktzahlen genauer prognostizieren als jede Behörde. Aus Mobilfunk-Daten ist es ein leichtes, Wohnung, Arbeitsplatz und Hausarzt herauszulesen, natürlich mit genauen Abfahrts- und Ankunftszeiten. So wusste die Supermarktkette Target [4], dass eine junge Kundin schwanger ist, noch bevor ihr Vater es wusste – einfach weil die Frau kaufte, was zuvor Frauen gekauft hatten, die anschließend Windeln kauften, sprich: die Kinder bekommen hatten. Wir Menschen sind leichter auszurechnen, als wir glauben.
Besser Regieren mit Echtzeit-Daten?
Das wollen natürlich auch Staaten für sich nutzen. Mit Kommunikationsdaten, Mail-Verkehr und Telefonaten lassen sich Gesellschaften sezieren. Zwielichtige Firmen wie Gamma und Trovicor verkaufen noch zwielichtigeren Staaten die Technik dafür: Wer sind die Anführer der Opposition? Wie sind sie mit ihren Gefolgsleuten verbunden? Welche Verbindung muss man kappen? Vorratsdatenspeicherung, Bestandsdatenabfrage, Videoüberwachung: Auch demokratische Staaten scheinen von der Vorstellung beseelt, vernetzte Gesellschaften ließen sich mit Daten und Algorithmen steuern – live und per Mausklick.
Skeptische Bürger bekommen eine Beruhigungspille verschrieben, der Wirkstoff heißt meist Anonymisierung [5]. Sind Name und Geburtsdatum erstmal aus den Datenbergen getilgt, so die Annahme, kann niemand mehr Daten und Mensch zusammenbringen. Doch das ist falsch. Wiederholt haben Unternehmen und Wissenschaftler bewiesen, dass es nur weniger Zusatzinformationen bedarf, um den Daten wieder einen Namen zu geben [6].
Forderung: Transparenz für Daten und Algorithmen
Es gibt unzählige Befürchtungen, die sich an die geheime und stille Macht der Algorithmen knüpfen. Sie werden gebündelt in einer Forderung: Transparenz. Natürlich werden Algorithmen von Menschen geschrieben. Doch genau deshalb können die Filter auch bestimmt sein von Vorurteilen, falschen Annahmen sowie von persönlichen und geschäftlichen Interessen. Und wenn nicht einmal mehr die Betreiber von Werbe-Netzwerken sagen können, wie ihre Algorithmen auf die Idee kommen, da säße jetzt gerade ein Frau zwischen 28 und 30 vor dem Rechner, die gern rote Schuhe trägt und schwanger ist – wie sollen wir Versicherungen, Banken, Behörden und Medien trauen, die uns mit einschneidenden Entscheidungen konfrontieren, die in letzter Konsequenz nicht Menschen, sondern Computer getroffen haben? Wenn eine Gesellschaft allein für die Fusionskontrolle von Medien ganze Behörden und Gesetze geschaffen hat, sollte es selbstverständlich sein, zu erfahren, wer nach welchen Kriterien die Nachrichten und Suchergebnisse auswählt, die unser Weltbild bestimmen. In der neuen EU-Datenschutzverordnung sollte eine Hinweispflicht festgeschrieben werden: Achtung, hier wurde durch Algorithmen gefiltert. Hier ist übrigens der Schalter, mit dem sie den Filter abschalten oder verändern können.
Wissen ist das Öl des 21. Jahrhunderts: Big Data muss Open Data sein
In einer Wissensgesellschaft muss der wichtigste Rohstoff gleicher verteilt sein. Es kann nicht sein, dass allein Staaten und Unternehmen das oft zitierte „Öl des 21. Jahrhunderts“ horten und nach geheimen Rezepten auswerten. Staaten und Konzerne müssen öffentlich finanzierte Daten nach dem Open-Data-Prinzip allen zur Verfügung stellen und personenbezogene Daten ebenso den betreffenden Personen. Denn ein komplexes System kann sich nur selbst regulieren, wenn alle Einheiten die Aufgaben übernehmen, die sie am besten lösen können. Dazu brauchen Bürger Zugang zu Daten und den Filtern, sie zu durchsuchen.
Hier ist die Stelle, an der wir ein altes Prinzip des deutschen Datenschutzes begraben müssen: die Zweckbestimmung. Heute dürfen Daten nur für jenen Zweck verwendet werden, für den sie auch erhoben wurden. Das ist heute schon kaum mehr durchzusetzen und wird mit Big Data unmöglich. Auch können Algorithmen ihre Magie nur entfalten, wenn Datensätze miteinander kombiniert werden können, die bis dahin niemand in Zusammenhang gebracht hat.
Der Umgang mit Algorithmen und Daten: eine neue Kulturtechnik
Um die Bürger wieder in die Nähe ihres Rechts auf informationelle Selbstbestimmung zu bringen, ist es wichtig, dass alle Spuren, die sie hinterlassen, auch von ihnen gespeichert werden. Alle Amazon-Käufe, Freundeslisten, Suchanfragen und Mobilfunk-Daten beispielsweise sollten auf meinem Rechner liegen. Wer sie von seinen Algorithmen durchforsten lassen möchte, muss fragen und bekommt eventuell eine Freigabe.
Um im Zeitalter der Algorithmen autonom zu bleiben, müssen die Menschen sich aus ihrer selbstverschuldeten Unmündigkeit befreien. Wer nicht weiß, wo im Browser der Cookie-Schalter ist und was er bewirkt, hat sein Daten-Einmaleins nicht gelernt. Auch Bürger können nicht weitermachen wie bisher und müssen ihr Verhältnis zu Daten und Algorithmen ändern: Sie müssen die passive Rolle derer verlassen, die nur Objekt staatlicher und privater Daten-Jongleure sind. Sie müssen sich ihre Daten aktiv zu eigen machen. Kinder müssen programmieren lernen, weil Algorithmen nur verändern kann, wer sie versteht. Menschen müssen wissen wollen, wie Technik funktioniert, denn der Umgang mit Daten und Algorithmen ist eine neue Kulturtechnik. Lesen, Schreiben, Rechnen, Coden. Viel Arbeit, sicher. Aber es lohnt sich.