Webanalyse datenschutzkonform betreiben: Google Analytics anonymisieren
Webanalyse-Tools zeigen, wie viele Besucher auf einer Website
vorbeikommen, was sie sich anschauen, wie sie dorthin gefunden haben
oder in welcher Stadt sie gerade vor dem PC sitzen. Welche Daten
überhaupt erhoben und wie diese verwendet werden dürfen, ist für das Web
im Telemediengesetz (TMG) [1] geregelt. Der Düsseldorfer Kreis machte in einem Beschluss [2] vom November 2009 verbindliche Vorgaben für Webanalyse-Tools, die Google nicht erfüllte.
Anonymität ist Trumpf
Das TMG erlaubt Analysen für Werbung, Marktforschung oder bedarfsgerechte Gestaltung des Webauftritts, wenn die Daten pseudonymisiert beziehungsweise anonymisiert verwendet werden. Diese allgemeine Vorgabe hat der Düsseldorfer Kreis für Webanalyse in seinem Beschluss konkretisiert.
Im Beschluss der Datenschützer wird die IP-Adresse als personenbezogen definiert – das heißt, dass man sie einer natürlichen Person zuordnen kann. Damit gilt die IP-Adresse eben nicht als pseudonym, Seitenbetreiber dürfen sie aus diesem Grund nur mit Einverständnis des Nutzers erfassen. Liegt keine Einverständniserklärung vor, muss man die IP-Adresse anonymisieren, also um ihre letzte Stelle kürzen.
Google Analytics erfasst die IP-Adresse allerdings standardmäßig immer vollständig – genau das ist der Stein des Anstoßes. Nun hat der Dienst die Funktion „anonymizeIp“ nachgerüstet, um der Forderung des Düsseldorfer Kreises nachzukommen. Allerdings nimmt Google Analytics die Anonymisierung nicht automatisch vor. Seitenbetreiber müssen den Trackingcode anpassen, das heißt die Funktion also aktiv einbinden, um Google Analytics datenschutzkonform einsetzen zu können.
Beschnittene IP-Adressen
Webanalyse-Tools bestimmen anhand der IP-Adresse den Provider beziehungsweise den Zugangspunkt des Besuchers zum Internet – im Idealfall kann man so den Wohnort erkennen. Durch das Entfernen der letzten Stelle kann die IP-Adresse nicht mehr genau verortet werden. 255 IP-Adressen werden jetzt einem einzigen Ort zugerechnet.
Bezogen auf Länderebene funktioniert die Zuordnung recht genau. Allerdings war die Auswertung auch vorher mit Vorsicht zu genießen. Bei Zugriffen über Firmennetzwerke oder das Mobilnetz kann der Ort häufig nicht genau anhand der IP-Adresse bestimmt werden.
Die IP-Kürzung hat glücklicherweise keine Auswirkung auf die Berechnung der Visits, da diese anhand von Cookie-Daten arbeitet. Die Daten vor und nach der Umstellung bleiben somit vergleichbar. Auch sonst speichert Google Analytics sämtliche Daten – etwa Inhalte, Kampagnen, Referrer und interne Suche – wie bisher.
AnonymizeIP
Um die IP-Adresse zu kürzen und damit zu anonymisieren, hat Google die Funktion anonymizeIp [3] eingeführt. Diese muss man dem Trackingcode auf den Webseiten hinzufügen. Aktuell sind zwei Varianten des Trackingcodes gebräuchlich:
- Klassisch: pageTracker._trackPageview()
- Asynchron: _gaq.push([‚_trackPageview‘])
Die asynchrone Variante ist inzwischen die Voreinstellung bei neuen Analytics-Profilen. Beide Codes können mit der neuen Funktion ausgestattet werden. Der alte urchinTracker-Code unterstützt die Anonymisierung nicht.
Bei der klassischen Version wird der Aufruf zwischen Initialisierung und dem eigentlichen Tracking gesetzt („_gat._anonymizeIp();“).
Synchroner Analytics-Code mit Anonymisierung
<script type="text/javascript"> var gaJsHost = (("https:" == document.location.protocol) ? "https://ssl." : "http://www."); document.write(unescape("%3Cscript xsrc='" + gaJsHost + "google-analytics.com/ga.js' type='text/javascript'%3E%3C/script%3E")); </script> <script type="text/javascript"> var pageTracker = _gat._getTracker("UA-XXXXXX-X"); pageTracker._initData(); _gat._anonymizeIp(); pageTracker._trackPageview(); </script>
Listing 1
Die Funktion muss der Betreiber auf allen Seiten im Analytics-Trackingcode ergänzen. Für den asynchronen Tag genügt ebenfalls das hinzufügen einer Zeile JavaScript-Code.
Asynchroner Analytics-Code mit Anonymisierung
<script type="text/javascript"> var _gaq = _gaq || []; _gaq.push(['_setAccount', 'UA-XXXXXX-X']); _gaq.push(['_gat._anonymizeIp']); _gaq.push(['_trackPageview']); (function() { var ga = document.createElement('script'); ga.type = 'text/javascript'; ga.async = true; ga.src = ('https:' == document.location.protocol ? 'https://ssl' : 'http://www') + '.google-analytics.com/ga.js'; var s = document.getElementsByTagName('script')[0]; s.parentNode.insertBefore(ga, s); })(); </script>
Listing 2
Die Funktion bewirkt in beiden Fällen, dass beim Tracking-Aufruf ein weiterer Parameter übergeben wird.
Mit diesem Parameter erkennt Google Analytics, dass es die IP-Adresse des Besuchers nicht in vollständiger Form verarbeiten soll. Einen Kritikpunkt hat die Lösung: Die IP-Adresse wird erst nach der Übertragung zu Google gekürzt. Da die Adresse für die Datenübermittlung benötigt wird – wie für jede Datenübertragung im Internet – lässt sich eine Anonymisierung im Vorfeld mit JavaScript nicht umsetzen. Will man sichergehen, dass die IP-Daten gar nicht erst zu Google gelangen, kann man ein Proxyscript oder einen Proxyserver verwenden [4].
Du möchtest auch nach dem Umstieg auf Google Analytics 4 die besten KPI erzielen? Mit unserem Deep Dive werden deine Trackingstrategien zukunftssicher!
Widerspruch möglich machen
Trotz einer Anonymisierung der erfassten Daten muss der Nutzer laut TMG aber auch der Erstellung von Nutzungsprofilen – also dem Tracking insgesamt – widersprechen können.
Google hat sich hier eine Lösung per Browser-Plugin ausgedacht. Wenn der Nutzer dieses Plugin installiert, kann er damit das Google-Analytics-Tracking unterbinden. Vorteil dieser Lösung ist, dass der Nutzer der Erfassung nur einmal widersprechen muss und nicht auf jeder Website einzeln. Der Nachteil besteht darin, dass das Plugin bisher nur für den Internet Explorer, Firefox und Chrome erhältlich ist und die Installation entsprechende Systemrechte erfordert. Am Firmenarbeitsplatz fehlen dem einfachen Nutzer diese Berechtigungen meistens.
Alternativ kann der Website-Betreiber mit JavaScript eine eigene Opt-out-Lösung bauen. Zum Beispiel kann er auf seiner Website eine Checkbox in der Datenschutzerklärung einbauen. Widerspricht der Besucher der Erhebung, wird ein Cookie gesetzt. Wenn dieser Cookie vorhanden ist, wird der Trackingcode nicht ausgeführt [5].
Informationspflichten
Wenn durch Webtracking Nutzungsprofile erstellt werden, muss man den Besucher laut TMG darüber informieren, dass man trackt, was genau man trackt, welchem Zweck dieses Tracking dient und wie der Erhebung widersprochen werden kann. Wenn man Google Analytics einsetzt, verlangt Google zusätzlich, dass man einen in den Google-AGBs vorgegebenen Text auf seiner Website einbindet. Dieser Text informiert über die Art des Trackings. Google behält sich übrigens das Recht vor, die Einbindung durch einen Bot zu prüfen. Fehlt er, untersagt Google die Nutzung.
Dieser Google-Text enthält jedoch keinen Hinweis auf die Anonymisierung oder Widerspruchsmöglichkeit. Diesen Passus muss der Website-Betreiber selber ergänzen. Ein Beispiel für eine solche Ergänzung findet sich bei [6].
Die Daten in Google Analytics sind nun anonymisiert, der Besucher ist informiert, die Widerspruchsmöglichkeit ist gegeben. Damit die Nutzerprofile auch anonym bleiben, untersagt das TMG die Zusammenführung der Pseudonyme mit personenbezogenen Daten. Man darf zum Beispiel nicht die Daten aus einer Shopbestellung mit den Nutzungsdaten aus Google zusammenführen. Google untersagt eine derartige Kombination auch nochmal in den eigenen AGBs (Punkt 8.1).
Man muss also nicht nur aufpassen, wie getrackt wird, sondern auch was. Bei allen personenbezogenen Daten gilt übrigens immer, dass mit der aktiven Einwilligung des Besuchers die Erfassung erlaubt ist.
Datenschutz-Check |
|
Fazit
Dank der neuen Features können Website-Betreiber Google Analytics wieder ohne Bedenken einsetzen, wenn sie die genannten Anpassungen umsetzen. Eine offizielle Prüfung und Stellungnahme der Datenschutzbehörden zu den Neuerungen steht allerdings noch aus. Da Google das Thema nun aber ernst nimmt, ist bei erneuter Kritik mit weiteren Nachbesserungen zu rechnen.
alt aber gut zusammengefasst!
Ich hab weitere Codebespiele, unter anderem zum Proxyscript, auf meinen Blog gestellt
http://www.econtrolling.de/datenschutz-google-analytics/
Sehr gut beschrieben. Wenn ich das richtig sehe ist in den Codes, die Analytics aktuell ausliefert die Anonymisierung schon drin, oder?