Anzeige
Anzeige
Ratgeber

Was sind eigentlich synthetische Daten und welchen Nutzen haben sie?

Echte Innovation braucht Daten. Die Herausforderung dabei ist der datenschutzkonforme Umgang. Die Regeln ändern sich immer mal wieder – was auch bereits erhobene Daten unbrauchbar machen kann. Eine mögliche Lösung: der Einsatz von synthetischen Daten.

Von Omar Ali Fdal
3 Min.
Artikel merken
Anzeige
Anzeige

Synthetische Daten können das Risiko für Datenschutzverstöße signifikant senken. (Foto: dpa)

Den Schutz von Daten zu gewährleisten, ist notwendig und abdingbar. Denken wir zurück an die Zeit vor Inkrafttreten der Datenschutz-Grundverordnung (DSGVO) am 25. Mai 2018 glich die Verwendung von persönlichen Daten oft einem Wild-Western-Film. Seitdem hat sich einiges getan, gleichzeitig sind viele Entwicklungen und Reglementierungen noch immer in der Schwebe, so schnell wird keine Ruhe einkehren. Zuletzt gab auch die britische Regierung bekannt, dass sie an einer eigenen Version arbeiten wolle.

Anzeige
Anzeige

Das lässt viel Raum für Unsicherheiten im Umgang mit persönlichen Daten, DSGVO-Bußgelder können schließlich schnell exorbitant hoch sein: Im März 2022 wurden zum Beispiel 1.030 Bußgelder mit mehr als 1,6 Milliarden Euro verhängt.

Mehr Gleichheit durch Reglementierung

Dabei sorgen die neuen Reglementierungen endlich auch für mehr Kontrolle über die eigenen persönlichen Daten. Wo gerade für führende Digitalunternehmen vor der DSGVO das Sammeln und Nutzen von Daten fast schon in “Freiwildmanier” geschah, müssen auch sie nun Strafen befürchten. Und die sind nicht gerade knapp bemessen, denn die verhängten Bußgelder richten sich auch nach dem Umsatz des Unternehmens.

Anzeige
Anzeige

Besonders komplex wird es für Unternehmen, die in mehreren Ländern ansässig sind und daher verschiedenen Rechtsordnungen unterliegen: Wer auf globaler Ebene mit Daten arbeitet, sieht sich hier schnell mit einer großen Herausforderung konfrontiert. Und da sowohl internationale Gremien in der EU als auch nationale Gremien auch in Zukunft weiterhin datengetriebene Geschäftsmodelle regulieren werden, etwa durch Digitalstrategien und die geplante E-Privacy-Verordnung, ist es auch nötig, sich immer auf dem Laufenden zu halten, was jüngste Entwicklungen angeht.

Doch nicht nur die DSGVO macht es Datenprojekten mitunter schwer: Aufgrund von Talentdefiziten, ungewissem ROI, Datenverfügbarkeit, Inkonsistenz oder voreingenommenen Datensätzen sind diese oft schon zum Scheitern verurteilt, bevor sie überhaupt beginnen können.

Anzeige
Anzeige

Synthetische Daten als mögliche Lösung

Die benötigten Daten müssen dabei zwar belastbar sein und sinnvoll für die Auswertung – aber eigentlich keineswegs echt. Stattdessen können sogenannte synthetische Daten eine Lösung sein, die sowohl die eben genannten Defizite ausgleichen und zeitgleich das Risiko für Datenschutzverstöße signifikant senken. Sie sind das Ergebnis künstlicher Datenerzeugung, wobei der neue Datensatz dabei der Qualität seiner Originaldaten ähnelt und deren statistische Verteilung beibehält, aber eben ohne Personenbezug. Das heißt, synthetische Daten sehen aus wie echte personenbezogene Daten und verhalten sich auch so.

Synthetische Daten können auf zwei Arten erstellt werden:

  1. Auf Grundlage des bisherigen Wissens – wenn die Gesetze bekannt sind, die dem Modell zugrunde liegen, können diese genutzt werden, um neue Daten zu erzeugen und zu simulieren. Wenn bekannt ist, dass in dem Datensatz beispielsweise weibliche Kunden über 20 mit bestimmten Merkmalen enthalten sind, kann dieses Wissen genutzt werden, um Datenpunkte künstlich zu simulieren.
  2. Oder direkt aus den realen Daten, was in der Regel durch Algorithmen des maschinellen Lernens oder der künstlichen Intelligenz erreicht wird, die die Verteilungen und Beziehungen innerhalb des ursprünglichen Datensatzes lernen. Sobald die Beziehungen gelernt sind, können die neuen Datensätze erstellt werden.

Trotz ihrer künstlichen Erzeugung müssen die Daten natürlich realistisch sein: Künstliche Daten, die nicht den Originaldaten entsprechen, sind für die Analyse nicht geeignet.

Anzeige
Anzeige

Besonders im Finanz-, Versicherungs-, Gesundheits- und Telekommunikationssektor gibt es diverse Anwendungsfälle solcher Daten. Sie zeigen eine steigende Akzeptanz synthetischer Daten während der letzten Jahre.

Ohne Daten geht es nicht mehr

Eines dürfte klar sein: Unternehmen sind auf enorm große Datenmengen angewiesen. Und diese können, selbst wenn sie zuvor korrekt und gewissenhaft erhoben wurden, in den Händen der falschen Leute Schaden anrichten. Cyberangriffe und Datenpannen (intern wie extern) können ein fatales Ausmaß annehmen, gerade wenn riesige Mengen an personenbezogenen Daten gespeichert sind. Dieses Ausmaß kann mit synthetischen Daten deutlich kleiner gehalten werden.

Synthetische Daten treffen auch bei Analystinnen und Analysten auf Zuspruch: In den nächsten zwei Jahren werden etwa 60 Prozent der Daten, die für die Entwicklung von KI- und Analyseprojekten verwendet werden, synthetisch generiert sein – so prognostiziert es Gartner. Gleichzeitig kürte das renommierte Innovationsmagazin MIT Technology Review die Technologie jüngst zu einer der 10 Breakthrough-Technologies 2022.

Mehr zu diesem Thema
Fast fertig!

Bitte klicke auf den Link in der Bestätigungsmail, um deine Anmeldung abzuschließen.

Du willst noch weitere Infos zum Newsletter? Jetzt mehr erfahren

Anzeige
Anzeige
Schreib den ersten Kommentar!
Bitte beachte unsere Community-Richtlinien

Wir freuen uns über kontroverse Diskussionen, die gerne auch mal hitzig geführt werden dürfen. Beleidigende, grob anstößige, rassistische und strafrechtlich relevante Äußerungen und Beiträge tolerieren wir nicht. Bitte achte darauf, dass du keine Texte veröffentlichst, für die du keine ausdrückliche Erlaubnis des Urhebers hast. Ebenfalls nicht erlaubt ist der Missbrauch der Webangebote unter t3n.de als Werbeplattform. Die Nennung von Produktnamen, Herstellern, Dienstleistern und Websites ist nur dann zulässig, wenn damit nicht vorrangig der Zweck der Werbung verfolgt wird. Wir behalten uns vor, Beiträge, die diese Regeln verletzen, zu löschen und Accounts zeitweilig oder auf Dauer zu sperren.

Trotz all dieser notwendigen Regeln: Diskutiere kontrovers, sage anderen deine Meinung, trage mit weiterführenden Informationen zum Wissensaustausch bei, aber bleibe dabei fair und respektiere die Meinung anderer. Wir wünschen Dir viel Spaß mit den Webangeboten von t3n und freuen uns auf spannende Beiträge.

Dein t3n-Team

Melde dich mit deinem t3n Account an oder fülle die unteren Felder aus.

Bitte schalte deinen Adblocker für t3n.de aus!
Hallo und herzlich willkommen bei t3n!

Bitte schalte deinen Adblocker für t3n.de aus, um diesen Artikel zu lesen.

Wir sind ein unabhängiger Publisher mit einem Team von mehr als 75 fantastischen Menschen, aber ohne riesigen Konzern im Rücken. Banner und ähnliche Werbemittel sind für unsere Finanzierung sehr wichtig.

Schon jetzt und im Namen der gesamten t3n-Crew: vielen Dank für deine Unterstützung! 🙌

Deine t3n-Crew

Anleitung zur Deaktivierung
Artikel merken

Bitte melde dich an, um diesen Artikel in deiner persönlichen Merkliste auf t3n zu speichern.

Jetzt registrieren und merken

Du hast schon einen t3n-Account? Hier anmelden

oder
Auf Mastodon teilen

Gib die URL deiner Mastodon-Instanz ein, um den Artikel zu teilen.

Anzeige
Anzeige