Data-Mesh: Gelingt so die Datenarchitektur der Zukunft?
Wenn es um die Bedeutung von Daten geht, stehen zwei Dinge außer Frage: Die Menge wird sich stetig vergrößern und sie sind längst ein geschäftskritisches Gut. Um unternehmensweit relevante Erkenntnisse aus Daten gewinnen zu können und diese strategisch für das Wachstum einzusetzen, sind eine standardisierte Struktur und definierte Prinzipien zum Umgang mit Daten unerlässlich. Kurz gesagt: eine sinnvoll organisierte Datenarchitektur. Sie sorgt dafür, dass Prozesse reibungslos laufen, Daten zugänglich sind und Compliance-Richtlinien eingehalten werden.
Organisationen müssen sich für die für sie passende Architektur entscheiden: Data-Lake, Data-Warehouse, Data-Fabric – Unternehmen haben mittlerweile die Qual der Wahl, wenn es um ihr Datenmanagement geht.
Einen neuartigen Ansatz rund um Datenverwaltung und -verteilung bietet Data-Mesh. Das geht sogar noch einen Schritt über die Verwaltung von Daten hinaus: Data-Mesh ist ein soziotechnischer Ansatz, der Mitarbeitende dazu ermächtigt, ihre Daten selbst zu analysieren und zu verwalten.
Wohin mit den Daten?
Grundsätzlich gilt: Für das erfolgreiche Datenmanagement ist eine übergeordnete Datenarchitektur vonnöten. Sie definiert, wie Daten erfasst, gespeichert, verwaltet und verwendet werden und legt Standards für die Interaktion verschiedener Systeme fest. Eine gut konstruierte Datenarchitektur führt zu einer verbesserten Datenqualität und schafft Transparenz im Umgang mit Daten.
Unternehmen verfügen oft über unterschiedliche Datenquellen. Die Klassiker der Datenverwaltung sind hier Data-Warehouses, die es bereits in den späten 1980er Jahren gab. Dort werden die aufbereiteten Daten leicht zugänglich, wie in einem „Warenlager“, aufbewahrt. Sie finden Verwendung in der Berichterstattung und Entscheidungsfindung mithilfe von Data-Science- und Business-Intelligence (BI)-Anwendungen. Das übliche Daten-Setup von Unternehmen besteht in diesem Falle aus einer leistungsstarken Datenbank, einem oder mehreren darauf aufbauenden Data-Warehouses, integrierten Analyse-Tools und -Dashboards sowie unter Umständen KI/ML-Tools.
Mit dem weltweiten Datenwachstum stiegen auch die Anforderungen. Mitte der 2000er erschienen daher Data-Lakes auf die Bildfläche. Dort können Unternehmen alle Arten von Daten in großen Mengen speichern. Die Daten sind dabei weder aufbereitet noch sortiert – sie schwimmen in einem „Datensee“ und dienen vor allem der Datensicherung und -wiederherstellung sowie fortgeschrittenen Analysen, die eine große Anzahl Rohdaten benötigen.
Beide Datenverwaltungssysteme können aufgrund der unterschiedlichen Funktionen für sich allein stehen oder gleichzeitig Teil einer Datenarchitektur sein.
Data-Mesh: Was steckt dahinter?
Datenarchitekturen können wiederum in zwei Arten eingeteilt werden: zentral oder dezentral. Data-Fabric stellt eine zentrale Herangehensweise dar, die die Datenverwaltung unabhängig vom Speicherort möglich macht. Das „Datengewebe“ verbindet Daten aus Cloud und On-Premises-Umgebungen.
Durch die zentrale Verwaltung entsteht allerdings auch eine Diskrepanz zwischen dem Ort, an dem die Daten erstellt werden, und dem Ort, an dem sie genutzt werden. IT-Datenspezialisten haben dabei oft die Datenhoheit, da diese direkt bei den Daten „sitzen“, die sich in Data-Warehouses oder Data-Lakes befinden. Die eigentlichen Datenkonsumenten – die Personen, die Schlüsse aus ihren eigenen Daten ziehen wollen – befinden sich jedoch in einem anderen Unternehmenssilo und haben so keinen direkten Zugriff.
Der Data-Mesh-Ansatz liefert hier eine Alternative: Er ermöglicht eine dezentralisierte und verteilte Architektur, in der Datenkonsumenten näher an ihren Daten sind. Dadurch ermächtigt er Mitarbeitende ohne technischen Background dazu, Erkenntnisse aus den für sie relevanten Daten zu generieren. Damit das gelingt, definiert die Erfinderin des Data-Mesh-Ansatzes, Zhamak Dehghani, vier Prinzipien:
- Datendomänen: Voraussetzung für eine dezentrale Architektur sind klar definierte Datendomänen und damit einhergehende Verantwortlichkeiten. Die Domänen sind dabei in modernen Unternehmen oft schon in Form von Abteilungen vorhanden. Durch Data-Mesh übernehmen sie – von der Buchhaltung über Sales bis hin zum Marketing – die Verantwortung für ihre eigenen Daten.
- Data-as-Product: Ein Kernprinzip von Data-Mesh ist die Klassifizierung von Daten als ein Produkt mit bestimmten Attributen, sogenannte „Datenprodukte“. Die sollen dabei den Bedürfnissen der „Kunden“ (Konsumenten) entsprechen.
- Self-Service: Damit Mitarbeitende auf die für sie relevanten Datenprodukte in ihrer Domäne zugreifen können, ist eine Self-Service-Infrastruktur vonnöten. Sie bietet über eine einfach zu bedienende Plattform eine Schnittstelle für das gesamte Unternehmen.
- Governance: Trotz der unabhängigen Domänen, Teams und Datenprodukte müssen diese interoperabel sein. Damit das gelingt, ist ein einheitliches Governance-Modell nötig, das zentrale, globale Leitlinien für die Entscheidungsbefugnis definiert. Gleichzeitig existieren auf Domänenebene eigene, föderierte Regeln.
Data-Mesh stellt durch diese Prinzipien einen kulturellen Wandel dar, der nicht nur technische, sondern auch soziale Komponenten enthält. Eine aktuelle PwC-Studie zeigt auf: Nur in acht Prozent der befragten Unternehmen haben alle Mitarbeitenden die Möglichkeit, eigenständig Datenanalysen zu erstellen.
Data-Mesh macht genau das möglich und trägt so zu einer echten Demokratisierung der Daten und der Etablierung einer Datenkultur bei. Dazu gehören außerdem die Schulung der Mitarbeitenden hinsichtlich Datenkompetenz sowie der Zugang aller zu den für sie relevanten, richtigen Daten.
Data-Mesh erfolgreich implementieren
Viele Unternehmen erkennen bereits die Vorteile von Data-Mesh. Laut der PwC-Studie haben 36 Prozent das Konzept diskutiert und planen, es zu implementieren. 32 Prozent wollen einzelne Elemente einführen. Da es sich nicht nur um die Einführung technischer Komponenten handelt, sondern um eine unternehmerische „Datentransformation“, sollte man folgendes beachten:
- Data-Mesh-Strategie entwickeln: Bei jeder Transformation gilt: Die Strategie kommt zuerst. Im Einklang mit den Unternehmenszielen und der allgemeinen Datenstrategie sollten für die Einführung von Data-Mesh Handlungsfelder, Ziele und Prinzipien definiert werden.
- Vorhandene Technologie überprüfen: Grundlage für eine dezentrale Datenverarbeitung ist ein sehr leistungsfähiges zentrales System, das verschiedene Zugriffe verarbeiten kann. Bevor Data-Mesh implementiert werden kann, sollten die vorhandenen Technologien wie Datenbanken und Data-Warehouses daher auf Leistung, Flexibilität und Skalierbarkeit geprüft werden.
- Führungsteam mit ins Boot holen und Mitarbeitende informieren: Um Data-Mesh in großem Umfang erfolgreich einzuführen, müssen Fehlinformationen aus dem Weg geräumt werden. Wichtiges Puzzleteil ist dabei die Führungsebene, die dafür sorgen kann, unternehmensweit ein besseres Verständnis dafür zu entwickeln.
- Data-Mesh-Prinzipien einführen: Sobald die Strategie und die Technologie definiert und bereit sind, gilt es, das Fundament zu bauen. Das bedeutet, Datendomänen abzugrenzen, diese Teams mit Datenspezialisten entsprechend aufzustellen, Mitarbeitende zu schulen und zentrale Governance-Richtlinien zu entwickeln.
- Analytics bereitstellen: Sind die Grundlagen für Data-Mesh gelegt, folgt die Einführung von fortgeschritteneren Funktionen wie DataOps oder Advanced Analytics, um möglichst viel Nutzen aus der Architektur zu ziehen.
Durch die dezentrale Datenverwaltung einerseits und eine starke zentrale Steuerung zur Kontrolle der Compliance andererseits bietet Data-Mesh das Beste aus beiden Welten und ermöglicht den Anwendern, das Potenzial ihrer Daten besser auszuschöpfen. Vor allem Unternehmen, die über eine vielfältige Datenlandschaft mit verschiedenen Geschäftsbereichen verfügen, können hier profitieren.