Data Mesh: Eine neue Ära der Datenarchitektur
Um Daten strategisch zu nutzen und über alle Bereiche hinweg relevante Erkenntnisse zu gewinnen, braucht es eine standardisierte Datenarchitektur.
Während die meisten Organisationen bislang auf zentrale Datenverwaltung setzten, bietet Data Mesh einen neuen, verteilten Ansatz, der Mitarbeitenden ihre Datenhoheit zurückgibt und dezentrale Verantwortlichkeiten schafft.
Zentral vs. dezentral
Mit dem weltweiten Datenwachstum steigen auch die Anforderungen an deren Verwaltung. Unternehmen setzen dabei auf unterschiedliche Systeme, um ihre Daten zu speichern, zu sammeln und zu verwalten. Denn ein System allein ist oft nicht ausreichend, um die verschiedenen Anforderungen an Zugriff, Nutzung und Analytics zu erfüllen. Daher kommen häufig mehrere Datenbanken, Data Lakes und/oder Data Warehouses zum Einsatz. Das sorgt für eine hohe Komplexität.
Datenmanagement-Konzepte wie Data Fabric bringen durch einen zentralen Zugriffspunkt Ordnung in diese komplexe Datenlandschaft. Denn Data Fabric verbindet mehrere Datenquellen, die darauf laufenden Technologien wie BI- und Analytics-Tools und verschiedene Cloud- und On-Premises-Umgebungen miteinander. Einen alternativen Ansatz bietet das Data Mesh Konzept. Es handelt sich dabei um eine neuartige Methode, die sich nicht nur auf die Verwaltung von Daten beschränkt, sondern auch soziotechnische Faktoren, wie die Datendemokratisierung berücksichtigt.
Die vier Erfolgsprinzipien
Im Gegensatz zur zentralisierten Datenverwaltung bietet Data Mesh eine verteilte Architektur, in der die Anwender näher an ihren Daten sein sollen und dafür Mitverantwortung tragen. Dies ermöglicht Mitarbeitenden ohne technischen Hintergrund, Erkenntnisse aus den für sie relevanten Daten zu generieren. Die Erfinderin dieses Ansatzes, Zhamak Dehghani, hat vier Prinzipien definiert, die für den Erfolg von Data Mesh entscheidend sind:
Datendomänen
Klar definierte Datendomänen, die die Verantwortung für die Verwaltung, Verarbeitung und Nutzung ihrer Daten übernehmen, sind Voraussetzung für eine dezentrale Architektur. Sie spiegeln in der Praxis meist die bereits bestehenden Abteilungen wider – vom Marketing über HR bis hin zum Vertrieb – in denen Datenspezialisten die domänenspezifischen Daten für die Abteilungen verwalten und Zugriff gewähren.
Data-as-Product
Der Data Mesh-Ansatz betrachtet Daten als Produkte (Datenprodukte), auf die Kunden (Datennutzer) zugreifen. Die genannten Datenspezialisten sind für die Datenprodukte der Domäne verantwortlich.
Self-Service-Datenplattform
Zugriff auf diese Datenprodukte erhalten die Mitarbeitenden über eine Self-Service-Datenplattform. Diese liefert einfachen Zugang und erlaubt selbstständige Analysen und Verwendung, ohne dass ein zentraler IT-Spezialist involviert sein muss.
Föderale Governance
Data Mesh setzt auch beim Thema Governance auf einen dezentralen, föderalen Ansatz. Neben Regelungen auf Domänenebene gibt die Architektur jedoch auch globale Richtlinien vor, die alle Domänen einhalten müssen.
Laut einer PwC-Studie erkennen zunehmend mehr Unternehmen die Vorteile der dezentralisierten Datenverwaltung und integrieren diese in ihre zukünftigen Strategien. Unterstützt wird diese Entwicklung dadurch, dass technologische Fortschritte wie künstliche Intelligenz und maschinelles Lernen dazu beitragen, dass Datenprodukte effizienter und in höherer Qualität erstellt werden.
Warum Unternehmen auf Data Mesh setzen
Obwohl die Implementierung dieser Prinzipien eine Mammutaufgabe ist, lohnt sich der Umstieg durch die zahlreichen Vorteile, die der Ansatz mit sich bringt:
- Effizienzsteigerung durch schnelleren Datenzugriff
Durch die dezentrale Verteilung von Daten und die Entkoppelung von Systemen wird der Zugriff auf Daten schneller und effizienter. Mitarbeitende können auf die für sie relevanten Daten direkt zugreifen und müssen nicht auf die Zulieferung durch eine zentrale Datenabteilung warten. Dadurch können Prozesse beschleunigt und Entscheidungen schneller getroffen werden.
- Skalierbarkeit und Flexibilität
Data Mesh ist sehr flexibel und kann zügig an die Bedürfnisse des Unternehmens angepasst werden. Neue Datenquellen und -anwendungen können schneller integriert werden, ohne dass die gesamte Architektur umgebaut werden muss. Dadurch wird die Skalierbarkeit der Dateninfrastruktur erhöht und das Unternehmen kann sich rasch an veränderte Anforderungen anpassen.
- Mehr Beteiligung der Mitarbeitenden
Mitarbeitende werden stärker in den Datenprozess einbezogen. Sie haben direkten Zugriff auf die Daten, die sie benötigen, und können diese selbstständig auswerten und analysieren. Dadurch wird die Datendemokratisierung gefördert.
- Verbesserte Datenqualität und Sicherheit
In einem Data Mesh-System erkennen und beheben Unternehmen Probleme in ihren Daten schneller, da sie nicht auf das gesamte System übertragen werden, sondern lokaler verwaltet werden. Außerdem erhöht sich die Datensicherheit, da ein Ausfall oder ein Angriff auf ein System nicht auf das gesamte Unternehmen übergeht.
Die erfolgreiche Implementierung
Data Mesh erfordert eine umfassende Vorbereitung und Anpassung der Organisation. Wenn es um den Faktor Mensch geht, ist der erste Schritt, das Top-Management ins Boot zu holen. Die Führungsebene muss die Vorteile von Data Mesh verstehen, um den Wandel innerhalb des Unternehmens zu unterstützen und Mitarbeitende aufzuklären. Je nach Fortschritt der Datendemokratisierung, ist ein regelrechter Kulturwandel für die Förderung der Zusammenarbeit und des Wissensaustausches zwischen den Teams nötig.
Weiterhin muss das Unternehmen die Datendomänen klar definieren und dokumentieren, um Verantwortlichkeiten und Zuständigkeiten zu schaffen. Grundlage dafür ist eine Data Mesh-Strategie, die Ziele, Handlungsfelder und Prinzipien im Einklang mit der Unternehmensstrategie vorgibt. Die Implementierung von Data Mesh benötigt auch eine Anpassung der Dateninfrastruktur und der Tools, die eine dezentrale Datenverwaltung ermöglichen. Hier sollten Unternehmen sicherstellen, dass die richtigen Technologien, wie beispielsweise Analytics-Tools und die passenden Cloud-Computing Plattformen, verfügbar sind, um die Zusammenarbeit und die Qualitätssicherung zu unterstützen. Datensicherheit und Datenschutz sind ebenfalls wichtige Faktoren, die berücksichtigt werden sollten, da eine dezentrale Datenverwaltung und die Aufteilung von Daten in Datendomänen bedeuten, dass einzelne Teams einen direkten Zugriff auf bestimmte Daten haben, die nicht für andere Gruppen bestimmt sind.
ist Chief Technology Officer (CTO) und Technologie-Vorstand von Exasol.