Was verbirgt sich hinter den Begrifflichkeiten und welche Herausforderungen sowie Chancen ergeben sich beim richtigen Umgang mit großen Datenmengen für Unternehmen? Oliver Schröder setzt sich mit Herausforderungen und Lösungsansätzen im Zeitalter von Big Data auseinander.
Das neue Zeitalter digitaler Kommunikation lässt sich unter dem Schlagwort Big Data wohl am besten verorten. Big Data beschreibt nicht nur die Ansammlung immer größerer Datenmengen, einer sozusagen stetig steigenden Datenflut, der Unternehmen ausgesetzt sind. Big Data steht gerade auch für den Umgang mit bzw. die Sammlung, Nutzung, Verwertung, Vermarktung und vor allem Analyse digitaler Daten. Big Data beschreibt somit einen kompletten Prozess, der untrennbar mit den Begriffen Data Governance und Datenmanagement verbunden ist. Doch was verbirgt sich hinter den Begrifflichkeiten und welche Herausforderungen sowie Chancen ergeben sich beim richtigen Umgang mit großen Datenmengen für Unternehmen?
Data Governance beschreibt Unternehmensstrukturen, mit klar definierten Dateninhabern, Richtlinien, Regeln, Prozessen, Geschäftsbegriffen und Kriterien für den gesamten Lebenszyklus von Daten. Angefangen bei der Sammlung, Speicherung, Nutzung, Schutz, Archivierung bis hin zum Löschen von Daten. Data Governance (DG) dreht sich um das Management der Verfügbarkeit, Benutzerfreundlichkeit, Integrität und Sicherheit von Daten, die in einem Unternehmen genutzt werden. Ein vollständiges Data-Governance-Programm sollte ebenso über ein Organ bzw. einen Rat in Form einer Kontrollinstanz verfügen wie über definierte Verfahren und einen Plan, diese Verfahren umzusetzen und deren Einhaltung zu gewährleisten.
Datenmanagement hingegen ist die rein technische Umsetzung von Data Governance. Data Governance steht sozusagen für die Blaupause eines Gebäudes, während Datenmanagement die physische Konstruktion des Gebäudes darstellt. Ohne Datenmanagement gibt es somit keine Data Governance und umgekehrt.
Data Governance – Herausforderungen und Lösungsansätze
Zu den größten Herausforderungen und Lösungsansätzen für Unternehmen im Bereich Data Governance gehören neben dem Faktor Mensch vor allem klare Richtlinien und Regeln sowie definierbare Messgrößen und Indikatoren beim Umgang mit Daten.
Faktor Mensch: Menschen sind ein kritischer Faktor bei der Verwaltung von Daten. Der Grund: Sie sind diejenigen, die die Daten erzeugen, verarbeiten, verwalteten, auswerten und letztendlich von den Informationen profitieren. Beispiele sind die Fachexperten in Unternehmen, die sowohl standardisierte Geschäftsbedingungen für das Unternehmen als auch die für verschiedene Geschäftsprozesse erforderlichen Qualitätsstufen festlegen. Datenbeauftragte sind dafür verantwortlich, Datenschutzprobleme zu erkennen und zu beseitigen. IT-Mitarbeiter kümmern sich um die Architektur und das Management von Datenbanken, Anwendungen und Geschäftsprozessen. Das Augenmerk der Rechts- und Sicherheitsbeauftragten wiederum liegt auf dem Datenschutz. Funktionsübergreifende Führungskräfte, die dem Governance Board oder Rat angehören, müssen Streitigkeiten zwischen verschiedenen Abteilungen bzw. Funktionen innerhalb eines Unternehmens lösen. Eine klare, transparente Rollen- und Aufgabenverteilung von Rechten, Pflichten und Zuständigkeiten minimiert den Faktor Mensch als kritischen Faktor bei der Datenverwaltung.
Richtlinien und Regeln: Wenn Richtlinien das „Was“ definieren, so bestimmen Regeln das „Wie“. Unternehmen verwenden eine Vielzahl verschiedener Richtlinien und Regeln für Prozesse und Verfahren. Zu den gängigen Kategorien gehören Zustimmungs-, Qualitäts-, Speicherungs- und Sicherheitsrichtlinien. Beispielsweise gibt es Bestimmungen, die besagen, dass die Zustimmung zur Datenverarbeitung erst eingeholt werden muss, bevor personenbezogene Daten überhaupt verwendet werden dürfen. Oder Regeln, die Zustimmungsoptionen – wie die Weitergabe von Daten an Dritte – definieren und bei der erstmaligen Erfassung personenbezogener Daten vom Dateninhaber erst freigegeben werden müssen. Weitere Regeln können beispielsweise definieren, dass der Dateninhaber der Nutzung für Marketingzwecke zustimmt und erst dann ein Werbeangebot an einen Kunden gesendet werden darf. Die Einbeziehung des Dateninhabers in Richtlinien- und Regelkompetenzen und letztliche Entscheidungsprozesse kann einen deutlichen Mehrwert hinsichtlich der Unternehmenstransparenz und Kundenzufriedenheit bieten.
Messgrößen und Indikatoren: Was messbar ist, lässt sich auch verwalten. Zu den gängigen technischen Messwerten zählen unter anderem die Anzahl an doppelten Datensätzen, ihre Genauigkeit und Vollständigkeit oder die Anzahl an verschlüsselten oder maskierten Elementen bei personenbezogenen Informationen. Während diese Art von Kennzahlen bei der Verwaltung enorm hilfreich sind, versuchen Unternehmen auch zu definieren, wie sich diese technischen Indikatoren auf die Geschäftsergebnisse auswirken. Beispielsweise wird die „Days Sales Outstanding (DSO)“ bzw. Forderungslaufzeit von Finanzanalysten und Kreditgebern verwendet, um die finanzielle Vitalität eines Unternehmens zu analysieren. Sind die Adressdaten des Kunden unvollständig oder ungenau, verlängert sich der Abrechnungszyklus und es erhöht sich somit die Forderungslaufzeit. Wenn diese über dem Branchendurchschnitt liegt, könnten Analysten und Kreditgeber dies als Zeichen des Risikos sehen und den Finanz-Ausblick des Unternehmens senken. Es ist somit ratsam, interne Compliance-Richtlinien auch für Messgrößen einzuführen und sich so gegen geschäftskritische Auswirkungen abzusichern.
Datenmanagement – Herausforderungen und Lösungsansätze
Doch nicht nur im Bereich Data Governance sehen sich Unternehmen mit neuen Herausforderungen und Chancen konfrontiert, auch beim Datenmanagement gibt es bei der Bereinigung, Pflege und Standardisierung von Datensätzen sowie der Verschlüsselung und Archivierung bis hin zum ordnungsgemäßen Löschen der Daten einiges zu beachten.
Bereinigung, Pflege und Standardisierung von Daten helfen bei der Implementierung und Durchsetzung von Datenschutzrichtlinien. Klare Prozessdefinitionen ermöglichen, die Gültigkeit, Genauigkeit und Vollständigkeit der Daten mit den festgelegten Qualitätsmerkmalen zu vergleichen. Probleme wie ungültige oder fehlende Werte sowie falsche Schreibweisen lassen sich so beheben. Auch sogenannte Bereinigungsregeln sind bereits bei der erstmaligen Speicherung eingebettet, um die festgelegte Datenqualität zu gewährleisten. Das Leistungsprofil hilft, Ähnlichkeiten, Unterschiede und Beziehungen zwischen Daten zu identifizieren und diese letztlich nutzbar zu machen. So lassen sich doppelte Strukturen ausschließen und ein echter Mehrwert aus Big Data ziehen. Interne Informationen lassen sich auch beispielsweise mit externen Daten wie DUNS-Nummern, demographischen oder geografischen Daten anreichern. Viele Unternehmen schaffen auch einen zentralen Knotenpunkt, um die semantische Konsistenz von Stammdaten über eine Vielzahl verschiedener Datenquellen hinweg aufrechtzuerhalten.
Maskierung und Verschlüsselung von Daten helfen ebenfalls dabei, Datenschutzbestimmungen umzusetzen. Tools und Techniken zur Datenermittlung und -klassifizierung identifizieren sensible, personenbezogene Daten und kennzeichnen sie als schutzbedürftig. Grundlage dafür sind interne Anforderungen und externe Vorschriften wie die DSGVO. So können beispielsweise je nach Klassifizierung und Zugriffsrichtlinien einige Benutzer berechtigt sein, auf die Rohdaten zuzugreifen, während die Daten bei der Abfrage für andere Benutzer dynamisch maskiert werden.
Diese sogenannte Datenmodellierung hilft dabei zu verstehen, wie Daten gesammelt, verarbeitet, gespeichert und geteilt werden, sowohl intern als auch extern. Auf dieser Grundlage lassen sich geeignete Schutzkontrollen für Klassifizierungs- und Datenschutzrichtlinien festlegen. Beispielsweise kann die Datenmaskierung für den Zugriff innerhalb einer Firewall ausreichen, bevor sie an Dritte außerhalb des Unternehmens gesendet werden, müssen sie jedoch verschlüsselt werden.
Archivierung und Löschen von Daten sind weitere Grundlagen bei der Umsetzung von Datenspeicher- und Vorhalterichtlinien. Informationen werden archiviert, sobald sie nicht mehr aktiv für den laufenden Betrieb notwendig, aber dennoch zur Erfüllung regulatorischer Anforderungen unerlässlich sind. Datenarchivierungstools verfolgen, wie lange sie aufbewahrt werden sollten und indexieren die Informationen für einen leichteren Abruf bei Zugriffs- und Datenmaskierungsverschlüsselungskontrollen. Nach Ablauf der vorgesehenen Aufbewahrungsfrist werden die Daten dauerhaft gelöscht. Auch wenn dies oberflächlich betrachtet einfach erscheint, ist es in der Praxis eine komplexe Aufgabe, die Aufbewahrungspflichten von Branchenvorschriften (wie BCBS 239 und CCAR) gegen die Löschanforderungen von staatlichen und regionalen Vorschriften (wie GDPR und CCPA) abzuwägen. Wer sich als Unternehmen hier verkalkuliert, riskiert einen Schaden in mehrfacher Hinsicht. Zum einen beträchtliche Geldstrafen bei Verstößen gegen die DSGVO. Zum anderHerausforderungen und Lösungsansätze im Zeitalter von Big Datan einen Wettbewerbsnachteil durch eine mangelhafte Nutzung von Datensätzen aufgrund fehlerhafter Archivierung.
Data Governance und Datenmanagement: Chancen erkennen und nutzen
Im Zeitalter von Big Data sind intelligente Lösungsansätze notwendig, um sich bietende Chancen für das richtige und nachhaltige Datenmanagement auf Grundlage schlüssiger Data Governance-Richtlinien zu ergreifen. Data Governance und Datenmanagement erfüllen zwar verschiedene Aufgaben, verfolgen jedoch die gleichen Ziele: Eine solide, vertrauenswürdige Datengrundlage zu schaffen, die es Unternehmen und Mitarbeitern erlaubt, auf Basis von Daten die bestmögliche Arbeit zu leisten – die sowohl den Ansprüchen der Kunden als auch jenen des Gesetzgebers entspricht.