Die Data Governance ist die Data Management Disziplin, die sich auf die Qualität, die Datensicherheit und die Verfügbarkeit der Daten eines Unternehmens konzentriert. Die Data Governance trägt zur Gewährleistung der Datenintegrität und der Datensicherheit bei, indem Richtlinien, Standards und Verfahren für die Erfassung, das Eigentum, den Speicher, die Verarbeitung und die Nutzung von Daten definiert und implementiert werden.
Das Ziel von Data Governance ist es, sichere, qualitativ hochwertige Daten zu erhalten, die für Datenerkennung und Business-Intelligence-Initiativen leicht zugänglich sind. Die Data-Governance-Funktion funktioniert ähnlich wie ein Luftverkehrskontrollzentrum und stellt sicher, dass verifizierte Daten durch gesicherte Pipelines zu vertrauenswürdigen Endgeräten und Benutzern fließen.
Künstliche Intelligenz (KI), Big Data und digitale Transformation sind die wichtigsten Treiber für Data-Governance-Programme. Da das Datenvolumen aus neuen Datenquellen wie den Technologien des Internets der Dinge (IoT) immer weiter zunimmt, müssen Unternehmen ihre Vorgehensweise bei der Datenverwaltung überdenken, um ihre Business Intelligence (BI) zu skalieren.
Data-Governance-Programme können Unternehmen helfen, große Datenmengen zu schützen und zu verwalten, indem sie die Datenqualität verbessern, Silos reduzieren, Compliance- und Sicherheitsrichtlinien durchsetzen und den Datenzugriff angemessen verteilen.
Data Governance ist ein Teilbereich des Data Managements, die die übergreifende Praxis der sicheren und effizienten Erfassung, Verarbeitung und Nutzung von Daten zur Unterstützung der strategischen Entscheidungsfindung und zur Verbesserung der Geschäftsergebnisse darstellt.
Data Management umfasst nicht nur Data Governance, sondern auch andere Bereiche des Lebenszyklus von Daten, wie Datenverarbeitung, Datenspeicher und Datensicherheit. Außerdem beeinflussen sich die verschiedenen Aspekte des Datenverwaltungsprozesses gegenseitig.
Da sich diese anderen Bereiche der Datenverwaltung auf die Data Governance auswirken können, müssen verschiedene Teams zusammenarbeiten, um eine Data-Governance-Strategie zu entwickeln und zu verfolgen.
Ein Data-Governance-Team könnte zum Beispiel Gemeinsamkeiten zwischen unterschiedlichen Datensätzen identifizieren. Wenn sie diese Daten integrieren möchten, arbeiten sie in der Regel mit einem Datenverwaltungsteam zusammen, um das Datenmodell und die Datenarchitektur zu definieren, die diese Verknüpfungen ermöglichen.
Ein weiteres Beispiel ist der Datenzugriff, bei dem ein Data-Governance-Team die Richtlinien für den Zugriff auf bestimmte Datentypen festlegen kann, z. B. personenbezogene Daten (PII). Anschließend stellt ein Datenverwaltungsteam diesen Zugriff direkt bereit oder erstellt den Mechanismus, um diesen Zugriff zu ermöglichen, häufig über die rollenbasierte Zugriffssteuerung (RBAC).
Ein Data-Governance-Framework beschreibt die Strukturen und Prozesse eines Unternehmens zur Verwaltung kritischer Daten-Assets. Es definiert die Eigentumsrechte und Verantwortlichkeiten für die Daten und legt fest, wie mit den Daten umgegangen werden soll, um die Datenqualität, Sicherheit und Compliance zu gewährleisten.
Es gibt kein allgemeingültiges Framework, da Frameworks in der Regel maßgeschneiderte Roadmaps für die einzigartigen Datensysteme, Datenquellen, Branchenprotokolle und behördlichen Vorschriften eines bestimmten Unternehmens sind.
Data Governance Frameworks befassen sich in der Regel mit folgenden Punkten:
Data Governance Programme definieren in der Regel ein bestimmtes Ziel oder eine Reihe von Zielen, z. B. die Verbesserung der Datenqualität, die Unterstützung der Einhaltung von Vorschriften oder die Ermöglichung einer datengesteuerten Entscheidungsfindung. Sie wählen auch Metriken aus, um den Fortschritt in Richtung dieser Ziele zu messen. Zu den wichtigsten Governance-Metriken gehören unter anderem:
Reduzierung von Datenfehlern und Redundanzen.
Kostensenkungen durch höhere Effizienz und kürzere Markteinführungszeiten.
Datenkonsistenz und -vollständigkeit.
Niveau der Datenkompetenz und der Prozess-Compliance der Mitarbeiter.
Governance Programme definieren auch die Rollen und Verantwortlichkeiten aller Beteiligten: Lenkungsausschuss, Dateneigentümer, Data Stewards und Stakeholder.
Frameworks legen Parameter für die zu verwaltenden Daten und die gewünschten Ergebnisse fest. Dazu gehören Richtlinien für Datenformate, Datenmodelle, Master Data Management (MDM), Metadaten, Benennungskonventionen und mehr.
Governance-Frameworks bilden häufig Datenflüsse ab und definieren, wie Daten erfasst, gespeichert, verschoben und archiviert werden. Sie könnten auch die Hardware, Software und Dienste identifizieren, die die Governance-Bemühungen und die umfassendere Datenarchitektur des Unternehmens unterstützen.
Einige Governance-Frameworks können Datenbereiche definieren, bei denen es sich um Zugriffsparameter für bestimmte Datenbestände wie Stammdaten, Metadaten und historische Daten handelt. Ein Datenumfang kann dazu beitragen, dass Benutzer und Apps nur auf die Daten zugreifen können, die sie benötigen, und niemand auf Daten zugreifen kann, die er nicht sehen sollte.
Governance-Frameworks beschreiben Test-, Prüfungs- und Aufzeichnungsverfahren, um die Transparenz und Erklärbarkeit des Governance-Programms zu gewährleisten.
Regelmäßige Audits können dazu beitragen, die Einhaltung des Data-Governance-Frameworks durch die Benutzer zu überprüfen. Audits können auch dazu beitragen, Wege zu finden, wie das Governance-Programm weiterentwickelt werden muss, um neuen Daten, Prozessen oder Technologien Rechnung zu tragen.
Schließlich können Audits Unternehmen auch dabei helfen, Compliance-Vorschriften einzuhalten und dies nachzuweisen.
Technologie spielt eine wichtige Rolle bei einer effektiven Data Governance. Die Tools zur Data Governance in Unternehmen können von umfassenden Plattformen bis hin zu spezialisierten Einzellösungen reichen. Unternehmen wählen je nach ihrer individuellen Datenarchitektur und ihren Governance-Frameworks unterschiedliche Tools aus.
Zu den üblichen Funktionen von Data-Governance-Lösungen gehören:
Automatisches Erkennen und Klassifizieren von Daten.
Durchsetzung von Datenschutzregeln und rollenbasierten Zugriffskontrollen.
Erfüllung von Datenschutz- und Compliance-Anforderungen.
Automatisierung der Metadatenverwaltung, Datenkatalogisierung und Datenabstammungsverfolgung.
Unterstützung für ein Unternehmensglossar.
Data Governance Lösungen können verschiedene Datenformate verarbeiten. Einige bieten Visualisierungsfunktionen, um das Verständnis komplexer Datensätze und Zusammenhänge zu verbessern und die Identifizierung von Trends, Sonderfällen und Bereichen, die besonderer Aufmerksamkeit bedürfen, zu erleichtern.
Die Umsetzung eines starken Data Governance Frameworks kann Unternehmen dabei helfen, eine Vielzahl von Vorteilen zu realisieren:
Unternehmen können keine effektiven Geschäftsentscheidungen treffen, wenn diese Entscheidungen auf fehlerhaften Daten basieren. Data Governance kann dazu beitragen, die Integrität, Genauigkeit, Vollständigkeit und Konsistenz von Daten sicherzustellen, indem ein Framework geschaffen wird, das eine solide Datenverwaltung und einen starken End-to-End-Datenverwaltungsprozess unterstützt.
Vertrauenswürdige Daten helfen Unternehmen, neue Möglichkeiten zu entdecken, ihre Kunden und Workflows besser zu verstehen und die allgemeine Unternehmensleistung zu optimieren.
Eine mangelnde Data Governance kann zu Fehlern bei den Leistungsmetriken führen, die ein Unternehmen in die falsche Richtung lenken, während Data-Governance-Tools dabei helfen können, Ungenauigkeiten zu beheben, bevor sie die Geschäftsstrategie beeinflussen.
Beispielsweise können Datenabstammungstools Dateneigentümern dabei helfen, Daten während ihres Lebenszyklus zu verfolgen, einschließlich aller Transformationen, die die Daten während der Prozesse des Extrahierens, Transformierens und Ladens (ETL) oder des Extrahierens, Ladens und Transformierens (ELT) durchlaufen. Auf diese Weise können Unternehmen die Ursache von Datenfehlern identifizieren und beheben.
Wenn der Datenzugriff in einem Unternehmen eingeschränkt ist, kann dies die Innovation behindern, Abhängigkeiten von Fachexperten schaffen und Geschäftsprozesse verlangsamen.
Programme zur Data Governance verteilen den Datenzugriff angemessen, sodass jede Abteilung oder Einzelperson nur auf die Daten zugreifen kann, die sie benötigt. Dadurch können funktionsübergreifende Teams enger und effizienter zusammenarbeiten und gleichzeitig die Datensicherheit gewährleisten.
Ein ordnungsgemäß verwaltetes Datensystem kann eine Single-Source-of-Truth (SSOT) für das gesamte Unternehmen sein. Die Entscheidungsfindung kann verbessert werden, wenn alle Parteien mit denselben Datensätzen arbeiten.
Die Zentralisierung von Datendefinitionen und Metadaten in einem einzigen Datenkatalog kann dazu beitragen, Verwirrung und Ineffizienz zu reduzieren. Diese Dokumentation wiederum bildet die Grundlage für Self-Service-Lösungen, die unternehmensweit konsistente Daten und einen konsistenten Datenzugriff ermöglichen.
Die Data Governance-Richtlinien umfassen häufig Maßnahmen zur einfacheren Einhaltung gesetzlicher Vorschriften zum Schutz sensibler Daten und zum Datenschutz, wie etwa der Datenschutz-Grundverordnung (DSGVO) der EU, dem US-amerikanischen Health Insurance Portability and Accountability Act (HIPAA) und Branchenanforderungen wie den Payment Card Industry Data Security Standards (PCI DSS). Verstöße gegen diese gesetzlichen Anforderungen können hohe Regierungsbußgelder und öffentliche Reaktionen nach sich ziehen.
Data-Governance-Tools helfen Unternehmen dabei, Verhaltensregeln festzulegen, die Datenschutzverletzungen verhindern können. Governance-Frameworks helfen beim Aufbau von Datensystemen, die klar, erklärbar, fair und inklusiv sind. Diese Datensysteme wiederum schützen die Privatsphäre und die Sicherheit und erhalten die Kundentreue und das Kundenvertrauen aufrecht.
In einer IDC-Umfrage gaben nur 45,3 % der Befragten an, dass sie über „Regeln, Richtlinien und Prozesse zur Durchsetzung ihrer verantwortungsvollen KI-Grundsätze“ verfügen, um sich vor Sicherheitsverletzungen, Haftungsfragen, offengelegten Kundendaten und regulatorischen Risiken zu schützen.1
Data Governance bedeutet, den Ursprung, die Vertraulichkeit und den Lebenszyklus aller Daten zu verstehen, die ein Unternehmen verwendet. Dies ist die Grundlage für jede KI-Governance und von entscheidender Bedeutung für die Minderung verschiedener Unternehmensrisiken.
Data Governance hilft Unternehmen dabei, hochwertige Daten in KI- und ML-Initiativen einzubringen und gleichzeitig diese Daten zu schützen und die relevanten Regeln und Vorschriften einzuhalten. Zum Beispiel können Governance-Tools dabei helfen, sicherzustellen, dass sensible personenbezogene Daten nicht an eine KI weitergegeben werden, wenn dies nicht der Fall sein sollte.
Die richtigen Daten sind die Grundlage für fortgeschrittene Datenanalysen und Data-Science-Initiativen. Sorgfältig verwaltete Daten ermöglichen wertvolle Initiativen wie Business-Intelligence-Berichte oder komplexere Projekte für maschinelles Lernen (ML).
Beispielsweise kann eine ordnungsgemäße Profilerstellung von Daten – die Überprüfung und Bereinigung von Daten, um ihre Struktur besser zu verstehen – dazu beitragen, die Beziehung zwischen verschiedenen Datensätzen und Quellen besser zu verstehen.
Initiativen zur Data Governance können bei der Umsetzung auf viele Hürden stoßen. Zu diesen Herausforderungen gehören:
Effektive Programme zur Data Governance erfordern in der Regel Unterstützung auf zwei Ebenen: von Führungskräften und einzelnen Mitwirkenden. Chief Data Officers (CDOs) und Data Stewards sind für die Kommunikation und Priorisierung von Data Governance innerhalb eines Unternehmens von entscheidender Bedeutung.
CDOs können die Aufsicht über alle Datenteams übernehmen und deren Rechenschaftspflicht durchsetzen, um sicherzustellen, dass Richtlinien für die Data Governance eingehalten werden. Data Stewards können dazu beitragen, das Bewusstsein für diese Richtlinien bei Datenproduzenten und Datennutzern zu schärfen, um die Einhaltung von Vorschriften im gesamten Unternehmen zu fördern.
Ohne eine angemessene Förderung sind sich Datennutzer möglicherweise der Governance-Richtlinien nicht bewusst oder kümmern sich nicht darum. Dies kann zu Verstößen, mangelnder Datenintegrität und einer Gefährdung der Datensicherheit führen.
Ohne die richtigen Tools und die richtige Datenarchitektur können Unternehmen Schwierigkeiten haben, ein effektives Data-Governance-Programm zu implementieren.
Zum Beispiel könnten Teams redundante Daten in verschiedenen Funktionen entdecken. Um eine effektive Steuerung zu ermöglichen, müssen Data Architects geeignete Datenmodelle und Datenarchitekturen entwickeln, um Daten über Speichersysteme hinweg zusammenzuführen und zu integrieren.
Teams müssen möglicherweise auch einen Datenkatalog erstellen, um eine Bestandsaufnahme der Datenbestände innerhalb eines Unternehmens zu erstellen. Oder wenn sie bereits einen solchen Katalog haben, müssen sie möglicherweise einen Prozess für die Metadatenverwaltung erstellen, der sicherstellt, dass die zugrundeliegenden Daten relevant und aktuell sind.
Data Governance, insbesondere in hybriden und Multicloud-Umgebungen, umfasst oft Daten, die in verschiedenen Formaten bei verschiedenen Anbietern und an verschiedenen Standorten gespeichert sind. Darüber hinaus können sich die Daten in verschiedenen Arten von Datenspeichern befinden, z. B. in Data Lakes, Data Lakehouses und Data Warehouses.
Schatten-IT kann dem Prozess einen zusätzlichen Strich durch die Rechnung machen. In einer TechTarget-Studie wurde als zweithäufigstes Problem für die Datensicherheit genannt, dass sich Mitarbeiter ohne Zustimmung der IT-Abteilung für Cloud-Anwendungen und -Services anmeldeten.2
Diese Verteilung von Daten kann es erschweren, Datenflüsse und Datennutzung zu verfolgen und zu überwachen. Data Governance erfordert ein klares Verständnis von Datenquellen, Zielen, Transformationen, Abhängigkeiten, Eigentum, Zugriffsrechten und Verantwortlichkeiten.
Die Durchsetzung von Data-Governance-Richtlinien in mehreren Umgebungen erfordert möglicherweise die Koordination zwischen verschiedenen Stakeholdern, wie Dateneigentümern, Datenverwaltern, Datennutzern und Datenaufsichtsbehörden.
Der Aufstieg von Self-Service-Analysen und Business Intelligence stellt die Data Governance vor neue Herausforderungen.
Zugriffsanfragen von mehr Benutzern gehen schneller ein als zuvor, aber die Governance-Teams müssen Geschwindigkeit und Zugänglichkeit mit Datenschutz- und Sicherheitsbedenken in Einklang bringen. Darüber hinaus müssen Systeme und Verfahren für das Streaming von Daten genau abgestimmt werden, um Datenverlust zu vermeiden.
Bei der Bereitstellung der Daten, die das KI-Training und den KI-Betrieb antreiben, versagen viele Datenspeicherungs- und Governance-Tools.
Schließlich ist KI von Natur aus komplexer als standardmäßige IT-gesteuerte Prozesse und Funktionen, was eine aktive und fundierte Data Governance umso wichtiger macht. Ein KPMG-Bericht hebt die Defizite in der KI-Governance als eines der größten Risiken hervor, die Unternehmen derzeit bedrohen.3 Zum Beispiel könnte KI ohne angemessene Schutzmaßnahmen versehentlich sensible personenbezogene Daten oder Unternehmensgeheimnisse preisgeben.
Um KI-Risiken und -Komplexitäten zu reduzieren, können Unternehmen KI-optimierte Datenspeicherfunktionen mit Data-Governance-Programmen kombinieren, die unter Berücksichtigung von KI entwickelt wurden.
Die Planung und Erstellung eines Data-Governance-Frameworks erfordert Zeit und Mühe über mehrere Stakeholder und Teams hinweg. Zu den gängigen Praktiken, die Unternehmen bei der Umsetzung von Governance-Programmen anwenden, gehören:
Die Automatisierung bestimmter Teile des Data-Governance-Prozesses kann dazu beitragen, die Effizienz zu verbessern und Fehler zu reduzieren. Tools für die Data Governance und Datenverwaltung können bei der Automatisierung von Routineaufgaben helfen, wie z. B:
Starke Datensicherheit und Zugriffskontrollen sind für jedes Data-Governance-Framework von grundlegender Bedeutung. Gleichzeitig möchten Unternehmen, dass der Datenzugriff für Personen mit der Berechtigung, bestimmte Datensätze einzusehen und zu verwenden, so reibungslos wie möglich verläuft. Ohne diesen einfachen Zugriff auf Self-Service-Informationen werden Zusammenarbeit und neue Erkenntnisse behindert.
Viele Unternehmen haben aufgrund mangelnder Transparenz Schwierigkeiten bei der Verwaltung ihrer Daten. Ein zentraler Datenkatalog kann als Single-Source-of-Truth (SSOT) fungieren und Initiativen zur Datenintegration und Governance ermöglichen.
Laut einem Gartner-Bericht steigt die Nachfrage nach Datenkatalogen, da Unternehmen Schwierigkeiten haben, verteilte und unterschiedliche Daten-Assets zu finden, zu inventarisieren und zu analysieren. Mit einem soliden Datenkatalog können Unternehmen Informationen leichter in großem Maßstab auffinden und klassifizieren, was eine bessere Durchsetzung von Data-Governance-Richtlinien ermöglicht.
Viele Unternehmen finden es hilfreich, eine klare Governance-Roadmap zu erstellen. Reifegradmodelle können diese Roadmap bereitstellen.
Ein Data-Governance-Reifegradmodell ist ein Instrument, das Unternehmen dabei unterstützt, den aktuellen Stand ihres Data-Governance-Programms einzuschätzen, Ziele zu definieren und Fortschritte im Laufe der Zeit zu verfolgen.
Unternehmen können regelmäßige Bewertungs- und Berichterstellungsmechanismen einrichten, um Daten und Governance-Metriken im Zeitverlauf zu überwachen. Diese Bewertungen können dem Unternehmen helfen, Probleme zu erkennen und Verbesserungen an Governance-Prozessen vorzunehmen.
Durch die regelmäßige Überprüfung des Frameworks und dessen Anpassung auf der Grundlage von Feedback, neuen Vorschriften oder Änderungen der Geschäftsstrategie bleibt das Framework relevant und wirksam.
Darüber hinaus können Bewertungen eine Kultur fördern, die Daten als strategischen Vermögenswert wertschätzt und eine effektive Business Intelligence und Datennutzung im gesamten Unternehmen unterstützt.
1 IDC MarketScape: Worldwide AI Governance Platforms 2023 Vendor Assessment, IDC, 2023.
2 The Need for Data Compliance in Today’s Cloud Era, Enterprise Strategy Group von TechTarget, April 2023 (PDF).
3 Top risk forecast, KPMG, 2024.
Schaffen Sie eine Grundlage an verwalteten Daten, um Datenergebnisse zu beschleunigen und Datenschutz- und Compliance-Anforderungen zu erfüllen.
Bereiten Sie sich auf das EU-Gesetz zur künstlichen Intelligenz vor und etablieren Sie mithilfe von IBM Consulting einen verantwortungsvollen KI-Governance-Ansatz.
Entdecken Sie Data-Governance-Software für Ermittlung, Qualität und Schutz.