Veröffentlicht: 5. April 2024
Mitwirkende: Tim Mucci, Cole Stryker
Unter Datenintegrität versteht man die Gewissheit, dass die Daten eines Unternehmens zu jedem Zeitpunkt ihres Lebenszyklus korrekt, vollständig und konsistent sind. Zur Wahrung der Datenintegrität gehört der Schutz der Daten eines Unternehmens vor Verlust, Datenlecks und schädigenden Einflüssen.
Unternehmen verlassen sich auf saubere Daten, wenn es darum geht, Entscheidungen zu treffen, das Verbraucherverhalten vorherzusagen, Markttrends einzuschätzen und sich gegen Datenschutzverletzungen zu schützen. Da das Datenvolumen in den Unternehmen in die Höhe schießt und diese Daten dazu verwendet werden, Entscheidungen über die Zukunft des Unternehmens zu treffen, wird die Maximierung der Datenintegrität immer wichtiger.
Um die Datenintegrität zu erreichen, halten sich Unternehmen an Prozesse wie Fehlerprüfungen, Validierungsverfahren und strenge Sicherheitsmaßnahmen wie Verschlüsselung, Zugriffskontrolle und Backups. Ziel der Datenintegrität ist es, sicherzustellen, dass Datenanalysen auf zuverlässigen Informationen basieren, die von regulatorischen Rahmenbedingungen wie der DSGVO unterstützt werden – und dass vertrauliche Informationen vor unbefugtem Zugriff oder unbefugter Ausnutzung geschützt sind.
Datenintegrität ist nicht auf ein einzelnes Tool oder eine einzelne Plattform beschränkt. Vielmehr handelt es sich um einen umfassenden Ansatz, der die kollektiven Bemühungen der technologischen Infrastruktur eines Unternehmens, die Richtlinien und die Personen, die mit dem Datensystem arbeiten, einbezieht, um zu gewährleisten, dass die Daten ein zuverlässiges Gut bleiben.
Forrester Consulting führte eine IBM-gestützte Total Economic Impact™-Studie durch. Laden Sie den Bericht herunter, um herauszufinden, welchen potenziellen Return-on-Investment Unternehmen mit IBM Datenverwaltung erzielen können.
Datenintegrität ähnelt der Qualitätskontrolle in traditionellen produktorientierten Unternehmen und stellt sicher, dass das Rohmaterial korrekt, sicher und für den vorgesehenen Verwendungszweck geeignet ist.
Die Abhängigkeit von guten Daten bei Geschäftsanalysen, Kundeninteraktionen und Compliance unterstreicht die Bedeutung der Datenintegrität im gesamten Unternehmen. Das Sprichwort „Garbage in, Garbage out“ ist sehr relevant, wenn es darum geht, Daten zu nutzen, um fundierte Geschäftsentscheidungen zu treffen, Kunden fair und korrekt zu behandeln und genaue Geschäftsberichte zu ermöglichen, die den Branchenvorschriften entsprechen. Schlechte Daten führen, sobald sie operationalisiert sind, zu unerwünschten Ergebnissen.
Unternehmen müssen Daten während ihres gesamten Lebenszyklus vollständig, genau, konsistent und sicher aufbewahren. Die Datenintegrität trägt dazu bei, diese Vollständigkeit zu fördern, indem alle Datenelemente ohne Änderungen, Kürzung oder Verlust intakt bleiben und Änderungen verhindert werden, die die Analyse verzerren und konsistente Testbedingungen gefährden könnten. Ohne Datenintegritätsprozesse wären Unternehmen nicht in der Lage, zu überprüfen, ob zukünftige Daten mit früheren Daten übereinstimmen, unabhängig von den Zugriffsmustern. Darüber hinaus dient Datenintegrität dazu, die Datensicherheit zu erhöhen, indem der Zugriff kontrolliert und durch Authentifizierung, Autorisierung, Verschlüsselung und umfassende Datenschutzstrategien, einschließlich Backups und Zugriffsprotokollierung, vor unbefugter Ausnutzung geschützt wird.
Über die Entscheidungsfindung hinaus ist die Datenintegrität entscheidend für den Schutz der persönlichen und sensiblen Informationen der betroffenen Personen. Fehler im Umgang mit Kundendaten, sei es durch menschliches Versagen oder durch Cyberangriffe, können zu Verletzungen der Privatsphäre und des Vertrauens, zu falschen Darstellungen von Personen und zu potenziell schwerwiegenden Reputationsschäden führen. Dies gilt auch für weniger sensible First-Party-Daten, bei denen Ungenauigkeiten das Verständnis und die Behandlung der Nutzer durch das Unternehmen verzerren und deren Einbeziehung in Trends und Interaktionen mit der Marke beeinträchtigen können. Die Wahrung der Datenintegrität ist daher nicht nur eine Compliance- oder operative Frage, sondern eine strategische Notwendigkeit, die sich auf alle Aspekte der Beziehung eines Unternehmens zu seinen Kunden und seine Position auf dem Markt auswirkt.
Die zentrale Idee der Datenintegrität besteht darin, die Nutzbarkeit des Datensatzes für zentrale Geschäftsanalysezwecke sicherzustellen. Dies untermauert die Stabilität, Leistung, Wiederherstellbarkeit und Sicherheit von Daten.
Das Problem ist, dass Daten auf verschiedene Weise gefährdet werden können: durch menschliches Versagen, unbeabsichtigte Übertragungsfehler, Viren, Softwarefehler, Malware, Hackerangriffe, beschädigte Hardware und physische Schäden an Geräten. Unternehmen können Integrität erreichen, indem sie Integritätsbeschränkungen anwenden und die Regeln und Verfahren für die Arbeit mit Daten festlegen. Integritätseinschränkungen umfassen Aktionen wie das Löschen, Einfügen und Ändern von Informationen – was die Durchsetzung der Integrität in gängigen Systemen wie Enterprise Resource Planning (ERP)-Datenbanken, Customer Relationship Management (CRM)-Systemen und Lieferkettenmanagement-Systemen ermöglicht.
Fünf Arten von Datenintegrität helfen Unternehmen, die Qualität ihrer Daten zu überprüfen und aufrechtzuerhalten:
Eine Funktion relationaler Datenbanksysteme, die Daten in Tabellen speichert, die auf verschiedene Weise verwendet und verknüpft werden können. Die Integrität von Entitäten beruht auf eindeutigen Schlüsseln und Werten, die zur Identifizierung von Daten erstellt werden, um sicherzustellen, dass dieselben Daten nicht mehrfach aufgeführt und Tabellenfelder korrekt ausgefüllt werden.
Schützt die Genauigkeit, Korrektheit und Vollständigkeit der Daten beim Speichern und Abrufen. Physische Integrität kann durch Stromausfälle, Speicherverfall, Hacker und Naturkatastrophen beeinträchtigt werden.
Eine Reihe von Prozessen, die sicherstellen, dass Daten einheitlich gespeichert und verwendet werden. Datenbankstrukturen enthalten Regeln, die das Vorhandensein übereinstimmender Datensätze in verknüpften Tabellen erzwingen, verwaiste Datensätze verhindern und die Konsistenz der Daten in der gesamten Datenbank aufrechterhalten.
Eine Domäne wird durch einen bestimmten Wertesatz für die Spalten einer Tabelle definiert, einschließlich Einschränkungen und Regeln, die die Menge, das Format und die Daten bestimmen, die eingegeben werden können. Die Domänenintegrität trägt dazu bei, die Genauigkeit der Datenelemente innerhalb einer Domäne zu gewährleisten.
Wenn Benutzer Regeln und Einschränkungen für Daten erstellen, um sie an ihre individuellen Spezifikationen anzupassen. Diese Methode wird im Allgemeinen bei anderen Prozessen eingesetzt, die keinen Datenschutz und keine Datensicherheit gewährleisten.
Datenintegrität, Datenqualität und Datensicherheit sind grundlegende Konzepte für die Verwaltung von Unternehmensdaten und werden oft fälschlicherweise synonym verwendet.
Die Datenqualität konzentriert sich auf Datenbedingungen, die auf Faktoren wie Genauigkeit, Vollständigkeit, Einzigartigkeit und Aktualität basieren.
Die Datensicherheit befasst sich mit dem Schutz der Daten vor unbefugtem Zugriff, Verstößen und anderen Formen von Fehlverhalten. Sie umfasst die Technologien, Richtlinien und Praktiken, die zum Schutz der Daten über ihren gesamten Lebenszyklus hinweg eingesetzt werden, und stellt sicher, dass nur autorisiertes Personal auf sensible Informationen zugreifen kann, um Vertraulichkeit und Vertrauen zu wahren.
Datenintegrität ist das übergeordnete Prinzip, das Datenqualitäts- und Sicherheitselemente umfasst. Sie dient dazu, die Genauigkeit und Konsistenz von Daten über ihren gesamten Lebenszyklus hinweg zu überprüfen – von der Erstellung und Speicherung bis hin zum Abruf und Löschen –, indem Regeln und Standards durchgesetzt werden, die eine unbefugte Datenänderung verhindern. Mechanismen zur Datenintegrität sorgen dafür, dass Daten nicht nur korrekt und zugänglich sind, sondern auch vor unbefugten Manipulationen geschützt sind. So wird die Einhaltung von Branchenvorschriften und behördlichen Bestimmungen unterstützt.
Datenintegrität ist branchenübergreifend ein Anliegen, wobei jede Branche eigene Praktiken und Standards zum Schutz ihrer Daten anwendet. Die Pharmaindustrie muss sich an strenge Richtlinien halten, die von Aufsichtsbehörden wie der U.S. Food and Drug Administration (FDA) festgelegt wurden. Der Entwurf des Leitfadens der FDA (Link befindet sich außerhalb von ibm.com) für Pharmahersteller betont die Einhaltung der Kodizes und Bundesvorschriften, um zu bescheinigen, dass Medikamente einheitlich hergestellt werden und rückverfolgbar, sicher für den Verbrauch und wirksam sind. In ähnlicher Weise unterstreichen internationale Standards wie ISO 13485 (Link befindet sich außerhalb von ibm.com) für medizinische Geräte die globale Bedeutung der Datenintegrität in der Fertigung, um sicherzustellen, dass Produkte die höchsten Sicherheits- und Qualitätsstandards erfüllen.
Im Finanzsektor hat die Financial Industry Regulatory Authority (FINRA) die Notwendigkeit robuster Maßnahmen zur Datenintegrität erkannt, insbesondere bei automatisierten Systemen zur Überwachung von Handels- und Geldbewegungen. Die Initiativen der FINRA (Link befindet sich außerhalb von ibm.com) zur Entwicklung und Erweiterung von Datenintegritätsprogrammen spiegeln die breiteren Bemühungen der Branche wider, Finanztransaktionen und sensible Kundeninformationen zu sichern, was für die Aufrechterhaltung von Vertrauen und Compliance in einem stark regulierten Umfeld von entscheidender Bedeutung ist.
Auch die Bergbau- und Fertigungsindustrie konzentriert sich zunehmend auf die Datenintegrität innerhalb ihrer Automatisierungs- und Produktionsüberwachungssysteme. Ziel ist es, zu gewährleisten, dass die Daten, die die Grundlage für betriebliche Entscheidungen und Effizienzverbesserungen bilden, genau und zuverlässig sind, um kostspielige Fehler zu vermeiden und die Wettbewerbsfähigkeit zu verbessern.
Anbieter von Cloud-Speicherdatenbanken stehen vor einzigartigen Herausforderungen bei der Wahrung der Integrität und Herkunft von Kundendaten. Angesichts der zunehmenden Abhängigkeit von Cloud-Services für die Datenspeicherung und -verarbeitung müssen diese Anbieter ausgefeilte Maßnahmen ergreifen, um Datenverletzungen zu verfolgen und zu verhindern und sicherzustellen, dass die Informationen ihrer Kunden sicher und unverändert bleiben.
Spezifische Beispiele für Datenintegritätsanwendungen finden sich auch im Gesundheitswesen, wo Fehler in elektronischen Patientenakten schwerwiegende Folgen haben können. Im Finanzwesen sind genaue Transaktionsdaten die Grundlage für die Risikobewertung und Betrugserkennung, wobei Praktiken wie Know-your-Customer (KYC)-Protokolle eine entscheidende Rolle bei der Überprüfung von Kundeninformationen und der Einhaltung gesetzlicher Vorschriften spielen. Bildungseinrichtungen sind für die Verwaltung der Einschreibungen, die akademische Nachverfolgung und die Ressourcenzuweisung auf präzise Studentendaten angewiesen.
Die Sicherung der Datenintegrität in Unternehmen ist keine einmalige Aufgabe, sondern eine kontinuierliche Aufgabe, die eine ganzheitliche Strategie erfordert, die Technologie, Prozesse und Mitarbeiter einbezieht, um die Daten vollständig zu validieren. Die folgenden Strategien und Best Practices schützen Datenbestände und ermöglichen es Unternehmen, Daten sicher für Entscheidungsfindung und Innovation zu nutzen.
Durch die Implementierung von Datenintegritätsprüfungen möglichst nahe am Dateneingabepunkt – beispielsweise durch eine Person mit einer Tastatur oder Anwendung, die Daten überträgt – wird die Art der Informationen, die in die Datenbank gelangen dürfen, begrenzt und festgelegt.
Die schiere Vielfalt der Datenschwachstellen unterstreicht die Bedeutung eines umfassenden Ansatzes zum Schutz der Daten. Die Verwaltung der Datenintegrität in einem Unternehmen wird durch ein breites Spektrum von Richtlinien, Leitlinien und Regeln, den so genannten Integritätseinschränkungen, erreicht, die die verschiedenen Aspekte der Datenverwaltung abdecken, von der Aufbewahrung bis hin zu den Beziehungen zwischen verschiedenen Daten und den Personen, die mit ihnen arbeiten.
Integritätsbeschränkungen sind an die relationalen Datenmodelltypen gebunden: Entität, referenziell, Domäne und benutzerdefiniert. Domäneneinschränkungen begrenzen beispielsweise die Art der Werte, die eine Spalte enthalten kann. Eine Spalte „Alter“ könnte also nur ganze Zahlen zwischen 1 und 120 akzeptieren.
Die Entitätsintegrität stellt sicher, dass jede Zeile in einer Tabelle eindeutig und identifizierbar ist. Dies wird in der Regel durch einen Primärschlüssel erzwungen, d. h. es gibt einen eindeutigen Bezeichner für jede Zeile in einer Datenbanktabelle.
Integritätsbeschränkungen gewährleisten außerdem, dass die Beziehungen zwischen Tabellen eindeutig definiert sind und über Fremdschlüssel aufrechterhalten werden. Dabei handelt es sich um Spalten oder Spaltensätze in einer Tabelle, die auf den Primärschlüssel einer anderen Tabelle verweisen.
Diese Einschränkungen stellen sicher, dass die Daten in jedem Feld den angegebenen Formaten und Werten entsprechen und dass alle zusätzlichen Regeln, die auf bestimmte organisatorische Anforderungen zugeschnitten sind, eingehalten werden.
Aufbewahrungsrichtlinien und -strategien legen fest, wie lange Daten in einer Datenbank gespeichert werden sollen, um die Konsistenz zu gewährleisten und Fehler zu minimieren, die durch veraltete Informationen entstehen. Datensicherungen können vor Datenverlusten schützen und bei Systemausfällen, Datenverlusten oder anderen unvorhergesehenen Vorfällen, die die Datenintegrität gefährden könnten, eine Ausfallsicherheit bieten. Effektive Backup-Strategien sollten regelmäßige Momentaufnahmen von Daten enthalten, die an sicheren, geografisch verteilten Standorten gespeichert sind, um sicherzustellen, dass Daten mit minimalem Verlust wiederhergestellt werden können.
Konnektivität und Datenzugriff spielen ebenfalls eine entscheidende Rolle bei der Wahrung der Datenintegrität. Die Gewährleistung einer nahtlosen Verbindung zwischen verschiedenen Datenquellen und Systemen ermöglicht einen konsistenten Informationsfluss im gesamten Unternehmen.
Die Verwaltung des Datenzugriffs stellt sicher, dass nur autorisiertes Personal Daten ändern oder mit ihnen interagieren kann, um das Risiko einer versehentlichen oder böswilligen Datenmanipulation zu verringern.
Darüber hinaus trägt eine kontinuierliche Überwachung im gesamten Unternehmen zur Wahrung der Datenintegrität bei. Wichtig sind regelmäßige Fehlerüberprüfungen, ein Bewusstsein für Cybersicherheit und eine klare Kommunikation zwischen den Teammitgliedern über die Bedeutung präziser Daten.
Organisationen müssen die physische Integrität der Daten sicherstellen, indem sie Maßnahmen wie unterbrechungsfreie Stromversorgungen und redundante Hardware einsetzen.
Sobald die Daten erfasst wurden, können durch effektive Datenbankverwaltungspraktiken Regeln durchgesetzt werden, die die Erstellung doppelter Daten verhindern. Nutzung von Technologien wie Datenabstammungstools, die Datenursprung und -transformationen verfolgen, für Prüfversuche, Datenkataloge, die Sicherheitsfunktionen für die Zugriffskontrolle bieten, strenge Eingabevalidierungsprozesse und ein modernes Datenbanksystem, um Integritätsverletzungen zu verhindern.
Datenbanksysteme sind mit Funktionen ausgestattet, die Integritätsbeschränkungen unterstützen und die Verantwortung für die Überprüfung der Genauigkeit auf die Datenbank selbst übertragen. Beispielsweise veranschaulichen Mechanismen wie Eltern-Kind-Beziehungen, wie auf Datenbankebene verwaltete referenzielle Integritätsprozesse die Datenintegrität automatisch schützen können, indem sie sicherstellen, dass Beziehungen zwischen Datensätzen erhalten bleiben, wodurch verwaiste Datensätze sowie unbefugte Löschungen verhindert werden.
Datenvalidierungstools wie IBM® Databand und Ataccama sind ein wesentlicher Schritt, um Genauigkeit, Konsistenz und Vollständigkeit zu erreichen. Validierungstools helfen dabei, Diskrepanzen oder Anomalien zu identifizieren, die auf Probleme hinweisen könnten. Nach der Integration in ein Datenverwaltungssystem überprüfen diese Tools kontinuierlich die Qualität und Integrität der Daten.
Dieser zentralisierte Ansatz trägt dazu bei, die Datenverwaltungssysteme stabil zu halten und gleichzeitig die Wiederverwendbarkeit und einfache Datenpflege für verschiedene Anwendungen sicherzustellen.
Ein Unternehmen, das eine Kultur fördern möchte, die der Datengenauigkeit und -sicherheit Vorrang einräumt, muss seine Führungskräfte und Mitarbeiter über die Risiken der Verwendung unsicherer oder fehlerhafter Daten aufklären.
IBM Databand ist eine Beobachtbarkeitssoftware für Data-Pipelines und -Warehouses, die Metadaten automatisch erfasst, um historische Baselines zu erstellen, Unregelmäßigkeiten zu erkennen und Warnungen zu sichten, um Probleme mit der Datenqualität zu beheben.
IBM® DataStage unterstützt ETL- und ELT-Muster und ermöglicht eine flexible und nahezu Echtzeit-Datenintegration sowohl On-Premises als auch in der Cloud.
IBM® Knowledge Catalog ist ein intelligenter Datenkatalog für das Zeitalter der KI, mit dem Sie Daten, Wissensressourcen und ihre Beziehungen abrufen, kuratieren, kategorisieren und teilen können – wo auch immer sie sich befinden.
Weitere Informationen über die Praxis der Aufnahme, Verarbeitung, Sicherung und Speicherung der Daten Ihres Unternehmens, um sie für wertvolle Geschäftsergebnisse nutzbar zu machen.
Erfahren Sie, wie Abstammungstools Daten während des gesamten Lebenszyklus aufzeichnen, damit sich ihre Genauigkeit und Konsistenz überprüfen lässt.
Data Governance fördert die Verfügbarkeit, Qualität und Sicherheit der Daten eines Unternehmens durch verschiedene Richtlinien und Standards. Diese Prozesse bestimmen die Datenverantwortlichen, Datensicherheitsmaßnahmen und den Verwendungszweck der Daten.