Was ist Datenabstammung?

Fröhliche Geschäftsfrau im mittleren Alter beim Online-Meeting

Was ist Datenabstammung?

Die Datenabstammung ist der Prozess der Verfolgung des Datenflusses im Laufe der Zeit, der ein klares Verständnis für die Herkunft der Daten, ihre Veränderung und ihren endgültigen Bestimmungsort innerhalb der Datenpipeline vermittelt.

Tools zur Nachverfolgung der Datenabstammung ermöglichen die Aufzeichnung von Daten während ihres gesamten Lebenszyklus, einschließlich der Quellinformationen und aller Datentransformationen, die während ETL- oder ELT-Prozessen angewendet wurden.

Diese Art der Dokumentation ermöglicht es den Benutzern, verschiedene Kontaktpunkte entlang des Datenpfads zu beobachten und zu verfolgen, sodass Unternehmen die Richtigkeit und Konsistenz überprüfen können. Dies ist eine entscheidende Fähigkeit, um die Datenqualität innerhalb eines Unternehmens sicherzustellen. Sie wird häufig verwendet, um Kontextinformationen über historische Prozesse zu erhalten und Fehler bis zur Ursache zurückzuverfolgen.

3D-Design aus Kugeln, die auf einer Schiene rollen

Die neuesten Erkenntnisse und Insights zu KI

Entdecken Sie von Experten kuratierte Erkenntnisse und Neuigkeiten zu KI, Cloud und mehr im wöchentlichen Newsletter Think.

Datenabstammung vs. Datenherkunft vs. Data Governance

Datenabstammung, Datenherkunft und Datenverwaltung sind eng miteinander verwandte Begriffe, die ineinander übergehen. Zusammen stellen sie sicher, dass eine Organisation die Datenqualität und Datensicherheit langfristig aufrechterhalten kann.

Data Governance schafft innerhalb von Unternehmen eine Struktur zur Verwaltung von Datenbeständen, indem Dateneigentümer, Geschäftsbedingungen, Regeln, Richtlinien und Prozesse während des gesamten Datenlebenszyklus definiert werden. Mithilfe von Lösungen zur Datenherkunft können Data-Governance-Teams sicherstellen, dass Daten diesen Standards entsprechen, und sie erhalten Einblick in die Art und Weise, wie sich Daten innerhalb der Pipeline verändern. Der Begriff Datenabstammung wird in der Regel im Zusammenhang mit der Datenherkunft verwendet, bezieht sich jedoch speziell auf die erste Instanz dieser Daten oder ihre Quelle.

Die Datenabstammung bietet einen Prüfpfad für Daten auf einer sehr granularen Ebene. Diese Art von Detail ist für die Behebung von Datenfehlern unglaublich hilfreich und ermöglicht Dateningenieuren eine effektivere Fehlerbehebung und eine schnellere Identifizierung von Lösungen. Während der Umfang der Datenverwaltung breiter ist als der der Datenabstammung und Datenherkunft, ist dieser Aspekt der Datenverwaltung ein wichtiger Faktor bei der Durchsetzung von betrieblichen Standards.

Mixture of Experts | 12. Dezember, Folge 85

KI entschlüsseln: Wöchentlicher Nachrichtenüberblick

Schließen Sie sich unserer erstklassigen Expertenrunde aus Ingenieuren, Forschern, Produktführern und anderen an, die sich durch das KI-Rauschen kämpfen, um Ihnen die neuesten KI-Nachrichten und Erkenntnisse zu liefern.

Alle Episoden von Mixture of Experts ansehen

Warum Unternehmen Datenabstammung nutzen

Verlässliche Daten sind unerlässlich für eine bessere Entscheidungsfindung und Prozessverbesserung in allen Bereichen des Unternehmens – vom Vertrieb bis zu den Ressourcen. Diese Informationen sind jedoch nur dann wertvoll, wenn die Stakeholder von ihrer Richtigkeit überzeugt sind, da die Erkenntnisse nur so gut sind wie die Qualität der Daten. Die Datenabstammung gibt Einblick in Änderungen, die infolge von Datenmigrationen, Systemaktualisierungen, Fehlern und mehr auftreten können, und stellt die Datenintegrität während ihres gesamten Lebenszyklus sicher.

Die Datenabstammung dokumentiert die Beziehung zwischen Unternehmensdaten in verschiedenen Geschäfts- und IT-Anwendungen. Diese Details können Folgendes umfassen:

Wo sich Daten befinden und wie sie in einer Umgebung gespeichert werden, z. B. vor Ort, in einem Data Warehouse oder in einem Data Lake.
Wie die Daten verwendet werden können und wer für die Aktualisierung, Verwendung und Änderung der Daten verantwortlich ist. Dazu gehören auch die Rollen und Anwendungen, die zum Zugriff auf bestimmte Segmente sensibler Daten (z. B. personenbezogene Daten) berechtigt sind.
Tracking-Daten, die von Geschäftsanwendern und -anwendungen generiert, hochgeladen und geändert werden. Dies kann beispielsweise das Hinzufügen von Kontakten zu einem Customer-Relationship-Management-System (CRM) sein oder eine Datentransformation, wie das Entfernen doppelter Datensätze.
Daten, die von verschiedenen Teilen des Unternehmens erstellt und integriert werden, wie z. B. Netzwerkhardware und Server.

So funktioniert die Datenabstammung

Metadaten ermöglichen es den Benutzern von Tools für die Datenabstammung, den Weg der Daten durch die Datenpipeline vollständig nachzuvollziehen. Metadaten sind die „Daten über die Daten“, die verschiedene Informationen über die Datenbestände enthalten, wie z. B. Typ, Format, Struktur, Autor, Erstellungsdatum, Änderungsdatum und Dateigröße. Tools für die Datenabstammung liefern ein vollständiges Bild der Metadaten, um die Benutzer bei der Bestimmung des Nutzens der Daten für sie zu unterstützen.

In den letzten Jahren hat sich die Art und Weise, wie wir Daten speichern und nutzen, durch das Aufkommen von Big Data weiterentwickelt. Unternehmen investieren mehr in Data Science, um ihre Entscheidungsfindung und Geschäftsergebnisse zu verbessern. Damit sie jedoch eine fundierte Analyse erstellen können, sind Tools zur Rückverfolgung der Datenabstammung und Datenkataloge für die Datenerkennung und das Data Mapping erforderlich. Während Tools für die Datenabstammung die Entwicklung von Daten im Laufe der Zeit anhand von Metadaten zeigen, verwendet ein Datenkatalog dieselben Informationen, um einen durchsuchbaren Bestand aller Assets in einem Unternehmen zu erstellen. Gemeinsam ermöglichen sie es Datennutzern, die Bedeutung verschiedener Datenelemente für ein bestimmtes Ergebnis zu verstehen, was für die Entwicklung aller Algorithmen des maschinellen Lernens von grundlegender Bedeutung ist.

Anwendungsfälle für Datenabstammung

Unternehmen benötigen heutzutage immer mehr Echtzeit-Einblicke, aber diese Erkenntnisse hängen vom Verständnis der Daten und ihrer Reise durch die Pipeline ab. Zu den Möglichkeiten, wie Teams End-to-End-Tools für die Datenabstammung zur Verbesserung von Arbeitsabläufen nutzen können, gehören:

Datenmodellierung: Um visuelle Darstellungen der verschiedenen Datenelemente und ihrer entsprechenden Verknüpfungen innerhalb eines Unternehmens zu erstellen, müssen Unternehmen die zugrunde liegenden Datenstrukturen definieren, die sie unterstützen. Die Datenherkunft hilft bei der Modellierung dieser Beziehungen und veranschaulicht die verschiedenen Abhängigkeiten im gesamten Datenökosystem. Da sich Daten im Laufe der Zeit weiterentwickeln, werden immer neue Datenquellen erschlossen, neue Datenintegrationen müssen vorgenommen werden usw. Daher muss auch das Gesamtdatenmodell, das Unternehmen zur Verwaltung ihrer Daten verwenden, an die sich ändernde Umgebung angepasst werden. Die Datenabstammung hilft dabei, diese Veränderungen im Laufe der Zeit durch Datenmodelldiagramme genau widerzuspiegeln, indem neue oder veraltete Verbindungen oder Tabellen hervorgehoben werden. Dies wiederum hilft Analysten und Datenwissenschaftlern, wertvolle und zeitnahe Analysen zu erstellen, da sie ein besseres Verständnis der Datensätze haben.

Datenmigration: Wenn Daten in ein neues Speichersystem verschoben oder neue Software integriert wird, nutzen Unternehmen die Datenmigration, um die Speicherorte und den Lebenszyklus der Daten zu verstehen. Da die Datenabstammung einen Überblick darüber bietet, wie diese Daten durch das Unternehmen gelaufen sind, unterstützt sie die Teams bei der Planung dieser Systemmigrationen oder -aktualisierungen und beschleunigt den allgemeinen Übergang zur neuen Speicherumgebung. Außerdem bietet sie Teams die Möglichkeit, das Datensystem zu bereinigen, indem alte, irrelevante Daten archiviert oder gelöscht werden. Dies wiederum kann die Gesamtleistung des Datensystems verbessern, indem die zu verwaltende Datenmenge reduziert wird.

Compliance: Die Datenabstammung bietet einen Compliance-Mechanismus für Audits, verbessert das Risikomanagement und stellt sicher, dass Daten in Übereinstimmung mit den Richtlinien und Vorschriften der Datenverwaltung gespeichert und verarbeitet werden. So wurde beispielsweise im Jahr 2016 die DSGVO-Gesetzgebung geschaffen, um die personenbezogenen Daten von Menschen in der Europäischen Union und im Europäischen Wirtschaftsraum zu schützen und Einzelpersonen mehr Kontrolle über ihre Daten zu geben. In den Vereinigten Staaten haben einzelne Bundesstaaten, wie Kalifornien, Richtlinien wie den California Consumer Privacy Act (CCPA) entwickelt, der Unternehmen zur Information der Verbraucher über die Erhebung ihrer Daten verpflichtet. Diese Art von Gesetzgebung macht die Speicherung und Sicherheit dieser Daten zur obersten Priorität. Und ohne Tools zur Kontrolle der Datenabstammung wäre das Einhalten der Vorschriften für Unternehmen ein zeitaufwändiges und teures Unterfangen.

Auswirkungsanalyse: Tools zur Datenabstammung können Aufschluss über die Auswirkungen bestimmter geschäftlicher Änderungen geben, z. B. über nachgelagerte Berichte. Wenn sich beispielsweise der Name eines Datenelements ändert, kann die Datenabstammung den Führungskräften Aufschluss darüber geben, wie viele Dashboards davon betroffen sein könnten und wie viele Benutzer anschließend auf diese Berichte zugreifen. Sie kann auch dazu beitragen, die Auswirkungen von Datenfehlern und die Gefährdung im gesamten Unternehmen zu bewerten. Datenfehler können aus einer Vielzahl von Gründen auftreten, was das Vertrauen in bestimmte Business-Intelligence-Berichte oder Datenquellen untergraben kann. Tools zur Datenabstammung können Teams jedoch dabei helfen, sie bis zur Quelle zurückzuverfolgen, wodurch die Datenverarbeitung optimiert und die Kommunikation mit den jeweiligen Teams ermöglicht wird.

Der Leitfaden für Data Leader zu KI-fähigen Daten

Erfahren Sie, welche umsetzbaren Schritte Datenverantwortliche unternehmen können, um Herausforderungen zu meistern, die Grundlage für eine vertrauenswürdige Datenbasis zu schaffen und die Daten Ihres Unternehmens fit für KI zu machen.

Ressourcen

3D-Rendering mehrerer nebeneinander angeordneter Symbole, darunter eine Kamera, ein Lautstärkeregler und eine Zwischenablage

KI-Agenten brauchen Daten – sind Ihre bereit?

Ihre Daten sind Ihr Wettbewerbsvorteil. Erfahren Sie in diesem kurzen Webinar, wie Sie die KI sicher nutzen und einen messbaren ROI erzielen können.

IBM als Leader im Bereich Metadatenmanagement ausgezeichnet

Erfahren Sie, warum IBM im Gartner Magic Quadrant für Metadatenmanagement 2025 für seine watsonx.data intelligence als Leader eingestuft wurde.

App-Symbole, die einer Kurve folgend angeordnet sind

Sind Ihre Daten bereit für generative KI?

Erkunden Sie unseren Data Matters Hub, um zu erfahren, wie Sie Herausforderungen im Bereich Daten und KI wie die Integration angehen können.

Illustration eines Bildschirms mit Leuten, die über Daten sprechen

Datenstrategie in KI-Einfluss umwandeln

Entdecken Sie, wie Sie KI mit einer starken Datengrundlage skalieren, erklärbare und kontrollierte Ergebnisse liefern und Erkenntnisse aus der Praxis auf Ihre eigene KI-Roadmap anwenden können.

Drei Kollegen unterhalten sich in einem ungezwungenen Arbeitsumfeld über ein bestimmtes Thema

Datenintelligenz: Holen Sie Ihre Daten aus dem Dunkeln

Entdecken Sie, wie Datenintelligenz Governance, Qualität, Datenabstammung und gemeinsame Nutzung zusammenbringt, um aus Rohdaten zuverlässige Erkenntnisse zu gewinnen.

Porträtaufnahme von Heather Gentile, lächelnd

Entwicklung eines einheitlichen Vertrauensframeworks für Daten und KI

Entdecken Sie, warum ein disziplinierter Ansatz für Daten und KI, der Menschen, Prozesse und Technologie vereint, Akzeptanz, Innovation und ROI beschleunigt.

Ein Profi steht im Korridor eines Rechenzentrums und hält ein Tablet in der Hand

Von Daten zu Erkenntnissen: Planen Sie Ihre Reise mit Datenintelligenz

Erkunden Sie den Transformationsprozess und die Best Practices zum Ableiten umsetzbarer Erkenntnis aus Datenintelligenz.

How the C-suite is turning information into impact

Erkunden Sie in diesem branchenübergreifenden Bericht für Datenverantwortliche die Erkenntnisse von 1.700 CDOs.

Weiterführende Lösungen

IBM Manta Data Lineage

Visualisieren, transformieren und optimieren Sie Ihre Datenbewegungen vom Ursprung bis zum Verbrauch. Wenden Sie Datenabstammung auf jedes Szenario an, um eine größere Datentransparenz und -genauigkeit in Ihrem gesamten Unternehmen zu erreichen.

IBM Manta Data Lineage entdecken

Data Intelligence-Lösungen

Wandeln Sie Rohdaten schnell in umsetzbare Erkenntnisse um, vereinheitlichen Sie Data Governance, Datenqualität, -herkunft und -freigabe und stellen Sie Ihren Datennutzern zuverlässige und kontextualisierte Daten zur Verfügung.

Datenintelligenzlösungen entdecken

Beratungsservices für Daten und Analysen

Erschließen Sie den Wert von Unternehmensdaten mit IBM Consulting und bauen Sie ein erkenntnisorientiertes Unternehmen auf, das Ihnen geschäftliche Vorteile verschafft.

Analyse-Services entdecken

Machen Sie den nächsten Schritt

Erfahren Sie, wie IBM beim Aufbau einer regulierten, Compliance-fähigen Datengrundlage hilft. Mit IBM Manta Data Lineage gewinnen Sie Datentransparenz, indem Sie den Verlauf, den Fluss und die Ergebnisse Ihrer Daten verfolgen und so umfassende Erkenntnisse ermöglichen.