Wir stellen vor: Auto DQ: Automatisierung der Datenqualität in großem Maßstab

Digitale Illustration von Schreibtischen und Datenstapel mit Personen, die Daten auf Tablets betrachten

Autoren

Ray Beharry

Senior Product Marketing Manager - Data Intelligence

IBM

Vishwas Balakrishna

Senior Product Manager, Metadata Import & Enrichment

IBM

Auto DQ (Automatisierung der Datenqualität) schließt die Lücke zwischen geschäftlichem Kontext und technischer Durchsetzung und hilft sowohl Datenanbietern als auch nichttechnischen Nutzern, die Überwachung der Datenqualität mit Automatisierung, Kontextbewusstsein und Skalierbarkeit zu automatisieren.

Unternehmen investieren massiv in Daten- und KI-Initiativen, aber der Weg zur Wertschöpfung wird oft durch eine wiederkehrende Herausforderung gebremst – oder sogar behindert: die Datenqualität.

Mit dem Aufkommen von Cloud-Plattformen, hybriden Datenbeständen und immer komplexeren regulatorischen Rahmenbedingungen verwalten Unternehmen mehr Daten aus mehr Quellen als je zuvor. Unternehmensführer wollen Erkenntnisse, denen sie vertrauen können, aber allzu oft sind die Daten, die Analyse- und KI-Initiativen unterstützen, unvollständig, inkonsistent oder unzuverlässig.

Branchenanalysten schätzen, dass schlechte Datenqualität Unternehmen jedes Jahr Millionen kostet, nicht nur durch Zeitverschwendung, sondern auch durch fehlerhafte Entscheidungsfindung, Compliance-Risiken und geringeres Kundenvertrauen. Das Problem ist nicht mehr nur technischer, sondern strategischer Natur. Qualitativ hochwertige Daten sind zur Grundlage für Wettbewerbsvorteile geworden.

Das eigentliche Problem für Unternehmen: Datenqualität in großem Maßstab

Obwohl die Datenqualität schon immer wichtig war, ist es schwieriger denn je, sie in großem Maßstab zu gewährleisten. Herkömmliche Ansätze beruhen darauf, dass Teams die Datenqualitätsregeln für jeden Datensatz, jede Spalte und jede Domäne manuell definieren. Dies funktioniert in kleinen, kontrollierten Umgebungen, aber es funktioniert nicht mehr, wenn Unternehmen Tausende von Tabellen über mehrere Domänen hinweg verwalten müssen.

Für Datenverantwortliche und Unternehmensanalysten ist der Prozess nicht nur langsam, sondern auch nicht nachhaltig. Die manuelle Erstellung von Regeln führt zu menschlichen Fehlern, hat Schwierigkeiten, den geschäftlichen Kontext zu erfassen und kann nicht mit den sich schnell ändernden Geschäftswelten Schritt halten. Das Ergebnis: Datenprobleme bleiben unentdeckt und führen zu fehlerhaften Berichten, verzögerten Projekten und einem Vertrauensverlust in Analysen und KI-Initiativen.

Warum bestehende Lösungen nicht ausreichen: ein Engpass von Annahmen

Viele bestehende Datenqualitätstools bieten Funktionen zur Erstellung von Regeln, sind aber immer noch stark auf menschlichen Input angewiesen. Sie gehen davon aus, dass die Benutzer genau wissen, welche Regeln anzuwenden sind, wo sie anzuwenden sind und wie sie domänenspezifische Anforderungen in technische Logik kodieren. Dies führt zu einem Engpass: Geschäftsanwender verfügen nicht über das technische Fachwissen, und technische Teams haben nicht immer die erforderlichen Fachkenntnisse.

Die Kluft zwischen Geschäftsabsicht und technischer Umsetzung bereitet Unternehmen Schwierigkeiten. Selbst wenn Regeln definiert sind, ist es arbeitsintensiv, sie systemübergreifend zu skalieren und sie mit Geschäftsbedingungen und Governance-Anforderungen in Einklang zu bringen. Die Automatisierung hat in der Gleichung gefehlt.

Warum wir Auto DQ eingeführt haben

Deshalb haben wir Auto DQ (Datenqualitätsautomatisierung) entwickelt, um die Lücke zwischen geschäftlichem Kontext und technischer Durchsetzung zu schließen. Auto DQ hilft sowohl Datenanbietern als auch technisch nicht versierten Benutzern, die Überwachung der Datenqualität mit Intelligenz, Kontextbewusstsein und Skalierbarkeit zu automatisieren. Es reduziert den manuellen Aufwand um bis zu 80 % und bettet Geschäfts- und Fachanforderungen direkt in den Prozess ein.

Auto DQ ist nicht nur darauf ausgelegt, die Effizienz zu verbessern, sondern auch die Art und Weise, wie Unternehmen die Datenqualität denken, grundlegend zu verändern: von reaktiv und manuell zu proaktiv und automatisiert.

Funktionsweise von Auto DQ

Auto DQ bietet eine neue Methode zur Gewährleistung der Datenqualität in großem Maßstab:

  • Eineautomatische Generierung von Datenqualitätsprüfungen auf der Grundlage von Ergebnissen, die es Benutzern ermöglichen, schnell zu überprüfen, zu verfeinern und auszuwählen, welche Prüfungen angewendet werden sollen.
  • Die direkte Verknüpfung der Datenqualität mit den Geschäftsbegriffen gewährleistet, dass die Governance-Anforderungen auf natürliche Weise aus dem Glossar in die operative Überwachung einfließen.
  • Simplifizierung der Verwaltung mit Suche, Filter und Massenprüfung, so dass die Teams auch bei großem Umfang die Kontrolle behalten und bei Bedarf manuell Prüfungen hinzufügen können.
  • Automatische Erkennung von referenziellen Integritätsbeziehungen (PK-FK) und Erstellung von Regeln zur Wahrung der Konsistenz zwischen Datenquellen.
  • Einführung einer neuen Homogenitätsdimension zur Überwachung der historischen Stabilität unter Verwendung von Z-Score-Metriken sowohl für Spalten als auch für Tabellen.

Warum Auto DQ wichtig ist

Durch die Einbettung der Automatisierung in das Herzstück der Datenqualität bietet Auto DQ Unternehmen folgende Möglichkeiten:

  • Erkennen Sie proaktiv Probleme, bevor sie sich auf nachgelagerte Analysen und KI auswirken.
  • Reduzieren Sie manuelle Arbeit und Fehler, damit sich die Teams auf Erkenntnisse und Innovation konzentrieren können.
  • Stellen Sie sicher, dass die Geschäftsregeln und Branchenvorschriften eingehalten werden.
  • Bauen Sie unternehmensweit Vertrauen auf, indem Sie den Stakeholdern im Unternehmen Vertrauen in die Daten geben, die sie täglich verwenden.

Datenqualität ist nicht mehr nur ein technisches Detail, sondern ein entscheidender Faktor für das Geschäft. Mit Auto DQ können Unternehmen ihre Datenqualität skalieren, ohne Abstriche bei der Genauigkeit oder Agilität zu machen.

Was macht Auto DQ anders

Was Auto DQ auszeichnet, ist seine Fähigkeit, Automatisierung mit Geschäftskontext zu kombinieren. Während viele Tools Profiling oder Regelerstellung anbieten, verwendet Auto DQ Profiling-Erkenntnisse, Glossarbegriffe und erkannte Beziehungen, um automatisch aussagekräftige, domänenspezifische Prüfungen zu generieren. Es automatisiert nicht nur die Erstellung von Regeln, es verbindet Regeln direkt mit der Sprache und den Bedürfnissen des Unternehmens.

Diese Konvergenz von Automatisierung, Governance und Intelligenz bedeutet, dass die Datenqualität nicht länger einen Engpass darstellt. Stattdessen wird es zu einer integrierten Funktion, die sich mit den Veränderungen Ihrer Daten und Geschäftsanforderungen weiterentwickelt.

In einer Zeit, in der vertrauenswürdige Daten die Grundlage für KI, Analyse und digitale Transformation bilden, ist Auto DQ eine bahnbrechende Änderung. Durch die Automatisierung der Datenqualität in großem Maßstab können Unternehmen schnellere Erkenntnisse gewinnen, die Einhaltung von Vorschriften verbessern und fundierte Entscheidungen treffen.

Erkunden Sie Auto DQ in watsonx.data intelligence kostenlos