Datenqualitätsregeln verwalten
Sie können Datenqualitätsregeln erstellen und verwalten, um die Qualität der Daten in Ihrem Projekt zu bewerten.
Wenn Sie über die erforderlichen Berechtigungenverfügen, können Sie Datenqualitätsregeln wie folgt verwalten:
Sie können diese Tasks auch mit APIs anstelle der Benutzerschnittstelle ausführen. Die Links zu diesen APIs sind im Abschnitt Weitere Informationen aufgelistet.
Anforderungen und Einschränkungen
Erforderliche Services
Die folgenden Dienste müssen verfügbar sein:
- IBM watsonx.data intelligence
- DataStage oder DataStage as a Service Anywhere '
Mit DataStage, können Sie Datenqualitätsregeln in den unterstützten Regionen ausführen. Mit DataStage as a Service Anywhere können Sie Datenqualitätsregeln an einem lokalen Standort oder in einer beliebigen Cloud oder einem Rechenzentrum mit Hilfe von Remote-Engines ausführen. Weitere Informationen zur Einrichtung von Remote Engines finden Sie in der Dokumentation DataStage as a Service Anywhere.
Projekteinstellungen
Sie können folgende Einstellungen vornehmen:
- Aktivieren oder deaktivieren Sie auf der Seite „Datenintelligenz“ natürliche Sprachabfragen für das Projekt.
- Konfigurieren Sie auf der Seite „Datenqualität“ eine Standardtabelle für die Regelausgabe und aktivieren oder deaktivieren Sie KI-generierte Beschreibungen für Datenqualitätsregeln.
Einige Einstellungen auf Projektebene bestimmen bestimmte Aspekte der Ausführung von Datenqualitätsregeln, beispielsweise, ob nachgestellte Leerzeichen in Zeichenfolgenwerten bei Gleichheitsprüfungen ignoriert werden. Diese Einstellungen gelten für alle Datenqualitätsregeln für ein bestimmtes Projekt. Sie können diese jedoch nicht in der Benutzeroberfläche ändern. Sie können diese Einstellungen für jedes Projekt überprüfen oder aktualisieren, indem Sie die IBM Knowledge Catalog API Get project settings for data quality rules und Replace project settings for data quality rules verwenden.
Erforderliche Berechtigungen
Zum Anzeigen von Datenqualitätsregeln müssen Sie mindestens über die Rolle Anzeigeberechtigter im Projekt verfügen.
Um Datenqualitätsregeln zu erstellen, zu bearbeiten oder zu löschen, müssen Sie die Benutzerberechtigung Datenqualitäts-Assets verwalten und die Rolle Admin oder Editor im Projekt haben.
Erstellen von Datenqualitätsregeln
Sie können verschiedene Typen von Datenqualitätsregeln erstellen:
Datenqualitätsregeln bearbeiten
Sie können eine Datenqualitätsregel bearbeiten, um ihre Beschreibung, die ausgewählte Datenqualitätsdimension, beliebige Geschäftsbegriffszuordnungen oder die Regelkonfiguration zu aktualisieren. Sie können auch die Liste der zugehörigen Elemente verwalten.
Öffnen Sie zum Bearbeiten einer Datenqualitätsregel das Asset und führen Sie die entsprechenden Aktionen aus:
Um die Beschreibung oder die Datenqualitätsdimensionen zu aktualisieren, klicken Sie auf das Symbol
„Bearbeiten“ neben der Eigenschaft.
Um die Beschreibung, Erläuterungen zur Regel-Logik oder die Datenqualitätsdimensionen zu aktualisieren, klicken Sie auf das Symbol
„Bearbeiten“ neben der Eigenschaft. Sie können die Beschreibung und Erläuterungen manuell aktualisieren oder mithilfe von KI generieren.
Rufen Sie zum Verwalten von Geschäftsbegriffen den Abschnitt Governance-Artefakte des Assets auf und fügen Sie nach Bedarf Begriffe hinzu oder entfernen Sie sie.
Wechseln Sie zum Zuweisen oder Löschen von Governance-Regeln zum Abschnitt Governance-Artefakte des Assets und fügen Sie nach Bedarf Governance-Regeln hinzu oder entfernen Sie sie.
Um zugehörige Artefakte, Assets oder Spalten hinzuzufügen oder zu entfernen, gehen Sie zum Abschnitt "Verwandte Elemente" des Assets und fügen Sie nach Bedarf Elemente hinzu oder entfernen Sie sie.
Klicken Sie zum Aktualisieren der Regelkonfiguration auf Regel bearbeiten. Für alle Arten von Regeln können Sie den Ausgabetyp ändern. Abhängig von Ihrer neuen Auswahl werden alle konfigurierten Ausgabeeinstellungen zurückgesetzt oder überschrieben. Die Regelausgabe, die vor der Änderung geschrieben wurde, bleibt unberührt. Bei SQL-basierten Regeln können Sie die SQL-Anweisung ändern. Bei definierungsbasierten Regeln können Sie die verwendeten Datenqualitätsdefinitionen und die Stichprobeneinstellungen ändern. Sie können die Art und Weise, wie Bindungen verwaltet werden, nicht ändern.
Bei Datenqualitätsregeln, die Daten direkt binden, wird eine Validates data quality of relationship mit jeder gebundenen Spalte zum Abschnitt "Related items" hinzugefügt. Sie können Spalten mit dieser Art von Beziehung zu Datenqualitätsregeln mit extern verwalteten Bindungen oder SQL-basierten Datenqualitätsregeln manuell hinzufügen. Die SQL-basierten Regeln tragen dann zu den Datenqualitätswerten der entsprechenden Spalte bei. Regeln mit externen Bindungen tragen nur dann zu den Datenqualitäts-Scores der Spalten bei, die mit der Beziehung Validiert Datenqualität von verknüpft sind, wenn in der Regel-Subflow-Stufe keine Spalten für das Score-Reporting konfiguriert sind.
Wenn Sie eine Datenqualitätsregel anzeigen, können Sie auf das Info -Symbol
klicken, um weitere Details wie Ausgabeeinstellungen oder zugehörige Assets anzuzeigen.
Datenqualitätsregeln löschen
Sie können eine Datenqualitätsregel auf eine der folgenden Arten löschen:
- Wählen Sie im Projekt die Datenqualitätsregel aus und klicken Sie auf Löschen.
- Öffnen Sie die Datenqualitätsregel und wählen Sie im Überlaufmenü neben dem Namen der Datenqualitätsregel die Option Löschen aus.
Wenn Sie eine Datenqualitätsregel, ihren Ausführungsverlauf sowie alle zugehörigen DataStage -Workflows und -Jobs löschen, werden diese ebenfalls aus dem Projekt gelöscht. Ausgabetabellen im Projekt und in der Datenbank werden beibehalten. Die von dieser Datenqualitätsregel zurückgegebenen Probleme werden entfernt und die Datenqualität und die Dimensionsscores werden neu berechnet.