データ品質定義の管理

データ品質定義を作成および管理して、 データ資産 内のデータ品質の分析に役立つロジックを定義できます。

必要な許可を持っている場合 、以下の方法でデータ品質定義を管理できます。

ユーザー・インターフェースの代わりに API を使用して、これらのタスクを実行することもできます。 これらの API へのリンクは、『詳細』セクションにリストされています。 Learn more

必要な権限

データ品質定義を表示するには、プロジェクトで少なくとも ビューアー 役割を持っている必要があります。

データ品質定義を作成、編集、または削除するには、 データ品質 資産 の管理 ユーザー権限と、プロジェクト内の 管理者 または エディター の役割が必要です。

データ品質定義の作成

データ品質定義を作成するには、次のようにします。

  1. プロジェクトを開き、 新規 資産 > データ品質の測定方法の定義 をクリックします。

  2. 詳細を定義する:

    • データ品質定義の名前を指定します。
    • オプション: 説明を提供します。
    • オプション: この 資産 のルール論理の主なデータ品質 メトリック を記述するデータ品質ディメンションを選択します。 選択したディメンションは、レポート・カテゴリーとして、フィルター処理、または選択したデータの視覚化に使用できます。
  3. ルール論理を定義します。 フリー・フォーム・エディターを使用して、ルール論理を構成できます。 「 ルール式 」フィールドに式を入力します。 使用できる式のリストについては、 ルール論理のビルディング・ブロック を参照してください。 事前定義されたデータ品質定義のセットは、 IBM Knowledge Catalog サンプル GitHub ・リポジトリーからダウンロードできます。 詳しくは、 サンプル・データ品質定義 を参照してください。

    式に二重引用符で囲まれたストリングが含まれている場合は、特別な考慮事項が適用されます。例: ucase(trim(var_first_name)) NOT contains "YOU'RE"

    このような値は、ストリング・リテラルとして扱われます。 ただし、そのような値を変数として扱いたい場合は、 IBM Knowledge Catalog API データ品質ルールのプロジェクト設定の置換 を使用して、プロジェクト設定 allow_quoted_variablestrue に変更できます。

    フリー・フォーム・エディターで式を記述する代わりに、ブロック・エレメントを使用してルール論理を構成することができます。

    1. 「ロジック (Logic)」グループからエレメントを選択します (例えば、「IF THEN」)。 ルール・ロジックは、AND 演算子、OR 演算子、および NOT 演算子を使用して拡張できます。

    2. チェック を選択し、使用するチェックのタイプを選択して、それを IF ブロックに接続します。

    3. 変数およびリテラル演算子日時一般数学 、または ストリング のグループから、検査に必要な数の条件を選択し、 検査 ロジックにドラッグします。

    4. 「検査 (Checks)」グループから 1 つ以上のタイプの検査を選択し、それを THEN ブロックに接続します。

    5. 変数およびリテラル演算子日時一般数学 、または ストリング のグループから、検査に必要な数の条件を選択し、 検査 ロジックにドラッグします。

    6. キャンバスまたは個々のブロックを右クリックすると、追加のアクションが使用可能になります。 例えば、ブロックを複製したり、コメントを追加したりできます。

    ヒント:

    コメントは、常にブロック・セクションに追加してください。 「ルール式」テキスト域でコメントを入力または更新すると、正常に機能しない場合があります。

    ブロック・エレメントまたは構成全体をごみ箱にドラッグして削除できます。

    ルール式 」フィールドでルール論理を確認します。

    作成 」をクリックすると、式の構文が検査されます。 有効な場合は、データ品質定義が作成されます。 これで、この定義からデータ品質ルールを作成できます。

データ品質定義のパブリッシュ

データ品質定義をカタログに公開すると、他のプロジェクトで再利用できるようになります。公開したデータ品質定義は、任意の数のプロジェクトに追加できます。 その前に、データ品質定義の説明に意味のある情報が記載されていることを確認してください。 この情報は、他のユーザーがプロジェクトで使用する適切なデータ品質定義を選択するのに役立ちます。

データ品質定義をパブリッシュするには、次のようにします。

  1. 資産 のリストからデータ品質定義を選択し、 カタログに公開 をクリックします。 あるいは、 資産 のオーバーフロー・メニューから カタログに公開 を選択することもできます。

  2. カタログを選択し、 資産 ・プロパティーを入力します。

  3. カタログ内に資産の重複が既に存在する場合は、そのような場合に実行するアクションを指定できます。 選択項目は、カタログのデフォルト設定によって決まります。 資産 の重複処理について詳しくは、 カタログ内の重複する 資産 の処理 を参照してください。

  4. 「公開」 をクリックします。 資産がカタログに追加され、ユーザーがその所有者になります。 ガバナンス成果物 セクションに、割り当てられたビジネス用語と分類がリストされます。 割り当てられたガバナンス・ルールは、 Is governed by 関係を持つ Related items セクションに表示されます。

    ルール式と選択したデータ品質ディメンションもパブリッシュされ、カタログ内の 資産 ・プレビューで使用できるようになります。

データ品質定義に用語が割り当てられている場合、用語の 関連コンテンツ ページの データ品質定義 セクションには、その関係を持つ定義が存在するコンテナーごとに 1 つの項目が含まれます。 ガバナンス・ルールとの関係にも同じことが当てはまります。

カタログからプロジェクトにデータ品質定義を追加する場合、割り当てられた分類と定義されている可能性がある関係はプロジェクトにコピーされません。

データ品質定義の編集

データ品質定義を編集して、名前、説明、選択したデータ品質ディメンション、ルール式、またはビジネス用語またはガバナンス・ルールの割り当てを更新できます。

データ品質定義を編集するには、 資産 を開き、適切なアクションを実行します。

  • 変更するプロパティーの横にある 編集 アイコン 編集アイコン をクリックします。
  • 資産 名の横にあるオーバーフロー・メニューからオプションを選択します。 例えば、 名前変更 を選択して、 資産 名を変更できます。

ルール式に変更を加えると、このデータ品質定義から派生したすべてのルールに影響を与えることに注意してください。 このデータ品質定義に関連するルールがある場合、それらを確認するには、 情報 アイコン 情報アイコン をクリックします。

データ品質定義の削除

以下のいずれかの方法で、データ品質定義を削除できます。

  • プロジェクトで、データ品質定義を選択し、 削除 をクリックします。
  • データ品質定義を開き、データ品質定義の名前の横にあるオーバーフロー・メニューから 削除 を選択します。

このデータ品質定義に基づいているデータ品質ルールがある場合は、それらのルールを削除してからでないと、定義を削除できません。

詳細はこちら