{

ガバナンス・アーティファクトのインポート方法

ファイルでガバナンス成果物インポートすることができます。 一度に 1 種類のガバナンス成果物をインポートすることも、別の IBM watsonx.data intelligence インスタンスからすべてのガバナンス成果物をインポートすることもできます。

デプロイメント環境間の互換性

次の配置環境上の IBM watsonx.data intelligence インスタンス間で、ガバナ ンス成果物をエクスポートし、インポートできます:

  • Cloud Pak for Data 3.5
  • Cloud Pak for Data 4.x
  • Cloud Pak for Data 5.x
  • IBM watsonx

スチュワードの値は、 IBM watsonx.data intelligence インスタンス IBM watsonx と Cloud Pak for Data 3.5 または 4.x の間では互換性がありません。

IBM InfoSphere Information Governance Catalog から IBM watsonx.data intelligence インスタンス Cloud Pak for Data 3.5 および 4.x にガバナンスの成果物をインポートできます。 IBM InfoSphere Information Governance Catalog から IBM watsonx.data intelligence のガバナンスアーティファクトを IBM watsonx のインスタンスにインポートするには、各 CSV ファイルを編集し、 IBM watsonx.data intelligence のアーティファクト CSV ファイルの形式に適合させる必要があります。 例えば、以下のような編集が必要になるかもしれない:

  • サポートされていない列を削除する
  • 異なるアーティファクトタイプを複数の CSV ファイルに分割する
  • サポートされている列の変更
  • 必要な列を追加する

輸入方法の比較

目標や状況に応じて適切な輸入方法を選びましょう。

単一タイプのアーティファクトをインポートする

CSV ファイルを使用して、一度に1種類のガバナンスアーティファクトをインポートできます。

この方法は、以下のような場合に有効である:

  • インポートした成果物をワークフローの対象としたい。
  • あるタイプのガバナンス成果物プロパティの値を追加したい。 そのアーティファクトタイプを CSV ファイルとしてエクスポートし、 CSV ファイルを編集してからインポートします。 たとえば、ビジネス用語にカスタム属性を追加するには、この方法を使用できます。
  • 別のプログラムで成果物を定義したい。 各アーティファクトタイプごとに CSV ファイルを作成する。 例えば、表計算ソフトで成果物を定義し、それをインポートするためにこの方法を使うことができる。

ガバナンスアーティファクトのインポートについては、「 CSV ファイルによるタイプ別ガバナンスアーティファクトのインポート」 および「 CSV ファイル形式によるガバナンスアーティファクトのインポート」 を参照してください。

複数のタイプの成果物をインポート

IBM watsonx.data intelligence インスタンスから既存のガバナンス成果物を複数種類エクスポートして作成した ZIP ファイルで、複数種類のガバナンス成果物をインポートできます。 ZIPファイルには、カテゴリおよびエクスポートされたすべてのアーティファクトタイプ用の CSV ファイルが含まれています。 CSV ファイルは、以下の点を除き、 CSV インポートファイルの形式と一致します:

  • ArtifactID カラムが追加され、名前とカテゴリパスでアーティファクトを識別する代わりに、アーティファクトの識別子が含まれる。
  • 関連アーティファクトは、コンテキストと名前の代わりにアーティファクトIDで定義される。

この方法は、以下のような場合に有効である:

  • IBM watsonx.data intelligence インスタンスから別のインスタンスにすべてのガバナンスの成果物を移動したい。

ZIPファイルによるインスタンスからの複数タイプのガバナンス成果物インポート を参照。 また、 cpd-cli コマンドを使用して、 Cloud Pak for Data クラスタ内または異なるクラスタ間で、ZIP ファイルを使用してガバナンス成果物エクスポートおよびインポートすることもできます。 詳しくは、 IBM Software Hub ドキュメントの ガバナンス成果物移行 を参照。

以下の表は、 CSV ファイルまたはZIPファイルを使用したアーティファクトのインポートの違いをまとめたものです。

特性 CSV ファイル (CSV file) ZIP ファイル
ファイルの作成 -
- 表計算プログラムでファイルを作成
- IBM InfoSphere Information Governance Catalog から成果物をエクスポートし、フォーマットを調整する
インスタンスから複数のタイプの成果物をエクスポートする
アーティファクトの種類数 カテゴリーまたは1ファイルにつき1つの成果物タイプ。 複数の種類のアーティファクトがあり、カテゴリごとに分類され、各種類のアーティファクトは個別の CSV ファイルに記述される。
輸入方法 - UI を通して
- API リクエスト
- CLI
- API リクエスト
ワークフロー すべての成果物はドラフトとしてインポートされ、ワークフローの対象となる。 カテゴリーはワークフローの対象ではないため、すぐに公開される。 すべてのアーティファクトとカテゴリーは即座に公開される。
必要な権限 カテゴリーを作成または編集する権限。 インポートするカテゴリーのエディター以上でなければなりません。 詳細は「 必要な権限 」を参照。 用語集の管理許可

インポートできるガバナンスの成果物

どちらのインポート方法でも、 カテゴリと以下のタイプのガバナンス成果物インポートできます:

制約事項:

  • 再インポートされたアーティファクト(公開済みバージョンにリンクされているアーティファクト)は、バージョンとしてではなく、新しいリビジョンとしてのみ公開できます。
  • 他のアーティファクトとの関係を含め、これらのタイプのガバナンス成果物すべてのプロパティの値をインポートできます。 ただし、リレーションシップは、関連するアーティファクトが存在するか、同じインポートプロセスで定義されている場合にのみインポートされる。 インポート処理でスキップされたリレーションシップを追加するには、まず、インポートされたすべてのドラフト成果物をパブリッシュしてから、インポート処理を再度実行する。
  • CSV を使用して、 Cloud Pak for Data インスタンス間でガバナンスアーティファクトとその関係を移動することはできません。 例えば、 CSV を参照するデータクラスを、対応するメソッド Match とともにエクスポートし、それを別の Cloud Pak for Data インスタンスにインポートしようとすると、インポートは失敗します。これは、 CSV のインポートおよびエクスポートではアーティファクト ID が含まれないためです。 代わりにZIPインポートを使用してください。
  • CSV ファイルから参照データセットをインポートする際、そのセットの参照データ値はインポートされません。 値をデータセットにインポートするには、別途 CSV を使用する必要があります。 または、ZIPインポートを使用して、参照データセットとその参照データ値の両方をインポートすることもできます。 詳細については、 参照データセットのファイルのインポートを参照してください。
  • データ保護ルールやデータ品質SLAルールはインポートできません。

インポートした成果物と既存の成果物をマージする方法

CSV ファイルまたはZIPファイルでアーティファクトをインポートする場合、既存のガバナンスアーティファクトをインポートした際にプロパティの値が異なる場合の処理を選択する必要があります。 次の表は、3つのマージ方法をまとめたものである。

結合方法 API オリジナル値への影響 輸入価値への影響
すべての値を置換 merge_option=all 元の値をすべて破棄する。 空の値であっても、インポートされたすべての値を受け入れる。
定義された値で置き換える merge_option=specified インポートした値が空の場合、元の値を保持する。 空の値を除き、インポートされたすべての値を受け入れる。
空の値を置き換える merge_option=empty 空の値を除き、元の値を保持する。 空の値を置き換えるインポートされた値のみを受け入れる。

新しい人工物の場合、これらの方法はいずれも同じ結果を生む。

すべての値を置換

アーティファクトの元の値はすべて破棄され、インポートされたアーティファクトの値に置き換えられる。 インポートされたアーティファクトのプロパティの値が空の場合、そのプロパティの元の値はすべて削除されます。

たとえば、公開済みのビジネス用語「 リリース 」があり、それを変更するために CSV ファイルをインポートするとします。 以下の表は、 Replace all values オプションの効果を示している:

プロパティー 元の値 CSV ファイル内の値 結果
名前 リリース リリース リリース
成果物タイプ 用語集_用語 用語集_用語 用語集_用語
カテゴリー マーケティング マーケティング マーケティング
説明 用例用語 編集例 編集例
タグ ベータ ベータ
関連用語 マーケティング>>バージョン マーケティング>>日付 マーケティング>>日付
分類

機密

出来上がったドラフト・アーティファクトは、元の値に対してこのような変更が加えられている:

  • 元の記述は新しい記述に置き換えられる。
  • タグの元の空の値は値で置き換えられる。
  • 元の関連語は新しい関連語に置き換えられる。
  • 元の分類値は空の値で置き換えられる。
注:

マージ all オプションを使用する際は、すべての CSV コンテンツがアーティファクト間の関係性に関して一貫していることを確認する必要があります。 例えば、ZIPインポートファイルに用語とデータクラスが関係で結びつけられて含まれている場合、この関係はデータクラス CSV と用語 CSV の両方に存在する必要があります。 そうでない場合、リレーションシップのインポート動作は予測不可能であり、リレーションシップはインポートされるかもしれないし、インポートされないかもしれない。

参照データ値を含むZIPファイルをインポートする場合、APIコールでは常に merge_option=all

定義された値で置き換える

アーティファクトの元の値と空の値は、インポートされたアーティファクトの提供された値で置き換えられます。 インポートされた成果物のプロパティーの値が空の場合、そのプロパティーの元の値が保持されます。

たとえば、公開済みのビジネス用語「 リリース 」があり、それを変更するために CSV ファイルをインポートするとします。 次の表は、 「定義された値で置換 」オプションの効果を示している:

プロパティー 元の値 CSV ファイル内の値 結果
名前 リリース リリース リリース
成果物タイプ 用語集_用語 用語集_用語 用語集_用語
カテゴリー マーケティング マーケティング マーケティング
説明 用例用語 編集例 編集例
タグ ベータ ベータ
関連用語 マーケティング>>バージョン マーケティング>>日付 マーケティング>>日付
分類

機密

機密

出来上がったドラフト・アーティファクトは、元の値に対してこのような変更が加えられている:

  • 元の記述は新しい記述に置き換えられる。
  • タグの元の空の値は値で置き換えられる。
  • 元の関連語は新しい関連語に置き換えられる。

空の値を置き換える

元のアーティファクトの空の値は、インポートされたアーティファクトの提供された値で置き換えられる。

たとえば、公開済みのビジネス用語「 リリース 」があり、それを変更するために CSV ファイルをインポートするとします。 以下の表は、 空の値を置換するオプションの効果を示している:

プロパティー 元の値 CSV ファイル内の値 結果
名前 リリース リリース リリース
成果物タイプ 用語集_用語 用語集_用語 用語集_用語
カテゴリー マーケティング マーケティング マーケティング
説明 用例用語 編集例 用例用語
タグ ベータ ベータ
関連用語 マーケティング>>バージョン マーケティング>>日付 マーケティング>>バージョン
分類

機密

機密

出来上がったドラフト・アーティファクトには、元の値にこのような変更が加えられている:

  • タグの元の空の値は値で置き換えられる。

アーティファクトのインポート時のバージョンと有効日付の取り扱い

既存のアーティファクトのインポート済みドラフトは、バージョンではなく新しいリビジョンとしてのみ公開できます。

インポート処理では有効日は無視されます。

インポートされたドラフトが新規のアーティファクト(つまり、公開済みバージョンに割り当てられていないもの)である場合、開始日は自動的に公開日として設定されます。

アーティファクトが再インポートされた場合(つまり、インポートされたドラフトが公開済みバージョンにリンクされている場合)、有効開始日は既存のアクティブバージョンに既に設定されており、インポートされたドラフトを公開した後も変更されません。

バージョンは、新しいバージョンに置き換えられて非アクティブになった時点で、有効な終了日を取得する。

セキュリティーに関する考慮事項

ガバナンスデータは CSV ファイルにエクスポートされる際、既知の CSV インジェクション攻撃に対してサニタイズ処理が施され、 CSV データを自動的に解釈するスプレッドシートプログラムで安全に使用できるようになっています。 その結果、以下のいずれかの文字で始まるテキスト値はすべて、その文字で始まることになる:

  • イコール
  • プラス
  • マイナス
  • アット

シングルクォート文字(')で始まる引数があります。機能性を一貫させるため、インポートされた CSV ファイルは追加で解析され、シングルクォート文字(')が自動的に削除されます。このサニタイズ処理は、ガバナンスアーティファクトをZIPファイルにインポートおよびエクスポートする際にも適用されます。これらは CSV ファイルを含むためです。

この機能を無効にするには

  1. Edit IBM watsonx.data intelligence Glossary Service deployment:

    oc edit deployment wkc-glossary-service
    
  2. 環境変数 ESCAPE_FORMULAS_IN_CSV_FILES に値 false を設定する。

詳細については、 CSV Injection を参照してください。

詳細情報