Custom Lineage Mappingsは、スキャナーからの自動リネージュ、既存のOpenLineageプロデューサーによって出力されるリネージュ、OpenLineageペイロードを通じて定義されるカスタム・リネージュなど、すべての長所を統合します。

IBM watsonx.data intelligenceでは、ランタイムまたは設計時にデータがどのように動くかを説明するためのオープン・スタンダードであるOpenLineageを使用しています。これにより、組織はカスタム・システムやレガシー・システムを含むあらゆるシステムのリネージュ・イベントを定義し、それらを統一された管理されたリネージュ・グラフにまとめることで、データ・ジャーニー全体でデータがどのように動き、変換するかを明らかにできます。

各OpenLineageイベントは、データがどのように移動するか、つまりデータが読み込むインプット、データを変換するジョブ、生成されるアウトプットについて記述します。これらのイベントは、dbtやAirflowなどのツールによって自動的に生成されることもあれば、顧客が独自の環境やレガシー環境用にイベントを自動的に排出するか手動で文書化するかを決定できることもあります。インポートされた後、watsonx.data intelligenceはこれらのイベントを既知の資産と整合させ、より広いリネージュ・ビュー内で視覚化します。

精度と一貫性を確保するために、watsonx.data intelligenceは2つの主要なメカニズムを提供しています。

テクノロジーテンプレート は、OpenLineageペイロードで定義されたジョブとデータセットがどのように解釈され、表示されるかを定義します。watsonx.data intelligenceには、事前定義されたテンプレートが含まれており、カスタム・テンプレートを構築できるため、多様なテクノロジー間で一貫したラインを実現できます。

データソース・マッピングは、OpenLineageのデータセットとジョブをwatsonx.data intelligenceの既存の資産に自動的にリンクします。また、カスタム・ルールを定義して、特定の名前空間を既知のデータ・ソースにマッピングし、カスタム・リネージュを管理対象のエンタープライズ・ビューにシームレスにつなぎ合わせることもできます。

その成果として、カスタム・リネージュ・マッピングは、自動化されたリネージュとカスタム・リネージュを統合した、管理された統合グラフを提供します。