Watson Query を使用したデータの仮想化

重要: IBM Cloud Pak® for Data バージョン 4.7 は、2025年7月31日にサポート終了(EOS)となります。 詳しくは、 サービス中止のお知らせ for IBM Cloud Pak for Data Version 4.X をご覧ください。

IBM Cloud Pak for Data バージョン 4.7 がサポート終了になる前に、 IBM Software Hub バージョン 5.1 にアップグレードしてください。 詳細については、 IBM Software Hub Version 5.1 ドキュメントの Upgrading IBM Software Hub を参照してください。

使用方法 Watson Query を使用して仮想テーブルを作成し、1 つまたは複数のテーブルからデータを分割または結合します。 Watson Query 複数のデータソースを、データソースまたはデータベースの単一の自己バランスコレクションに接続する。

概説

サービス このサービスは、デフォルトでは使用できません。 このサービスを管理者が IBM Cloud Pak for Data プラットフォームにインストールする必要があります。 サービスがインストールされているかどうかを確認するには、「サービス・カタログ」を開き、サービスが使用可能になっているかどうかを確認します。

Watson Query には、前提条件となるサービスやサービス統合はありません。 Watson Query は、まだプロビジョンされていない場合は IBM® Db2 Data Management Console をプロビジョンします。 管理対象カタログに仮想データを公開する場合は、 Watson Knowledge Catalogをインストールする必要があります。 詳細は Cloud Pak for Data の Watson Knowledge Catalog を参照。

データを仮想化するための最も一般的なメカニズムは、テーブル・ビューまたは仮想テーブルを作成することです。

図1: 複数のデータ・ソースの単一のコレクションへの連結
このイメージは、 Watson Query がデータ・ソースまたはデータベースの単一の自己バランス・コレクションに複数のデータ・ソースを接続する方法を示しています。

類似した複数のソースからのテーブルを 1 つの仮想テーブルに結合することができます。これにより、すべての関与データ・ソースからの列とデータを含む統一された定義が作成されます。 セグメンテーションは垂直方向(選択されたカラムの選択に基づいて、カラムのサブセットまたはスーパーセットのいずれか)です。 その後、基本表のいずれかを照会するのと同じ方法で、結果の仮想表に対して照会を実行できます。 これらのテーブルは、グループ化されたテーブルと呼ばれています。 詳細については、 Watson Query で複数のデータ ソースから仮想化テーブルを作成するを参照してください。

Watson Query サービスをプロビジョンした後、ユーザーの管理、複数のデータ・ソースへの接続、仮想資産の作成と管理、仮想化データの取り込みを行うことができます。
図2: Watson Query サービスを使用したデータの仮想化
「接続」、「結合」、「ビューの作成」、および「コンシューム」は、 Watson Queryに必要なメイン・アクションです。
  1. 接続 データ・ソースに接続することから始めます。 複数のデータ・ソースに接続することができます。 詳細については、 「データ ソースの追加」 および Watson Query でサポートされるデータ ソース」 を参照してください。
  2. 結合、作成、および管理 次に、仮想表を作成し、スキーマ別に表をグループ化し、データをプロジェクトに関連付け、仮想資産を管理します。 詳細については、 仮想化テーブルの作成および Watson Query における仮想データの管理を参照してください。
  3. コンシューム 最後に、プロジェクト、ダッシュボード、データ・カタログ、およびその他のアプリケーションで仮想表をコンシュームします。 詳しくは、 分析サービスダッシュボード・サービス、および データ・ガバナンス・サービスを参照してください。

詳細はこちら

これらのタスクについて詳しくは、以下のリソースを参照してください。 のチュートリアルでこれらのタスクを確認することもできます。 Data Virtualization オン IBM Cloud Pak for Data