サポートされるデータ・ソース
IBM Cloud Pak for Data バージョン 4.7 がサポート終了になる前に、 IBM Software Hub バージョン 5.1 にアップグレードしてください。 詳細については、 IBM Software Hub Version 5.1 ドキュメントの Upgrading IBM Software Hub を参照してください。
IBM Cloud Pak for Dataでは、データが存在する場所に関係なく、データに接続できます。
データに接続する方法
データに接続する方法は、 Cloud Pak for Dataにインストールされているサービスなど、いくつかの要因によって異なります。 一部のサービスでは、プラットフォーム・レベルで定義されている接続を使用することができますが、サービスに固有の接続を使用するサービスもあります。
以下のリストを使用して、ユース・ケースに適した方法を判別してください。
- プラットフォーム・レベルでの接続の作成
- 一般的に、プラットフォーム・レベルの接続により、接続の作成と保守のプロセスが簡素化します。 接続を作成すると、複数のサービスがその接続を参照できるようになります。 接続を更新すると、その接続を使用するプロジェクトによって変更が自動的に反映されます。
「プラットフォーム接続」ページからプラットフォーム・レベルの接続を作成できます。 これらの接続は、プラットフォーム全体のさまざまなサービスで使用できます。 ただし、プラットフォーム接続ページは、Cloud Pak for Datacommon core servicesがインストールされている場合にのみ使用できます。
詳しくは、 プラットフォーム・レベルでのデータ・ソースへの接続を参照してください。
以下の記述が該当する場合は、プラットフォーム・レベルで接続を作成することを検討してください。
- サービスはプラットフォーム・レベルの接続をサポートします。
- 複数のサービスまたはインスタンス、あるいは複数のプロジェクトで同じ接続を使用する必要がある
- プラットフォーム・レベルの接続を作成するための適切な権限を持っている。
プラットフォーム接続ページでエディター・ロールまたは管理者役割を持っている必要があります。 詳しくは、 プラットフォーム接続での共同作業者の管理をご覧ください。
プラットフォーム接続はすべてのプラットフォーム・ユーザーに表示されます。 ただし、データ・ソースの資格情報を持つユーザーのみが接続を使用できます。
接続先のデータ・ソースのタイプが表示されない場合は、Cloud Pak for Data管理者が JDBC ドライバー JAR ファイルをアップロードして、データ・ソースへの汎用 JDBC 接続を作成できます。 詳しくは、 データ・ソース用の JDBC ドライバーのインポートを参照してください。
すべてのサービスで同じタイプの接続がサポートされるわけではありません。 プラットフォーム接続カタログからの接続を使用する場合、接続のリストは、サービスがサポートする接続のタイプに基づいてフィルタリングされます。 例えば、接続を使用してデータ・ソースをプロジェクトに追加する場合、プロジェクトでサポートされている接続のみが表示されます。
- サービス・レベルでの接続の作成
- 以下のいずれかの条件に該当する場合は、サービス・レベルで接続を作成します。
- 使用しているサービスは、プラットフォーム・レベルの接続をサポートしていません。
- プラットフォーム・レベルの接続を作成するための適切な権限がありません。
- セキュリティー上の理由から、接続を接続カタログに含めないようにします。
詳しくは、 サービス・レベルでのデータ・ソースへの接続を参照してください。
コネクター
以下の表に、Cloud Pak for Dataから接続できるデータ・ソースをリストします。
その他のデータ・ ソース
管理者は、JDBC ドライバーをアップロードして、より多くのデータ・ソースへの接続を有効にすることができます。 データ・ソースの JBDC ドライバーのインポートを参照してください。
Watson Queryサービスは、サード・パーティーの JDBC ドライバーを使用して確立された接続をサポートします。
データ・ ファイル
リモート・データ・ソースまたは統合データベースからのデータの使用に加え、ファイルのデータを使用することもできます。 次のタイプのファイルのデータを処理できます。
| データ・ファイルのタイプ | サポート対象 |
|---|---|
| Avro | DataStage SPSS
Modeler Watson
Knowledge Catalog Watson
Studio |
| CSV | DataStage
SPSS
Modeler Watson
Knowledge Catalog Watson Query
Watson
Studio |
| JSON | DataStage
Watson
Knowledge Catalog Watson Query
Watson
Studio |
| Microsoft Excel スプレッドシート | DataStage
SPSS
Modeler Watson
Knowledge Catalog Watson Query
Watson
Studio |
| ORC | Watson Query |
| Parquet | DataStage
Watson
Knowledge Catalog Watson Query
Watson
Studio |
| SAS | SPSS
Modeler Watson
Studio (Data Refinery) |
| SAV | SPSS Modeler |
| TSV | DataStage
Watson
Knowledge Catalog Watson Query
Watson
Studio (Data Refinery) |
| XML | DataStage
SPSS
Modeler |
データ・ソースへの接続 (サービスを使用)
以下のリソースを使用して、アプリケーションで接続を作成します。
- Cognos Dashboards
- ダッシュボードのデータ・ソースとして、CSV ファイル、Microsoft Excel スプレッドシート、接続されたデータ資産、および Watson Query 資産を使用できます。 これらのデータ・ソースをデータ・ソースとして使用するには、すべてのデータ・ソースをプロジェクトに追加する必要があります。
ダッシュボードにデータ・ソースを追加するには、 「選択されたソース」 ペインの 「ソースの追加」 (+) ボタンをクリックします。
詳しくは、 Cognos Dashboardsを参照してください。
- Data Refinery
Data Refineryというグラフィカル・フロー・エディター・ツールを使用して、表データのクレンジングと詳細化を行うことができます。 データを詳細化するには、データ・ソースへの接続を追加し、ソース・ファイルの制限を理解する必要があります。 詳しくは、データの精製 (Data Refinery) および Data Refinery でサポートされるデータ・ソースを参照してください。
- DataStage
- DataStage は、 DataStage キャンバス上の コネクター を使用して、リモート・データ・ソースを処理します。 データ・ソースに接続するには、 DataStageで使用する前に、関連付けられた DataStage コネクターの 接続資産 を作成する必要があります。
- DataStageでリモート・データ・ソースに接続する手順については、 DataStageでのデータ・ソースへの接続を参照してください。
- 使用可能な DataStage コネクターのリストについては、 DataStageでサポートされるデータ・ソースを参照してください。
- CSV ファイルなどのローカル・ファイルを追加するには、 プロジェクトへのデータの追加を参照してください。
- SPSS Modeler
- SPSS
Modelerサービスのデータ・ソースは、読み取り専用アクセス、読み取り/書き込みアクセス、および SQL プッシュバックをサポートします。
SPSS Modelerサービスは、その他のいくつかのファイル・タイプもサポートします。
詳しくは、SPSS Modelerでサポートされるデータ・ソースを参照してください。
- Watson Knowledge Catalog
- カタログ内またはプロジェクト内で使用できる接続、およびデータのキュレートに使用できる接続を作成できます。 通常、 「プラットフォーム接続」 ページから接続を作成できます。 さらに、以下のようにして接続を作成できます。
- カタログの 「資産」 ページからカタログで使用できる接続。 詳しくは、 カタログへの接続資産の追加 (Watson Knowledge Catalog)を参照してください。
- プロジェクトの 「資産」 ページから、プロジェクトで使用できる接続。 詳しくは、 プロジェクトへのデータの追加を参照してください。
- メタデータ・インポート資産の作成時にプロジェクトでメタデータ・インポートに使用できる接続。 詳しくは、 メタデータ・インポートの管理を参照してください。
- Watson Query
- 以下の場所から、データの仮想化に使用できる接続を作成できます。
- 「プラットフォーム接続」ページ
- Watson Queryサービスの「データ・ソース」ページ。
詳しくは、データ・ソースの追加 (Watson Query)を参照してください。
- Watson Studio
理想的には、既にカタログ内にあるデータを使用します。 カタログ内で必要なデータを検索し、それをプロジェクトに追加します。
あるいは、以下の場所からプロジェクトで使用できる接続を作成することもできます。- 「接続」ページ
- プロジェクトの 「資産」 ページ
また、ファイルのデータを追加することもできます。 ファイルからデータを追加するには、プロジェクトの 「資産」 ページに移動します。
詳しくは、 プロジェクトへのデータの追加を参照してください。