サポートされるデータ・ソース

IBM Cloud Pak® for Dataでは、データが存在する場所に関係なく、データに接続できます。

データに接続する方法
コネクター
その他のデータ・ソース
データ・ファイル
データ・ソースへの接続 (サービスを使用)

データに接続する方法

データに接続する方法は、 Cloud Pak for Dataにインストールされているサービスなど、いくつかの要因によって異なります。一部のサービスでは、プラットフォーム・レベルで定義されている接続を使用することができますが、サービスに固有の接続を使用するサービスもあります。

以下のリストを使用して、ユース・ケースに適した方法を判別してください。

プラットフォーム・レベルでの接続の作成

一般的に、プラットフォーム・レベルの接続により、接続の作成と保守のプロセスが簡素化します。接続を作成すると、複数のサービスがその接続を参照できるようになります。接続を更新すると、その接続を使用するプロジェクトによって変更が自動的に反映されます。

「プラットフォーム接続」ページからプラットフォーム・レベルの接続を作成できます。これらの接続は、プラットフォーム全体のさまざまなサービスで使用できます。ただし、プラットフォーム接続ページは、Cloud Pak for Datacommon core servicesがインストールされている場合にのみ使用できます。

詳しくは、プラットフォーム・レベルでのデータ・ソースへの接続を参照してください。

以下の記述が該当する場合は、プラットフォーム・レベルで接続を作成することを検討してください。

サービスはプラットフォーム・レベルの接続をサポートします。
複数のサービスまたはインスタンス、あるいは複数のプロジェクトで同じ接続を使用する必要がある
プラットフォーム・レベルの接続を作成するための適切な権限を持っている。
プラットフォーム接続ページでエディター・ロールまたは管理者役割を持っている必要があります。詳しくは、プラットフォーム接続でのコラボレーターの管理を参照してください。

プラットフォーム接続はすべてのプラットフォーム・ユーザーに表示されます。ただし、データ・ソースの資格情報を持つユーザーのみが接続を使用できます。

接続先のデータ・ソースのタイプが表示されない場合は、Cloud Pak for Data管理者が JDBC ドライバー JAR ファイルをアップロードして、データ・ソースへの汎用 JDBC 接続を作成できます。詳しくは、データ・ソース用の JDBC ドライバーのインポートを参照してください。

すべてのサービスで同じタイプの接続がサポートされるわけではありません。プラットフォーム接続カタログからの接続を使用する場合、接続のリストは、サービスがサポートする接続のタイプに基づいてフィルタリングされます。例えば、接続を使用してデータ・ソースをプロジェクトに追加する場合、プロジェクトでサポートされている接続のみが表示されます。

サービス・レベルでの接続の作成

以下のいずれかの条件に該当する場合は、サービス・レベルで接続を作成します。

使用しているサービスは、プラットフォーム・レベルの接続をサポートしていません。
プラットフォーム・レベルの接続を作成するための適切な権限がありません。
セキュリティー上の理由から、接続を接続カタログに含めないようにします。

詳しくは、サービス・レベルでのデータ・ソースへの接続を参照してください。

コネクター

以下の表に、Cloud Pak for Dataから接続できるデータ・ソースをリストします。

コネクター	Watson™ Knowledge Catalog, Watson Studio	SPSS® Modeler	DataStage®	Watson Query
Amazon RDS for MySQL	✓ 注を参照	✓	✓	✓
Amazon RDS for Oracle	✓ 注を参照		✓	✓
Amazon RDS for PostgreSQL	✓ 注を参照	✓	✓	✓
Amazon Redshift	✓ 注を参照	✓	✓	✓
Amazon S3	✓ 注を参照	✓	✓	✓
Apache Cassandra	✓ 注を参照	✓	✓
Apache Cassandra (最適化)			✓
Apache Derby	✓ 注を参照	✓		✓
Apache HBase			✓
Apache HDFS	✓ 注を参照	✓	✓
コネクター	Watson Knowledge Catalog, Watson Studio	SPSS Modeler	DataStage	Watson Query
Apache Hive	✓ 注を参照	✓	✓	✓
Apache Kafka	✓ 注を参照		✓
Box	✓ 注を参照	✓	✓
Cloudera Impala	✓ 注を参照	✓	✓	✓
Dremio	✓ 注を参照		✓
Dropbox	✓ 注を参照	✓	✓
Elasticsearch	✓ 注を参照		✓
Exasol	✓ 注を参照	✓	✓
ファイル・システム			✓	✓
FTP (リモート・ファイル・システム転送)	✓ 注を参照	✓	✓
汎用 JDBC	✓ 注を参照		✓	✓
コネクター	Watson Knowledge Catalog, Watson Studio	SPSS Modeler	DataStage	Watson Query
汎用 S3	✓ 注を参照		✓
Google BigQuery	✓ 注を参照	✓	✓	✓
Google Cloud Pub/Sub			✓
Google Cloud Storage	✓ 注を参照	✓	✓
Greenplum	✓ 注を参照	✓	✓	✓
Execution Engine for Hadoop経由のHDFS	✓ 注を参照	✓
Hive JDBC			✓	✓
Execution Engine for Hadoop経由のHive	✓ 注を参照	✓
HTTP	✓ 注を参照	✓	✓
コネクター	Watson Knowledge Catalog, Watson Studio	SPSS Modeler	DataStage	Watson Query
IBM Cloud® Data Engine	✓ 注を参照	✓
IBM Cloud Databases for MongoDB	✓ 注を参照	✓	✓	✓
IBM Cloud Databases for MySQL	✓ 注を参照	✓	✓	✓
IBM Cloud Databases for PostgreSQL	✓ 注を参照	✓	✓	✓
IBM® Cloud Object Storage	✓ 注を参照	✓	✓	✓
IBM Cloud Object Storage (インフラストラクチャー)	✓ 注を参照	✓
IBM Cloudant®	✓ 注を参照	✓
IBM Cognos® Analytics	✓ 注を参照	✓	✓
IBM Data Virtualization Manager for z/OS®	✓ 注を参照	✓	✓	✓
コネクター	Watson Knowledge Catalog, Watson Studio	SPSS Modeler	DataStage	Watson Query
IBM Db2®	✓ 注を参照	✓	✓	✓
IBM Db2 (最適化)			✓
IBM Db2 Big SQL	✓ 注を参照	✓	✓	✓
IBM Db2 for i	✓ 注を参照	✓	✓	✓
IBMDb2 for z/OS	✓ 注を参照	✓	✓	✓
IBM Db2 on Cloud	✓ 注を参照	✓	✓	✓
IBM Db2 Warehouse	✓ 注を参照	✓	✓	✓
IBM Informix®	✓ 注を参照	✓	✓	✓
IBM Match 360	✓ 注を参照		✓
コネクター	Watson Knowledge Catalog, Watson Studio	SPSS Modeler	DataStage	Watson Query
IBM MQ			✓
IBM Netezza® Performance Server	✓ 注を参照	✓	✓	✓
IBM Netezza Performance Server (最適化)			✓
IBM Planning Analytics	✓ 注を参照	✓		✓
IBM Product Master	✓ 注を参照
IBM SPSS Analytic Server	✓ 注を参照	✓
IBM Watson Query	✓ 注を参照	✓	✓
Execution Engine for Hadoop経由の Impala	✓ 注を参照	✓
Looker	✓ 注を参照	✓
MariaDB	✓ 注を参照	✓	✓	✓
Microsoft Azure Blob Storage	✓ 注を参照	✓	✓
Microsoft Azure Cosmos DB	✓ 注を参照	✓	✓
Microsoft Azure Data Lake Storage	✓ 注を参照	✓	✓
コネクター	Watson Knowledge Catalog, Watson Studio	SPSS Modeler	DataStage	Watson Query
Microsoft Azure File Storage	✓ 注を参照	✓	✓
Microsoft Azure SQL Database	✓ 注を参照	✓	✓	✓
Microsoft Power BI (Azure)	Watson Knowledge Catalog
Microsoft Power BI (Local)	Watson Knowledge Catalog
Microsoft SQL Server	✓ 注を参照	✓	✓	✓
Microsoft SQL Server Integration Services	Watson Knowledge Catalog
Microsoft SQL Server Reporting Services	Watson Knowledge Catalog
MinIO	✓ 注を参照	✓		✓
MongoDB	✓ 注を参照	✓	✓	✓
MySQL (My SQL Community Edition) (My SQL Enterprise Edition)	✓ 注を参照	✓	✓	✓
OData	✓ 注を参照
ODBC		✓	✓
Oracle	✓ 注を参照	✓	✓	✓
Oracle (最適化)			✓
Oracle Business Intelligence Enterprise Edition	Watson Knowledge Catalog
Oracle Data Integrator	Watson Knowledge Catalog
PostgreSQL	✓ 注を参照	✓	✓	✓
Presto	✓ 注を参照		✓
コネクター	Watson Knowledge Catalog, Watson Studio	SPSS Modeler	DataStage	Watson Query
Qlik Sense	Watson Knowledge Catalog
Salesforce.com	✓ 注を参照	✓	✓	✓
Salesforce.com (最適化)			✓
SAP ASE	✓ 注を参照	✓	✓	✓
SAP Bulk Extract			✓
SAP Delta Extract			✓
SAP HANA	✓ 注を参照	✓	✓	✓
SAP IDoc			✓
SAP IQ	✓ 注を参照	✓	✓
SAP OData	✓ 注を参照	✓	✓	✓
SingleStoreDB	✓ 注を参照		✓
Snowflake	✓ 注を参照	✓	✓	✓
Storage volume	✓ 注を参照	✓	✓
Tableau	✓ 注を参照	✓	✓
Teradata	✓ 注を参照	✓	✓	✓
Teradata (最適化)			✓
watsonx.data	Watson Knowledge Catalog

注: Watson Knowledge Catalogの Watson Studio 列には、カタログおよびプロジェクトでサポートされるデータ・ソースがこの表に表示されます。これらのサービスの一部のツールは、これらのデータ・ソースのサブセットのみをサポートします。特定のデータ・ソースのリンクをたどると、そのデータ・ソースをサポートするツールのリストが表示されます。ツールごとのサポートされるコネクターも参照してください。

その他のデータ・ソース

管理者は、JDBC ドライバーをアップロードして、より多くのデータ・ソースへの接続を有効にすることができます。データ・ソースの JBDC ドライバーのインポートを参照してください。

Watson Queryサービスは、サード・パーティーの JDBC ドライバーを使用して確立された接続をサポートします。

データ・ファイル

リモート・データ・ソースまたは統合データベースからのデータの使用に加え、ファイルのデータを使用することもできます。次のタイプのファイルのデータを処理できます。

データ・ファイルのタイプ	サポート対象
Avro	DataStage SPSS Modeler Watson Knowledge Catalog Watson Studio
CSV	DataStage SPSS Modeler Watson Knowledge Catalog Watson Query Watson Studio
JSON	DataStage Watson Knowledge Catalog Watson Query Watson Studio
Microsoft Excel スプレッドシート	DataStage SPSS Modeler Watson Knowledge Catalog Watson Query Watson Studio
ORC	Watson Query
Parquet	DataStage Watson Knowledge Catalog Watson Query Watson Studio
SAS	SPSS Modeler Watson Studio (Data Refinery)
SAV	SPSS Modeler
TSV	DataStage Watson Knowledge Catalog Watson Query Watson Studio (Data Refinery)
XML	DataStage SPSS Modeler

データ・ソースへの接続 (サービスを使用)

以下のリソースを使用して、アプリケーションで接続を作成します。

Cognos Dashboards

ダッシュボードのデータ・ソースとして、CSV ファイル、Microsoft Excel スプレッドシート、接続されたデータ資産、および Watson Query 資産を使用できます。これらのデータ・ソースをデータ・ソースとして使用するには、すべてのデータ・ソースをプロジェクトに追加する必要があります。

ダッシュボードにデータ・ソースを追加するには、「選択されたソース」ペインの「ソースの追加」 (+) ボタンをクリックします。

詳しくは、 Cognos Dashboardsを参照してください。

Data Refinery

Data Refineryというグラフィカル・フロー・エディター・ツールを使用して、表データのクレンジングと詳細化を行うことができます。データを詳細化するには、データ・ソースへの接続を追加し、ソース・ファイルの制限を理解する必要があります。詳しくは、データの精製 (Data Refinery) および Data Refinery でサポートされるデータ・ソースを参照してください。

DataStage

DataStage は、 DataStage キャンバス上のコネクターを使用して、リモート・データ・ソースを処理します。データ・ソースに接続するには、 DataStageで使用する前に、関連付けられた DataStage コネクターの接続資産を作成する必要があります。

DataStageでリモート・データ・ソースに接続する手順については、 DataStageでのデータ・ソースへの接続を参照してください。
使用可能な DataStage コネクターのリストについては、 DataStageでサポートされるデータ・ソースを参照してください。
CSV ファイルなどのローカル・ファイルを追加するには、プロジェクトへのデータの追加を参照してください。

SPSS Modeler

SPSS Modelerサービスのデータ・ソースは、読み取り専用アクセス、読み取り/書き込みアクセス、および SQL プッシュバックをサポートします。

SPSS Modelerサービスは、その他のいくつかのファイル・タイプもサポートします。

詳しくは、SPSS Modelerでサポートされるデータ・ソースを参照してください。

Watson Knowledge Catalog

カタログ内またはプロジェクト内で使用できる接続、およびデータのキュレートに使用できる接続を作成できます。通常、「プラットフォーム接続」ページから接続を作成できます。さらに、以下のようにして接続を作成できます。

カタログの「資産」ページからカタログで使用できる接続。詳しくは、カタログへの接続資産の追加 (Watson Knowledge Catalog)を参照してください。
プロジェクトの「資産」ページから、プロジェクトで使用できる接続。詳しくは、プロジェクトへのデータの追加を参照してください。
メタデータ・インポート資産の作成時にプロジェクトでメタデータ・インポートに使用できる接続。詳しくは、メタデータ・インポートの管理を参照してください。

Watson Query

以下の場所から、データの仮想化に使用できる接続を作成できます。

「プラットフォーム接続」ページ
Watson Queryサービスの「データ・ソース」ページ。

詳しくは、データ・ソースの追加 (Watson Query)を参照してください。

Watson Studio

理想的には、既にカタログ内にあるデータを使用します。カタログ内で必要なデータを検索し、それをプロジェクトに追加します。

あるいは、以下の場所からプロジェクトで使用できる接続を作成することもできます。

「接続」ページ
プロジェクトの「資産」ページ

また、ファイルのデータを追加することもできます。ファイルからデータを追加するには、プロジェクトの「資産」ページに移動します。

詳しくは、プロジェクトへのデータの追加を参照してください。