サポートされるデータ・ソース

IBM Cloud Pak® for Dataでは、データが存在する場所に関係なく、データに接続できます。

データに接続する方法

データに接続する方法は、 Cloud Pak for Dataにインストールされているサービスなど、いくつかの要因によって異なります。 一部のサービスでは、プラットフォーム・レベルで定義されている接続を使用することができますが、サービスに固有の接続を使用するサービスもあります。

以下のリストを使用して、ユース・ケースに適した方法を判別してください。

プラットフォーム・レベルでの接続の作成
一般的に、プラットフォーム・レベルの接続により、接続の作成と保守のプロセスが簡素化します。 接続を作成すると、複数のサービスがその接続を参照できるようになります。 接続を更新すると、その接続を使用するプロジェクトによって変更が自動的に反映されます。

「プラットフォーム接続」ページからプラットフォーム・レベルの接続を作成できます。 これらの接続は、プラットフォーム全体のさまざまなサービスで使用できます。 ただし、プラットフォーム接続ページは、Cloud Pak for Datacommon core servicesがインストールされている場合にのみ使用できます。

詳しくは、 プラットフォーム・レベルでのデータ・ソースへの接続を参照してください。

以下の記述が該当する場合は、プラットフォーム・レベルで接続を作成することを検討してください。

  • サービスはプラットフォーム・レベルの接続をサポートします。
  • 複数のサービスまたはインスタンス、あるいは複数のプロジェクトで同じ接続を使用する必要がある
  • プラットフォーム・レベルの接続を作成するための適切な権限を持っている。

    プラットフォーム接続ページでエディター・ロールまたは管理者役割を持っている必要があります。 詳しくは、 プラットフォーム接続でのコラボレーターの管理を参照してください。

プラットフォーム接続はすべてのプラットフォーム・ユーザーに表示されます。 ただし、データ・ソースの資格情報を持つユーザーのみが接続を使用できます。

接続先のデータ・ソースのタイプが表示されない場合は、Cloud Pak for Data管理者が JDBC ドライバー JAR ファイルをアップロードして、データ・ソースへの汎用 JDBC 接続を作成できます。 詳しくは、 データ・ソース用の JDBC ドライバーのインポートを参照してください。

すべてのサービスで同じタイプの接続がサポートされるわけではありません。 プラットフォーム接続カタログからの接続を使用する場合、接続のリストは、サービスがサポートする接続のタイプに基づいてフィルタリングされます。 例えば、接続を使用してデータ・ソースをプロジェクトに追加する場合、プロジェクトでサポートされている接続のみが表示されます。

サービス・レベルでの接続の作成
以下のいずれかの条件に該当する場合は、サービス・レベルで接続を作成します。
  • 使用しているサービスは、プラットフォーム・レベルの接続をサポートしていません。
  • プラットフォーム・レベルの接続を作成するための適切な権限がありません。
  • セキュリティー上の理由から、接続を接続カタログに含めないようにします。

詳しくは、 サービス・レベルでのデータ・ソースへの接続を参照してください。

コネクター

以下の表に、Cloud Pak for Dataから接続できるデータ・ソースをリストします。

コネクター Watson™ Knowledge Catalog,
Watson
Studio
SPSS® Modeler DataStage® Watson Query
Amazon RDS for MySQL 注を参照
Amazon RDS for Oracle 注を参照
Amazon RDS for PostgreSQL 注を参照
Amazon Redshift 注を参照
Amazon S3 注を参照
Apache Cassandra 注を参照  
Apache Cassandra (最適化)      
Apache Derby 注を参照  
Apache HBase      
Apache HDFS 注を参照  
コネクター Watson Knowledge Catalog,
Watson
Studio
SPSS Modeler DataStage Watson Query
Apache Hive 注を参照
Apache Kafka 注を参照    
Box 注を参照  
Cloudera Impala 注を参照
Dremio 注を参照    
Dropbox 注を参照  
Elasticsearch 注を参照  
Exasol 注を参照  
ファイル・システム    
FTP (リモート・ファイル・システム転送) 注を参照  
汎用 JDBC 注を参照
コネクター Watson Knowledge Catalog,
Watson
Studio
SPSS Modeler DataStage Watson Query
汎用 S3 注を参照  
Google BigQuery 注を参照
Google Cloud Pub/Sub      
Google Cloud Storage 注を参照  
Greenplum 注を参照
Execution Engine for Hadoop経由のHDFS 注を参照    
Hive JDBC    
Execution Engine for Hadoop経由のHive 注を参照    
HTTP 注を参照  
コネクター Watson Knowledge Catalog,
Watson
Studio
SPSS Modeler DataStage Watson Query
IBM Cloud® Data Engine 注を参照    
IBM Cloud Databases for MongoDB 注を参照
IBM Cloud Databases for MySQL 注を参照
IBM Cloud Databases for PostgreSQL 注を参照
IBM® Cloud Object Storage 注を参照
IBM Cloud Object Storage (インフラストラクチャー) 注を参照    
IBM Cloudant® 注を参照    
IBM Cognos® Analytics 注を参照  
IBM Data Virtualization Manager for z/OS® 注を参照
コネクター Watson Knowledge Catalog,
Watson
Studio
SPSS Modeler DataStage Watson Query
IBM Db2® 注を参照
IBM Db2 (最適化)      
IBM Db2 Big SQL 注を参照
IBM Db2 for i 注を参照
IBMDb2 for z/OS 注を参照
IBM Db2 on Cloud 注を参照
IBM Db2 Warehouse 注を参照
IBM Informix® 注を参照
IBM Match 360 注を参照    
コネクター Watson Knowledge Catalog,
Watson
Studio
SPSS Modeler DataStage Watson Query
IBM MQ      
IBM Netezza® Performance Server 注を参照
IBM Netezza Performance Server (最適化)      
IBM Planning Analytics 注を参照  
IBM Product Master 注を参照      
IBM SPSS Analytic Server 注を参照    
IBM Watson Query 注を参照  
Execution Engine for Hadoop経由の Impala 注を参照    
Looker 注を参照    
MariaDB 注を参照
Microsoft Azure Blob Storage 注を参照  
Microsoft Azure Cosmos DB 注を参照  
Microsoft Azure Data Lake Storage 注を参照  
コネクター Watson Knowledge Catalog,
Watson
Studio
SPSS Modeler DataStage Watson Query
Microsoft Azure File Storage 注を参照  
Microsoft Azure SQL Database 注を参照
Microsoft Power BI (Azure) Watson Knowledge Catalog      
Microsoft Power BI (Local) Watson Knowledge Catalog      
Microsoft SQL Server 注を参照
Microsoft SQL Server Integration Services Watson Knowledge Catalog      
Microsoft SQL Server Reporting Services Watson Knowledge Catalog      
MinIO 注を参照  
MongoDB 注を参照
MySQL
(My SQL Community Edition)
(My SQL Enterprise Edition)
注を参照
OData 注を参照      
ODBC    
Oracle 注を参照
Oracle (最適化)      
Oracle Business Intelligence Enterprise Edition Watson Knowledge Catalog      
Oracle Data Integrator Watson Knowledge Catalog      
PostgreSQL 注を参照
Presto 注を参照    
コネクター Watson Knowledge Catalog,
Watson
Studio
SPSS Modeler DataStage Watson Query
Qlik Sense Watson Knowledge Catalog      
Salesforce.com 注を参照
Salesforce.com (最適化)      
SAP ASE 注を参照
SAP Bulk Extract      
SAP Delta Extract      
SAP HANA 注を参照
SAP IDoc      
SAP IQ 注を参照  
SAP OData 注を参照
SingleStoreDB 注を参照    
Snowflake 注を参照
Storage volume 注を参照  
Tableau 注を参照  
Teradata 注を参照
Teradata (最適化)      
watsonx.data Watson Knowledge Catalog      
注: Watson Knowledge CatalogWatson Studio 列には、カタログおよびプロジェクトでサポートされるデータ・ソースがこの表に表示されます。 これらのサービスの一部のツールは、これらのデータ・ソースのサブセットのみをサポートします。 特定のデータ・ソースのリンクをたどると、そのデータ・ソースをサポートするツールのリストが表示されます。 ツールごとのサポートされるコネクターも参照してください。

その他のデータ・ ソース

管理者は、JDBC ドライバーをアップロードして、より多くのデータ・ソースへの接続を有効にすることができます。 データ・ソースの JBDC ドライバーのインポートを参照してください。

Watson Queryサービスは、サード・パーティーの JDBC ドライバーを使用して確立された接続をサポートします。

データ・ ファイル

リモート・データ・ソースまたは統合データベースからのデータの使用に加え、ファイルのデータを使用することもできます。 次のタイプのファイルのデータを処理できます。

データ・ファイルのタイプ サポート対象
Avro DataStage
SPSS
Modeler
Watson
Knowledge Catalog
Watson
Studio
CSV
DataStage
SPSS
Modeler
Watson
Knowledge Catalog
Watson Query
Watson
Studio
JSON
DataStage
Watson
Knowledge Catalog
Watson Query
Watson
Studio
Microsoft Excel スプレッドシート
DataStage
SPSS
Modeler
Watson
Knowledge Catalog
Watson Query
Watson
Studio
ORC Watson Query
Parquet
DataStage
Watson
Knowledge Catalog
Watson Query
Watson
Studio
SAS SPSS Modeler
Watson
Studio
(Data Refinery)
SAV SPSS Modeler
TSV
DataStage
Watson
Knowledge Catalog
Watson Query
Watson
Studio
(Data Refinery)
XML
DataStage
SPSS
Modeler

データ・ソースへの接続 (サービスを使用)

以下のリソースを使用して、アプリケーションで接続を作成します。

Cognos Dashboards
ダッシュボードのデータ・ソースとして、CSV ファイル、Microsoft Excel スプレッドシート、接続されたデータ資産、および Watson Query 資産を使用できます。 これらのデータ・ソースをデータ・ソースとして使用するには、すべてのデータ・ソースをプロジェクトに追加する必要があります。

ダッシュボードにデータ・ソースを追加するには、 「選択されたソース」 ペインの 「ソースの追加」 (+) ボタンをクリックします。

詳しくは、 Cognos Dashboardsを参照してください。

Data Refinery

Data Refineryというグラフィカル・フロー・エディター・ツールを使用して、表データのクレンジングと詳細化を行うことができます。 データを詳細化するには、データ・ソースへの接続を追加し、ソース・ファイルの制限を理解する必要があります。 詳しくは、データの精製 (Data Refinery) および Data Refinery でサポートされるデータ・ソースを参照してください。

DataStage
DataStage は、 DataStage キャンバス上の コネクター を使用して、リモート・データ・ソースを処理します。 データ・ソースに接続するには、 DataStageで使用する前に、関連付けられた DataStage コネクターの 接続資産 を作成する必要があります。
SPSS Modeler
SPSS Modelerサービスのデータ・ソースは、読み取り専用アクセス、読み取り/書き込みアクセス、および SQL プッシュバックをサポートします。

SPSS Modelerサービスは、その他のいくつかのファイル・タイプもサポートします。

詳しくは、SPSS Modelerでサポートされるデータ・ソースを参照してください。

Watson Knowledge Catalog
カタログ内またはプロジェクト内で使用できる接続、およびデータのキュレートに使用できる接続を作成できます。 通常、 「プラットフォーム接続」 ページから接続を作成できます。 さらに、以下のようにして接続を作成できます。
Watson Query
以下の場所から、データの仮想化に使用できる接続を作成できます。
  • 「プラットフォーム接続」ページ
  • Watson Queryサービスの「データ・ソース」ページ。

詳しくは、データ・ソースの追加 (Watson Query)を参照してください。

Watson Studio

理想的には、既にカタログ内にあるデータを使用します。 カタログ内で必要なデータを検索し、それをプロジェクトに追加します。

あるいは、以下の場所からプロジェクトで使用できる接続を作成することもできます。
  • 「接続」ページ
  • プロジェクトの 「資産」 ページ

また、ファイルのデータを追加することもできます。 ファイルからデータを追加するには、プロジェクトの 「資産」 ページに移動します。

詳しくは、 プロジェクトへのデータの追加を参照してください。

詳細