支持的数据源

重要信息: IBM Cloud Pak® for Data 4.7 版本将于 2025 年 7 月 31 日结束支持 (EOS)。 欲了解更多信息,请参阅 IBM Cloud Pak for Data 版本 4.X 的停止服务公告

IBM Cloud Pak for Data 4.7 版本支持结束之前,升级到 IBM Software Hub 5.1 版本。 更多信息,请参阅 IBM Software Hub 版本 5.1 文档中的升级 IBM Software Hub。

IBM Cloud Pak for Data中,无论数据位于何处,都可以连接到数据。

连接到数据的方式

连接到数据的方式取决于多个因素,包括安装在 Cloud Pak for Data上的服务。 某些服务可以使用在平台级别定义的连接,而其他服务使用特定于该服务的连接。

使用以下列表来确定适用于您的用例的方法。

在平台级别创建连接
通常,平台级别连接可简化创建和维护连接的过程。 创建连接,然后多个服务可以引用该连接。 如果更新连接,那么使用该连接的项目会自动选取这些更改。

您可以从 平台连接 页面创建平台级别连接。 这些连接可由整个平台上的各种服务使用。 但是,仅当安装了 Cloud Pak for Data common core services 时, 平台连接 页面才可用。

有关更多信息,请参阅 在平台级别连接到数据源

如果以下语句成立,请考虑在平台级别创建连接:

  • 服务支持平台级连接。
  • 相同的连接需要由多个服务或实例使用或者在多个项目中使用。
  • 您具有创建平台级别连接的相应许可权。

    您必须在 " 平台连接 " 页面上具有 编辑者管理员 角色。 更多信息,请参阅管理平台连接上的合作者

平台连接对所有平台用户可视。 但是,只有具有数据源的凭证的用户才能使用连接。

如果您未看到要连接到的数据源类型,那么 Cloud Pak for Data 管理员可以上载 JDBC 驱动程序 JAR 文件,以便您可以创建与该数据源的通用 JDBC 连接。 有关更多信息,请参阅 导入数据源的 JDBC 驱动程序

并非所有服务都支持相同类型的连接。 如果要使用 平台连接 目录中的连接,那么将根据服务支持的连接类型对连接列表进行过滤。 例如,如果使用连接将数据源添加到项目,那么仅显示项目支持的连接。

在服务级别创建连接
如果以下任何语句成立,请在服务级别创建连接:
  • 您正在使用的服务不支持平台级连接。
  • 您没有相应的许可权来创建平台级连接。
  • 出于安全原因,您不希望将连接包含在 Connections 目录中。

有关更多信息,请参阅 在服务级别连接到数据源

连接器

下表列出了可以从 Cloud Pak for Data连接到的数据源。

连接器 Watson Knowledge Catalog,
Watson
Studio
SPSS® Modeler DataStage® Watson Query
Amazon RDS for MySQL 请参阅注释
Amazon RDS for Oracle 请参阅注释
Amazon RDS for PostgreSQL 请参阅注释
Amazon Redshift 请参阅注释
Amazon S3 请参阅注释
Apache Cassandra 请参阅注释  
Apache Cassandra (已优化)      
Apache Derby 请参阅注释  
Apache HBase      
Apache HDFS 请参阅注释  
连接器 Watson Knowledge Catalog,
Watson
Studio
SPSS Modeler DataStage Watson Query
Apache Hive 请参阅注释
Apache Kafka 请参阅注释    
Box 请参阅注释  
Cloudera Impala 请参阅注释
Dremio 请参阅注释    
Dropbox 请参阅注释  
Elasticsearch 请参阅注释  
Exasol 请参阅注释  
文件系统    
FTP(远程文件系统传输) 请参阅注释  
通用 JDBC 请参阅注释
连接器 Watson Knowledge Catalog,
Watson
Studio
SPSS Modeler DataStage Watson Query
通用 S3 请参阅注释  
Google BigQuery 请参阅注释
Google Cloud Pub/Sub      
Google Cloud Storage 请参阅注释  
Greenplum 请参阅注释
HDFS 通过 Execution Engine for Hadoop 请参阅注释    
Hive JDBC    
Hive 通过 Execution Engine for Hadoop 请参阅注释    
HTTP 请参阅注释  
连接器 Watson Knowledge Catalog,
Watson
Studio
SPSS Modeler DataStage Watson Query
IBM Cloud® Data Engine 请参阅注释    
IBM Cloud Databases for MongoDB 请参阅注释
IBM Cloud Databases for MySQL 请参阅注释
IBM Cloud Databases for PostgreSQL 请参阅注释
IBM® Cloud Object Storage 请参阅注释
IBM Cloud Object Storage (基础架构) 请参阅注释    
IBM Cloudant® 请参阅注释    
IBM Cognos® Analytics 请参阅注释  
IBM Data Virtualization Manager for z/OS® 请参阅注释
连接器 Watson Knowledge Catalog,
Watson
Studio
SPSS Modeler DataStage Watson Query
IBM Db2® 请参阅注释
IBM Db2 (已优化)      
IBM Db2 Big SQL 请参阅注释
IBM Db2 for i 请参阅注释
IBMDb2 for z/OS 请参阅注释
IBM Db2 on Cloud 请参阅注释
IBM Db2 Warehouse 请参阅注释
IBM Informix® 请参阅注释
IBM Match 360 请参阅注释    
连接器 Watson Knowledge Catalog,
Watson
Studio
SPSS Modeler DataStage Watson Query
IBM MQ      
IBM Netezza® Performance Server 请参阅注释
IBM Netezza Performance Server (已优化)      
IBM Planning Analytics 请参阅注释  
IBM Product Master 请参阅注释      
IBM SPSS Analytic Server 请参阅注释    
IBM Watson Query 请参阅注释  
Impala ,通过 Execution Engine for Hadoop 请参阅注释    
Looker 请参阅注释    
MariaDB 请参阅注释
Microsoft Azure Blob Storage 请参阅注释  
Microsoft Azure Cosmos DB 请参阅注释  
Microsoft Azure Data Lake Storage 请参阅注释  
连接器 Watson Knowledge Catalog,
Watson
Studio
SPSS Modeler DataStage Watson Query
Microsoft Azure File Storage 请参阅注释  
Microsoft Azure SQL Database 请参阅注释
Microsoft Power BI (Azure) Watson Knowledge Catalog      
Microsoft Power BI (Local) Watson Knowledge Catalog      
Microsoft SQL Server 请参阅注释
Microsoft SQL Server Integration Services Watson Knowledge Catalog      
Microsoft SQL Server Reporting Services Watson Knowledge Catalog      
MinIO 请参阅注释  
MongoDB 请参阅注释
MySQL
(My SQL Community Edition)
(My SQL Enterprise Edition)
请参阅注释
OData 请参阅注释      
ODBC    
Oracle 请参阅注释
Oracle (已优化)      
Oracle Business Intelligence Enterprise Edition Watson Knowledge Catalog      
Oracle Data Integrator Watson Knowledge Catalog      
PostgreSQL 请参阅注释
Presto 请参阅注释    
连接器 Watson Knowledge Catalog,
Watson
Studio
SPSS Modeler DataStage Watson Query
Qlik Sense Watson Knowledge Catalog      
Salesforce.com 请参阅注释
Salesforce.com (已优化)      
SAP ASE 请参阅注释
SAP Bulk Extract      
SAP Delta Extract      
SAP HANA 请参阅注释
SAP IDoc      
SAP IQ 请参阅注释  
SAP OData 请参阅注释
SingleStoreDB 请参阅注释    
Snowflake 请参阅注释
Storage volume 请参阅注释  
Tableau 请参阅注释  
Teradata 请参阅注释
Teradata (已优化)      
watsonx.data Watson Knowledge Catalog      
注:Watson Knowledge Catalog Watson Studio 列中,此表显示目录和项目中支持的数据源。 这些服务的某些工具仅支持这些数据源的子集。 遵循特定数据源的链接以查看支持该数据源的工具列表。 另请参阅 支持的连接器 (按工具)

其他数据源

管理员可以上载 JDBC 驱动程序以启用与更多数据源的连接。 请参阅 导入数据源的 JBDC 驱动程序

Watson Query 服务支持使用第三方 JDBC 驱动程序建立的连接。

数据文件

除了使用远程数据源或集成数据库中的数据之外,还可以使用文件中的数据。 您可以处理以下类型的文件中的数据。

数据文件的类型 支持于
Avro DataStage
SPSS
Modeler
Watson
Knowledge Catalog
Watson
Studio
CSV
DataStage
SPSS
Modeler
Watson
Knowledge Catalog
Watson Query
Watson
Studio
JSON
DataStage
Watson
Knowledge Catalog
Watson Query
Watson
Studio
Microsoft Excel 电子表格
DataStage
SPSS
Modeler
Watson
Knowledge Catalog
Watson Query
Watson
Studio
ORC Watson Query
Parquet
DataStage
Watson
Knowledge Catalog
Watson Query
Watson
Studio
SAS SPSS Modeler
Watson
Studio
(Data Refinery)
SAV SPSS Modeler
TSV
DataStage
Watson
Knowledge Catalog
Watson Query
Watson
Studio
(Data Refinery)
XML
DataStage
SPSS
Modeler

连接到数据源(按服务分类)

使用以下资源在应用程序中创建连接。

Cognos Dashboards
您可以使用 CSV 文件, Microsoft Excel 电子表格,已连接的数据资产和 Watson Query 资产作为仪表板的数据源。 必须先将所有这些数据源添加到项目中,然后才能将其用作数据源。

通过单击 " 所选源 " 窗格中的 添加源 (+) 按钮,将数据源添加到仪表板。

有关更多信息,请参阅 Cognos Dashboards

Data Refinery

您可以使用名为 Data Refinery的图形流编辑器工具来清理和优化表格数据。 要优化数据,必须向数据源添加连接,并且必须了解源文件限制。 有关更多信息,请参阅 优化数据 (Data Refinery) Data Refinery支持的数据源

DataStage
DataStage 使用 DataStage 画布上的 连接器 来处理远程数据源。 要连接到数据源,需要先为关联的 DataStage 连接器创建 连接资产 ,然后才能在 DataStage中使用该资产。
SPSS Modeler
SPSS Modeler 服务中的数据源支持只读访问,读/写访问和 SQL 回送。

SPSS Modeler 服务还支持其他几种文件类型。

有关更多信息,请参阅 SPSS Modeler支持的数据源

Watson Knowledge Catalog
您可以创建可在目录中使用的连接,也可以创建可用于组织数据的项目和连接。 通常,您可以从 平台连接 页面创建连接。 此外,您可以创建如下所示的连接:
Watson Query
您可以从以下位置创建可用于数据进行虚拟化的连接:
  • 平台连接 页面
  • Watson Query 服务中的 数据源 页面。

有关更多信息,请参阅 添加数据源 (Watson Query)

Watson Studio

理想情况下,请使用目录中已存在的数据。 在目录中搜索所需的数据,并将其添加到项目中。

或者,您可以从以下位置创建可在项目中使用的连接:
  • " 连接 " 页面
  • 项目的 资产 页面

还可以添加文件中的数据。 要从文件添加数据,请转至项目的 资产 页面。

有关更多信息,请参阅 向项目添加数据

了解更多