支持的数据源

您可以连接到 Cloud Pak for Data中的许多数据源。某些服务支持与在平台级别定义的数据源的连接，而其他服务使用特定于服务的连接。

连接到数据的方式
连接器
其他数据源
数据文件
连接到数据源（按服务分类）

连接到数据的方式

使用以下列表来选择用于连接到用例的数据的方法。

在平台级别创建连接

通常，平台级别连接可简化创建和维护连接的过程。创建连接，然后多个服务可以引用该连接。如果更新连接，那么使用该连接的项目会自动选取这些更改。

您可以从平台连接页面创建平台级别连接。这些连接可由整个平台上的各种服务使用。但是，仅当安装了 Cloud Pak for Data common core services 时，平台连接页面才可用。

有关更多信息，请参阅在平台级别连接到数据源。

如果以下语句成立，请考虑在平台级别创建连接:

服务支持平台级连接。
相同的连接需要由多个服务或实例使用或者在多个项目中使用。
您具有创建平台级别连接的相应许可权。
您必须在 " 平台连接 " 页面上具有编辑者或管理员角色。有关更多信息，请参阅管理平台连接上的合作者。

平台连接对所有平台用户可视。但是，只有具有数据源的凭证的用户才能使用连接。

如果您未看到要连接到的数据源类型，那么 Cloud Pak for Data 管理员可以为该数据源创建定制 JDBC 连接器。如果仅连接到一个数据源，并且用户不需要可重复的方法来连接到该数据源，那么可以创建通用 JDBC 连接。

并非所有服务都支持相同类型的连接。如果要使用平台连接目录中的连接，那么将根据服务支持的连接类型对连接列表进行过滤。例如，如果使用连接将数据源添加到项目，那么仅显示项目支持的连接。

在服务级别创建连接

如果以下任何语句成立，请在服务级别创建连接:

您正在使用的服务不支持平台级连接。
您没有相应的许可权来创建平台级连接。
出于安全原因，您不希望将连接包含在 Connections 目录中。

有关更多信息，请参阅在服务级别连接到数据源。

连接器

下表列出了可以从 Cloud Pak for Data连接到的数据源。

连接器	IBM Knowledge Catalog, Watson Studio	SPSS Modeler	DataStage	Data Virtualization
Amazon RDS for MySQL	✓ 请参阅注释	✓	✓	✓
Amazon RDS for Oracle	✓ 请参阅注释		✓	✓
Amazon RDS for PostgreSQL	✓ 请参阅注释	✓	✓	✓
Amazon Redshift	✓ 请参阅注释	✓	✓	✓
Amazon S3	✓ 请参阅注释	✓	✓	✓
Apache Cassandra	✓ 请参阅注释	✓	✓
Apache Cassandra for DataStage			✓
Apache Derby	✓ 请参阅注释	✓	✓	✓
Apache HBase			✓
Apache HDFS	✓ 请参阅注释	✓	✓
连接器	IBM Knowledge Catalog, Watson Studio	SPSS Modeler	DataStage	Data Virtualization
Apache Hive	✓ 请参阅注释	✓	✓	✓
Apache Impala	✓ 请参阅注释	✓	✓	✓
Apache Kafka	✓ 请参阅注释		✓
Box	✓ 请参阅注释	✓	✓
DataStax Enterprise			✓
Dremio	✓ 请参阅注释		✓
Dropbox	✓ 请参阅注释	✓	✓
Elasticsearch	✓ 请参阅注释		✓
Exasol	✓ 请参阅注释	✓	✓
文件系统			✓	✓
FTP（远程文件系统传输）	✓ 请参阅注释	✓	✓
通用 JDBC	✓ 请参阅注释		✓	✓
连接器	IBM Knowledge Catalog, Watson Studio	SPSS Modeler	DataStage	Data Virtualization
通用 S3	✓ 请参阅注释		✓
Google BigQuery	✓ 请参阅注释	✓	✓	✓
Google Cloud Pub/Sub			✓
Google Cloud Storage	✓ 请参阅注释	✓	✓
Google Looker	✓ 请参阅注释	✓	✓
Greenplum	✓ 请参阅注释	✓	✓	✓
HDFS 通过 Execution Engine for Hadoop	✓ 请参阅注释	✓
Hive JDBC			✓	✓
Hive 通过 Execution Engine for Hadoop	✓ 请参阅注释	✓
HTTP	✓ 请参阅注释	✓	✓
连接器	IBM Knowledge Catalog, Watson Studio	SPSS Modeler	DataStage	Data Virtualization
IBM Cloud Data Engine	✓ 请参阅注释	✓	✓
IBM Cloud Databases for MongoDB	✓ 请参阅注释	✓	✓	✓
IBM Cloud Databases for MySQL	✓ 请参阅注释	✓	✓	✓
IBM Cloud Databases for PostgreSQL	✓ 请参阅注释	✓	✓	✓
IBM Cloud Object Storage	✓ 请参阅注释	✓	✓	✓
IBM Cloud Object Storage (基础架构)	✓ 请参阅注释	✓
IBM Cloudant	✓ 请参阅注释	✓
IBM Cognos Analytics	✓ 请参阅注释	✓	✓
IBM Data Virtualization	✓ 请参阅注释	✓	✓
IBM Data Virtualization Manager for z/OS	✓ 请参阅注释	✓	✓	✓
连接器	IBM Knowledge Catalog, Watson Studio	SPSS Modeler	DataStage	Data Virtualization
IBM Db2	✓ 请参阅注释	✓	✓	✓
IBM Db2 for DataStage			✓
IBM Db2 Big SQL	✓ 请参阅注释	✓	✓	✓
IBM Db2 for i	✓ 请参阅注释	✓	✓	✓
IBMDb2 for z/OS	✓ 请参阅注释	✓	✓	✓
IBM Db2 on Cloud	✓ 请参阅注释	✓	✓	✓
IBM Db2 Warehouse	✓ 请参阅注释	✓	✓	✓
IBM Informix	✓ 请参阅注释	✓	✓	✓
IBM Match 360	✓ 请参阅注释		✓
连接器	IBM Knowledge Catalog, Watson Studio	SPSS Modeler	DataStage	Data Virtualization
IBM MQ			✓
IBM Netezza Performance Server	✓ 请参阅注释	✓	✓	✓
IBM Netezza Performance Server for DataStage			✓
IBM Planning Analytics	✓ 请参阅注释	✓	✓	✓
IBM Product Master	✓ 请参阅注释
IBM SPSS Analytic Server	✓ 请参阅注释	✓
IBM watsonx.data Presto	✓ 请参阅注释		✓
Impala ，通过 Execution Engine for Hadoop	✓ 请参阅注释	✓
MariaDB	✓ 请参阅注释	✓	✓	✓
Microsoft Azure Blob Storage	✓ 请参阅注释	✓	✓
Microsoft Azure Cosmos DB	✓ 请参阅注释	✓	✓
Microsoft Azure Data Lake Storage	✓ 请参阅注释	✓	✓
Microsoft Azure Databricks	✓看注释		✓
连接器	IBM Knowledge Catalog, Watson Studio	SPSS Modeler	DataStage	Data Virtualization
Microsoft Azure File Storage	✓ 请参阅注释	✓	✓
Microsoft Azure SQL Database	✓ 请参阅注释	✓	✓	✓
Microsoft Azure Synapse Analytics	✓ 请参阅注释		✓
Microsoft Power BI (Azure)	IBM Knowledge Catalog
Microsoft Power BI Desktop	IBM Knowledge Catalog
Microsoft SQL Server	✓ 请参阅注释	✓	✓	✓
Microsoft SQL Server Integration Services	IBM Knowledge Catalog
Microsoft SQL Server Reporting Services	IBM Knowledge Catalog
MicroStrategy	IBM Knowledge Catalog
Milvus	✓ 请参阅注释
MinIO	✓ 请参阅注释	✓	✓	✓
MongoDB	✓ 请参阅注释	✓	✓	✓
MySQL (My SQL Community Edition) (My SQL Enterprise Edition)	✓ 请参阅注释	✓	✓	✓
OData	✓ 请参阅注释
ODBC		✓	✓
Oracle	✓ 请参阅注释	✓	✓	✓
Oracle Database for DataStage			✓
Oracle Business Intelligence Enterprise Edition	IBM Knowledge Catalog
Oracle Data Integrator	IBM Knowledge Catalog
PostgreSQL	✓ 请参阅注释	✓	✓	✓
Presto	✓ 请参阅注释	✓	✓	✓
连接器	IBM Knowledge Catalog, Watson Studio	SPSS Modeler	DataStage	Data Virtualization
Qlik Sense	IBM Knowledge Catalog
Salesforce.com	✓ 请参阅注释	✓	✓	✓
Salesforce API for DataStage			✓
SAP ASE	✓ 请参阅注释	✓	✓	✓
SAP BAPI			✓
SAP BusinessObjects	✓ 请参阅注释		✓
SAP Bulk Extract			✓
SAP Delta Extract			✓
SAP HANA	✓ 请参阅注释	✓	✓	✓
SAP IDoc			✓
SAP IQ	✓ 请参阅注释	✓	✓
SAP OData	✓ 请参阅注释	✓	✓	✓
SingleStoreDB	✓ 请参阅注释	✓	✓
Snowflake	✓ 请参阅注释	✓	✓	✓
Storage volume	✓ 请参阅注释	✓	✓
Tableau	✓ 请参阅注释	✓	✓
Teradata	✓ 请参阅注释	✓	✓	✓
Teradata database for DataStage			✓
Vertica	✓ 请参阅注释		✓

注: 在 IBM Knowledge Catalog, Watson Studio 列中，此表显示目录和项目中支持的数据源。这些服务的某些工具仅支持这些数据源的子集。遵循特定数据源的链接以查看支持该数据源的工具列表。另请参阅支持的连接器 (按工具)。

其他数据源

管理员可以上载 JDBC 驱动程序以启用与更多数据源的连接。请参阅导入数据源的 JBDC 驱动程序。

Data Virtualization 服务支持使用第三方 JDBC 驱动程序建立的连接。

数据文件

除了使用远程数据源或集成数据库中的数据之外，还可以使用文件中的数据。您可以处理以下类型的文件中的数据。

数据文件的类型	支持于
Avro	DataStage IBM Knowledge Catalog SPSS Modeler Watson Studio
CSV	DataStage Decision Optimization IBM Knowledge Catalog SPSS Modeler Data Virtualization Watson Studio
JSON	DataStage Decision Optimization (JSON 表格形式) IBM Knowledge Catalog Data Virtualization Watson Studio
Microsoft Excel 电子表格	DataStage IBM Knowledge Catalog SPSS Modeler Data Virtualization Watson Studio
ORC	DataStage Data Virtualization
Parquet	DataStage IBM Knowledge Catalog Data Virtualization Watson Studio
SAS	SPSS Modeler Watson Studio (Data Refinery)
SAV	DataStage SPSS Modeler
TSV	DataStage IBM Knowledge Catalog Data Virtualization Watson Studio (Data Refinery)
XML	DataStage Decision Optimization (XML 表格形式) SPSS Modeler

连接到数据源（按服务分类）

使用以下资源在应用程序中创建连接。

Cognos Dashboards

您可以使用 CSV 文件， Microsoft Excel 电子表格，已连接的数据资产和 Data Virtualization 资产作为仪表板的数据源。必须先将所有这些数据源添加到项目中，然后才能将其用作数据源。

通过单击 " 所选源 " 窗格中的添加源 (+) 按钮，将数据源添加到仪表板。

有关更多信息，请参阅 Cognos Dashboards。

Data Refinery

您可以使用名为 Data Refinery的图形流编辑器工具来清理和优化表格数据。要优化数据，必须向数据源添加连接，并且必须了解源文件限制。有关更多信息，请参阅优化数据 (Data Refinery) 和 Data Refinery支持的数据源。

Data Virtualization

您可以从以下位置创建可用于数据进行虚拟化的连接：

平台连接页面
Data Virtualization 服务中的数据源页面。

有关更多信息，请参阅连接到 Data Virtualization中的数据源。

另请参阅 Data Virtualization中支持的数据源。

DataStage

DataStage 使用 DataStage 画布上的连接器来处理远程数据源。要连接到数据源，需要先为关联的 DataStage 连接器创建连接资产，然后才能在 DataStage中使用该资产。

有关在 DataStage中连接到远程数据源的指示信息，请参阅在 DataStage中连接到数据源。
有关可用 DataStage 连接器的列表，请参阅 DataStage中支持的数据源。
要添加本地文件 (例如 CSV 文件) ，请参阅向项目添加数据。

Db2 Big SQL

您可以创建连接以从对象存储库或远程 Hadoop 集群查询数据。在供应 Db2 Big SQL 实例时连接到数据源。

有关更多信息，请参阅为 Db2 Big SQL创建服务实例。

Decision Optimization

您可以使用 CSV ， JSON (表格形式) ， XML (表格形式) 或已连接的资产来构建和部署 Decision Optimization 模型。

有关更多信息，请参阅 Decision Optimization支持的数据源。

IBM Knowledge Catalog

您可以创建可在目录中使用的连接，也可以创建可用于组织数据的项目和连接。通常，您可以从平台连接页面创建连接。此外，您可以创建如下所示的连接:

可在目录 " 资产 " 页面的目录中使用的连接。有关更多信息，请参阅将连接资产添加到目录。
可在项目的资产页面中的项目中使用的连接。有关更多信息，请参阅向项目添加数据。
创建元数据导入资产时可用于项目中元数据导入的连接。有关更多信息，请参阅管理元数据导入。

IBM watsonx.ai

从 Tuning Studio中调整基础模型时，将基础模型输入/输出对的样本添加为训练数据。您可以从存储在已连接数据存储器中的 JSON 或 JSONL 文件中获取这些样本，也可以从存储在已连接数据库中的表格数据中获取这些样本。

必须先创建与要使用的数据源的连接，然后才能从 Tuning Studio对其进行访问。然后，可以直接从已连接的数据源添加数据，也可以从使用已连接的数据源中的数据创建的数据资产添加数据。

有关受支持的数据源的更多信息，请参阅用于调整基础模型的数据格式。

您可以从以下位置创建可在项目中使用的连接:

平台连接页面
项目的资产页面

有关更多信息，请参阅向项目添加数据。

SPSS Modeler

SPSS Modeler 服务中的数据源支持只读访问，读/写访问和 SQL 回送。

SPSS Modeler 服务还支持其他几种文件类型。

有关更多信息，请参阅 SPSS Modeler支持的数据源。

Synthetic Data Generator

Synthetic Data Generator 服务中的数据源支持只读访问和读/写访问。

Synthetic Data Generator 服务还支持其他几种文件类型。

有关更多信息，请参阅 Synthetic Data Generator支持的数据源。

Watson Machine Learning Accelerator

您可以从以下位置创建可在项目中使用的连接:

" 连接 " 页面
项目的资产页面

还可以添加文件中的数据。要从文件添加数据，请转至项目的资产页面。

有关更多信息，请参阅向项目添加数据。

另请参阅 Watson Machine Learning Accelerator支持的数据源。

Watson Studio

理想情况下，请使用目录中已存在的数据。在目录中搜索所需的数据，并将其添加到项目中。

或者，您可以从以下位置创建可在项目中使用的连接:

" 连接 " 页面
项目的资产页面

还可以添加文件中的数据。要从文件添加数据，请转至项目的资产页面。

有关更多信息，请参阅向项目添加数据。

Data Product Hub

您可以添加连接以访问广泛的数据源，从而创建和交付数据产品。

有关更多信息，请参阅 Data Product Hub的连接器。

支持的数据源

连接到数据的方式

连接器

其他数据源

数据文件

连接到数据源（按服务分类）

了解更多