支持的数据源

连接到数据的方式

连接到数据的方式取决于多个因素，包括安装在 Cloud Pak for Data上的服务。某些服务可以使用在平台级别定义的连接，而其他服务使用特定于该服务的连接。

使用以下列表来确定适用于您的用例的方法。

在平台级别创建连接

通常，平台级别连接可简化创建和维护连接的过程。创建连接，然后多个服务可以引用该连接。如果更新连接，那么使用该连接的分析项目会自动选取更改。

您可以从平台连接页面创建平台级别连接。这些连接可由整个平台上的各种服务使用。但是，仅当安装了 Cloud Pak for Data common core services 时， " 平台连接 " 页面才可用。

有关更多信息，请参阅在平台级别连接到数据源。

如果以下语句成立，请考虑在平台级别创建连接:

服务支持平台级连接。
相同的连接需要由多个服务或实例使用或者在多个项目中使用。
您具有创建平台级别连接的相应许可权。
您必须在 " 平台连接 " 页面上具有编辑者或管理员角色。有关更多信息，请参阅管理平台连接上的合作者。

平台连接对所有平台用户可视。但是，只有具有数据源的凭证的用户才能使用连接。

如果您看不到要连接到的数据源类型，那么 Cloud Pak for Data 管理员可以上载 JDBC 驱动程序 JAR 文件，以便您可以创建与该数据源的通用 JDBC 连接。有关更多信息，请参阅导入数据源的 JDBC 驱动程序。

并非所有服务都支持相同类型的连接。如果要使用平台连接目录中的连接，那么将根据服务支持的连接类型对连接列表进行过滤。例如，如果您要使用某个连接向分析项目添加数据源，那么只会显示分析项目所支持的连接。

在服务级别创建连接

如果以下任何语句成立，请在服务级别创建连接:

您正在使用的服务不支持平台级连接。
您没有相应的许可权来创建平台级连接。
出于安全原因，您不希望该连接包含在 Connections 目录中。

有关更多信息，请参阅在服务级别连接到数据源。

连接类型

下表列出了可以从 Cloud Pak for Data连接到的数据源。

备注：在 Watson Knowledge Catalog ， Watson Studio 列中，本表显示了目录和分析项目中支持的数据源。这些服务的某些工具仅支持这些数据源的子集。遵循特定数据源的链接以查看支持该数据源的工具列表。另请参阅工具支持的连接类型。

连接类型	Watson Knowledge Catalog, Watson Studio	SPSS® Modeler	DataStage®	Data Virtualization
Amazon RDS for MySQL	✓	✓	✓	✓
Amazon RDS for Oracle	✓		✓	✓
Amazon RDS for PostgreSQL	✓	✓	✓	✓
Amazon Redshift	✓	✓	✓	✓
Amazon S3	✓	✓	✓	✓
Analytics Engine HDFS	✓	✓
Apache Cassandra	✓	✓	✓
Apache Derby	✓	✓		✓
Apache HDFS	✓	✓	✓
Apache Hive	✓	✓	✓	✓
连接类型	Watson Knowledge Catalog, Watson Studio	SPSS Modeler	DataStage	Data Virtualization
Apache Kafka			✓
Box	✓	✓	✓
Cloudant®	✓	✓
Cloudera Impala	✓	✓	✓	✓
Cloud Object Storage	✓	✓	✓	✓
Cloud Object Storage (基础架构)	✓	✓
Cognos® Analytics	✓	✓
Compose for MySQL	✓	✓	✓	✓
Databases for DataStax	✓	✓
Databases for MongoDB	✓	✓	✓	✓
连接类型	Watson Knowledge Catalog, Watson Studio	SPSS Modeler	DataStage	Data Virtualization
PostgreSQL 的数据库	✓	✓	✓	✓
Data Virtualization	✓	✓	✓
Data Virtualization Manager for z/OS®	✓	✓	✓	✓
Db2®	✓	✓	✓	✓
Db2 Big SQL	✓	✓	✓	✓
Db2 Event Store	✓		✓	✓
Db2 for i	✓	✓	✓	✓
Db2 for z/OS	✓	✓	✓	✓
Db2 Hosted	✓	✓	✓	✓
Db2 on Cloud	✓	✓	✓	✓
连接类型	Watson Knowledge Catalog, Watson Studio	SPSS Modeler	DataStage	Data Virtualization
Db2 Warehouse	✓	✓	✓	✓
Dropbox	✓	✓
Elasticsearch	✓
Exasol	✓	✓
文件系统			✓	✓
FTP（远程文件系统传输）	✓	✓	✓
通用 JDBC	✓		✓	✓
通用 S3	✓		✓
通用服务
Google BigQuery	✓	✓	✓	✓
连接类型	Watson Knowledge Catalog, Watson Studio	SPSS Modeler	DataStage	Data Virtualization
Google Cloud Pub/Sub			✓
Google Cloud Storage	✓	✓	✓
Greenplum	✓	✓	✓	✓
HDFS 通过 Execution Engine for Hadoop	✓	✓
Hive JDBC			✓	✓
Hive ，通过 Execution Engine for Hadoop	✓	✓
HTTP	✓	✓	✓
Impala 通过 Execution Engine for Hadoop	✓	✓
Informix®	✓	✓	✓	✓
Looker	✓	✓
连接类型	Watson Knowledge Catalog, Watson Studio	SPSS Modeler	DataStage	Data Virtualization
MariaDB	✓	✓	✓	✓
Microsoft Azure Blob Storage	✓	✓	✓
Microsoft Azure Cosmos DB	✓	✓	✓
Microsoft Azure Data Lake Store	✓	✓	✓
Microsoft Azure File Storage	✓	✓	✓
Microsoft Azure SQL Database	✓	✓	✓	✓
Microsoft SQL Server	✓	✓	✓	✓
MinIO	✓	✓
MongoDB	✓	✓	✓	✓
MQ			✓
连接类型	Watson Knowledge Catalog, Watson Studio	SPSS Modeler	DataStage	Data Virtualization
MySQL (我的 SQL Community Edition) (我的 SQL Enterprise Edition)	✓	✓	✓	✓
Netezza® Performance Server	✓	✓	✓	✓
OData	✓
ODBC		✓	✓
Oracle	✓	✓	✓	✓
Planning Analytics	✓	✓		✓
PostgreSQL	✓	✓	✓	✓
Salesforce.com	✓	✓	✓	✓
SAP ASE	✓	✓	✓	✓
SAP HANA	✓	✓	✓	✓
连接类型	Watson Knowledge Catalog, Watson Studio	SPSS Modeler	DataStage	Data Virtualization
SAP IQ	✓	✓
SAP OData	✓	✓	✓	✓
雪花	✓	✓	✓	✓
SPSS Analytic Server	✓	✓
SQL Query	✓	✓
存储卷	✓	✓
Tableau	✓	✓
Teradata	✓	✓	✓	✓

其他数据源

管理员可以上载 JDBC 驱动程序以启用与更多数据源的连接。请参阅导入数据源的 JBDC 驱动程序。

Data Virtualization 服务支持使用第三方 JDBC 驱动程序建立的连接。

请参阅产品路线图 ( http://ibm.biz/AnalyticsRoadmaps ) ，以获取有关支持更多数据源的信息。

数据文件

除了使用远程数据源或集成数据库中的数据之外，还可以使用文件中的数据。您可以处理以下类型的文件中的数据。

数据文件的类型	支持于
Avro	DataStage SPSS Modeler Watson Knowledge 目录 Watson Studio
CSV	Data Virtualization DataStage SPSS Modeler Watson Knowledge 目录 Watson Studio
JSON	Data Virtualization DataStage Watson Knowledge 目录 Watson Studio
Microsoft Excel 电子表格	Data Virtualization SPSS Modeler Watson Knowledge 目录 Watson Studio
ORC	Data Virtualization
Parquet	Data Virtualization DataStage Watson Knowledge 目录 Watson Studio
SAS	SPSS Modeler Watson Studio (Data Refinery)
SAV	SPSS Modeler
TSV	Data Virtualization DataStage Watson Knowledge 目录 Watson Studio (Data Refinery)
XML	SPSS Modeler

连接到数据源（按服务分类）

使用以下资源在应用程序中创建连接。

Cognos Dashboards

您可以使用分析项目中存在的本地和远程数据集。

或者，您可以通过选择分析仪表板菜单中的添加数据源来创建可在分析仪表板中使用的连接。

限制: 分析仪表板仅支持基于 JDBC的连接。

还可以通过在分析仪表板菜单中选择添加数据集来添加文件中的数据。

Data Refinery

您可以使用名为 Data Refinery的图形流编辑器工具来清理和优化表格数据。要优化数据，必须向数据源添加连接，并且必须了解源文件限制。有关更多信息，请参阅优化数据 (Data Refinery) 和 Data Refinery支持的数据源。

DataStage

DataStage 使用 DataStage 画布上的连接器与远程数据源进行交互。要连接到数据源，您需要先为关联的 DataStage 连接器创建项目连接资产，然后才能在 DataStage中使用该项目。

有关创建项目连接资产的指示信息，请参阅向分析项目添加连接。
有关可用 DataStage 连接器的列表，请参阅 DataStage 连接器。
要添加本地文件 (例如 CSV 文件) ，请参阅向分析项目添加数据。

Data Virtualization

您可以从以下位置创建可用于数据进行虚拟化的连接：

平台连接页面
Data Virtualization 服务中的数据源页面。

有关更多信息，请参阅添加数据源 (Data Virtualization)。

SPSS Modeler

SPSS Modeler 服务中的数据源支持只读访问，读/写访问和 SQL 回送。

SPSS Modeler 服务还支持其他几种文件类型。

有关更多信息，请参阅 SPSS Modeler 支持的数据源。

Watson Knowledge Catalog

您可以创建可在目录中使用的连接以及可用于整理数据的连接。

对于可在目录中使用的连接，可以从目录的 " 概述 " 页面创建连接。

有关更多信息，请参阅将连接资产添加到目录 (Watson Knowledge Catalog)。

对于可用于组织数据的连接，可以从以下位置创建连接:

平台连接页面
创建新发现作业时的监管 > 数据发现页面

有关更多信息，请参阅下列资源。

Watson Studio

理想情况下，使用已在目录中的数据。在目录中搜索所需的数据并将其添加到分析项目。

或者，您可以创建能够在以下位置的分析项目中使用的连接：

连接页面
分析项目的资产页面

还可以添加文件中的数据。要从文件添加数据，请转至分析项目的资产页面。

有关更多信息，请参阅向分析项目添加数据。