支持的数据源
在 IBM® Cloud Pak for Data ,无论数据位于何处,您都可以连接到它们。
连接到数据的方式
连接到数据的方式取决于多个因素,包括安装在 Cloud Pak for Data上的服务。 某些服务可以使用在平台级别定义的连接,而其他服务使用特定于该服务的连接。
使用以下列表来确定适用于您的用例的方法。
- 在平台级别创建连接
- 通常,平台级别连接可简化创建和维护连接的过程。 创建连接,然后多个服务可以引用该连接。 如果更新连接,那么使用该连接的分析项目会自动选取更改。
您可以从 平台连接 页面创建平台级别连接。 这些连接可由整个平台上的各种服务使用。 但是,仅当安装了 Cloud Pak for Data common core services 时, " 平台连接 " 页面才可用。
有关更多信息,请参阅 在平台级别连接到数据源。
如果以下语句成立,请考虑在平台级别创建连接:
- 服务支持平台级连接。
- 相同的连接需要由多个服务或实例使用或者在多个项目中使用。
- 您具有创建平台级别连接的相应许可权。
您必须在 " 平台连接 " 页面上具有 编辑者 或 管理员 角色。 有关更多信息,请参阅 管理平台连接上的合作者。
平台连接对所有平台用户可视。 但是,只有具有数据源的凭证的用户才能使用连接。
如果您看不到要连接到的数据源类型,那么 Cloud Pak for Data 管理员可以上载 JDBC 驱动程序 JAR 文件,以便您可以创建与该数据源的通用 JDBC 连接。 有关更多信息,请参阅 导入数据源的 JDBC 驱动程序。
并非所有服务都支持相同类型的连接。 如果要使用 平台连接 目录中的连接,那么将根据服务支持的连接类型对连接列表进行过滤。 例如,如果您要使用某个连接向分析项目添加数据源,那么只会显示分析项目所支持的连接。
- 在服务级别创建连接
- 如果以下任何语句成立,请在服务级别创建连接:
- 您正在使用的服务不支持平台级连接。
- 您没有相应的许可权来创建平台级连接。
- 出于安全原因,您不希望该连接包含在 Connections 目录中。
有关更多信息,请参阅 在服务级别连接到数据源。
连接类型
下表列出了可以从 Cloud Pak for Data连接到的数据源。
| 连接类型 | Watson Knowledge Catalog, Watson Studio
|
SPSS® Modeler | DataStage® | Data Virtualization |
|---|---|---|---|---|
| Amazon RDS for MySQL | ✓ | ✓ | ✓ | ✓ |
| Amazon RDS for Oracle | ✓ | ✓ | ✓ | |
| Amazon RDS for PostgreSQL | ✓ | ✓ | ✓ | ✓ |
| Amazon Redshift | ✓ | ✓ | ✓ | ✓ |
| Amazon S3 | ✓ | ✓ | ✓ | ✓ |
| Analytics Engine HDFS | ✓ | ✓ | ||
| Apache Cassandra | ✓ | ✓ | ✓ | |
| Apache Derby | ✓ | ✓ | ✓ | |
| Apache HDFS | ✓ | ✓ | ✓ | |
| Apache Hive | ✓ | ✓ | ✓ | ✓ |
| 连接类型 | Watson Knowledge Catalog, Watson Studio
|
SPSS Modeler | DataStage | Data Virtualization |
| Apache Kafka | ✓ | |||
| Box | ✓ | ✓ | ✓ | |
| Cloudant® | ✓ | ✓ | ||
| Cloudera Impala | ✓ | ✓ | ✓ | ✓ |
| Cloud Object Storage | ✓ | ✓ | ✓ | ✓ |
| Cloud Object Storage (基础架构) | ✓ | ✓ | ||
| Cognos® Analytics | ✓ | ✓ | ||
| Compose for MySQL | ✓ | ✓ | ✓ | ✓ |
| Databases for DataStax | ✓ | ✓ | ||
| Databases for MongoDB | ✓ | ✓ | ✓ | ✓ |
| 连接类型 | Watson Knowledge Catalog, Watson Studio
|
SPSS Modeler | DataStage | Data Virtualization |
| PostgreSQL 的数据库 | ✓ | ✓ | ✓ | ✓ |
| Data Virtualization | ✓ | ✓ | ✓ | |
| Data Virtualization Manager for z/OS® | ✓ | ✓ | ✓ | ✓ |
| Db2® | ✓ | ✓ | ✓ | ✓ |
| Db2 Big SQL | ✓ | ✓ | ✓ | ✓ |
| Db2 Event Store | ✓ | ✓ | ✓ | |
| Db2 for i | ✓ | ✓ | ✓ | ✓ |
| Db2 for z/OS | ✓ | ✓ | ✓ | ✓ |
| Db2 Hosted | ✓ | ✓ | ✓ | ✓ |
| Db2 on Cloud | ✓ | ✓ | ✓ | ✓ |
| 连接类型 | Watson Knowledge Catalog, Watson Studio
|
SPSS Modeler | DataStage | Data Virtualization |
| Db2 Warehouse | ✓ | ✓ | ✓ | ✓ |
| Dropbox | ✓ | ✓ | ||
| Elasticsearch | ✓ | |||
| Exasol | ✓ | ✓ | ||
| 文件系统 | ✓ | ✓ | ||
| FTP(远程文件系统传输) | ✓ | ✓ | ✓ | |
| 通用 JDBC | ✓ | ✓ | ✓ | |
| 通用 S3 | ✓ | ✓ | ||
| 通用服务 | ||||
| Google BigQuery | ✓ | ✓ | ✓ | ✓ |
| 连接类型 | Watson Knowledge Catalog, Watson Studio
|
SPSS Modeler | DataStage | Data Virtualization |
| Google Cloud Pub/Sub | ✓ | |||
| Google Cloud Storage | ✓ | ✓ | ✓ | |
| Greenplum | ✓ | ✓ | ✓ | ✓ |
| HDFS 通过 Execution Engine for Hadoop | ✓ | ✓ | ||
| Hive JDBC | ✓ | ✓ | ||
| Hive ,通过 Execution Engine for Hadoop | ✓ | ✓ | ||
| HTTP | ✓ | ✓ | ✓ | |
| Impala 通过 Execution Engine for Hadoop | ✓ | ✓ | ||
| Informix® | ✓ | ✓ | ✓ | ✓ |
| Looker | ✓ | ✓ | ||
| 连接类型 | Watson Knowledge Catalog, Watson Studio
|
SPSS Modeler | DataStage | Data Virtualization |
| MariaDB | ✓ | ✓ | ✓ | ✓ |
| Microsoft Azure Blob Storage | ✓ | ✓ | ✓ | |
| Microsoft Azure Cosmos DB | ✓ | ✓ | ✓ | |
| Microsoft Azure Data Lake Store | ✓ | ✓ | ✓ | |
| Microsoft Azure File Storage | ✓ | ✓ | ✓ | |
| Microsoft Azure SQL Database | ✓ | ✓ | ✓ | ✓ |
| Microsoft SQL Server | ✓ | ✓ | ✓ | ✓ |
| MinIO | ✓ | ✓ | ||
| MongoDB | ✓ | ✓ | ✓ | ✓ |
| MQ | ✓ | |||
| 连接类型 | Watson Knowledge Catalog, Watson Studio
|
SPSS Modeler | DataStage | Data Virtualization |
| MySQL (我的 SQL Community Edition)
(我的 SQL Enterprise Edition) |
✓ | ✓ | ✓ | ✓ |
| Netezza® Performance Server | ✓ | ✓ | ✓ | ✓ |
| OData | ✓ | |||
| ODBC | ✓ | ✓ | ||
| Oracle | ✓ | ✓ | ✓ | ✓ |
| Planning Analytics | ✓ | ✓ | ✓ | |
| PostgreSQL | ✓ | ✓ | ✓ | ✓ |
| Salesforce.com | ✓ | ✓ | ✓ | ✓ |
| SAP ASE | ✓ | ✓ | ✓ | ✓ |
| SAP HANA | ✓ | ✓ | ✓ | ✓ |
| 连接类型 | Watson Knowledge Catalog, Watson Studio
|
SPSS Modeler | DataStage | Data Virtualization |
| SAP IQ | ✓ | ✓ | ||
| SAP OData | ✓ | ✓ | ✓ | ✓ |
| 雪花 | ✓ | ✓ | ✓ | ✓ |
| SPSS Analytic Server | ✓ | ✓ | ||
| SQL Query | ✓ | ✓ | ||
| 存储卷 | ✓ | ✓ | ||
| Tableau | ✓ | ✓ | ||
| Teradata | ✓ | ✓ | ✓ | ✓ |
其他数据源
管理员可以上载 JDBC 驱动程序以启用与更多数据源的连接。 请参阅 导入数据源的 JBDC 驱动程序。
Data Virtualization 服务支持使用第三方 JDBC 驱动程序建立的连接。
请参阅产品路线图 ( http://ibm.biz/AnalyticsRoadmaps ) ,以获取有关支持更多数据源的信息。
数据文件
除了使用远程数据源或集成数据库中的数据之外,还可以使用文件中的数据。 您可以处理以下类型的文件中的数据。
| 数据文件的类型 | 支持于 |
|---|---|
| Avro | DataStage SPSS Modeler
Watson Knowledge
目录 Watson Studio
|
| CSV | Data Virtualization DataStage
SPSS Modeler
Watson Knowledge
目录 Watson Studio
|
| JSON | Data Virtualization DataStage
Watson Knowledge
目录 Watson Studio
|
| Microsoft Excel 电子表格 | Data Virtualization SPSS Modeler
Watson Knowledge
目录 Watson Studio
|
| ORC | Data Virtualization |
| Parquet | Data Virtualization DataStage
Watson Knowledge
目录 Watson Studio
|
| SAS | SPSS Modeler Watson Studio (Data Refinery)
|
| SAV | SPSS Modeler |
| TSV | Data Virtualization DataStage
Watson Knowledge
目录 Watson Studio (Data Refinery)
|
| XML | SPSS Modeler |
连接到数据源(按服务分类)
使用以下资源在应用程序中创建连接。
- Cognos Dashboards
- 您可以使用分析项目中存在的本地和远程数据集。
或者,您可以通过选择分析仪表板菜单中的添加数据源来创建可在分析仪表板中使用的连接。
限制: 分析仪表板仅支持基于 JDBC的连接。还可以通过在分析仪表板菜单中选择添加数据集来添加文件中的数据。
- Data Refinery
您可以使用名为 Data Refinery的图形流编辑器工具来清理和优化表格数据。 要优化数据,必须向数据源添加连接,并且必须了解源文件限制。 有关更多信息,请参阅 优化数据 (Data Refinery) 和 Data Refinery支持的数据源。
- DataStage
- DataStage 使用 DataStage 画布上的 连接器 与远程数据源进行交互。 要连接到数据源,您需要先为关联的 DataStage 连接器创建项目 连接资产 ,然后才能在 DataStage中使用该项目。
- 有关创建项目连接资产的指示信息,请参阅 向分析项目添加连接。
- 有关可用 DataStage 连接器的列表,请参阅 DataStage 连接器。
- 要添加本地文件 (例如 CSV 文件) ,请参阅 向分析项目添加数据。
- Data Virtualization
- 您可以从以下位置创建可用于数据进行虚拟化的连接:
- 平台连接 页面
- Data Virtualization 服务中的 数据源 页面。
有关更多信息,请参阅 添加数据源 (Data Virtualization)。
- SPSS Modeler
- SPSS Modeler 服务中的数据源支持只读访问,读/写访问和 SQL 回送。
SPSS Modeler 服务还支持其他几种文件类型。
有关更多信息,请参阅 SPSS Modeler 支持的数据源。
- Watson Knowledge Catalog
您可以创建可在目录中使用的连接以及可用于整理数据的连接。
对于可在目录中使用的连接,可以从目录的 " 概述 " 页面创建连接。
有关更多信息,请参阅 将连接资产添加到目录 (Watson Knowledge Catalog)。
- Watson Studio
理想情况下,使用已在目录中的数据。 在目录中搜索所需的数据并将其添加到分析项目。
或者,您可以创建能够在以下位置的分析项目中使用的连接:- 连接 页面
- 分析项目的 资产 页面
还可以添加文件中的数据。 要从文件添加数据,请转至分析项目的 资产 页面。
有关更多信息,请参阅 向分析项目添加数据。