支持的数据源
在 IBM Cloud Pak for Data 4.7 版本支持结束之前,升级到 IBM Software Hub 5.1 版本。 更多信息,请参阅 IBM Software Hub 版本 5.1 文档中的升级 IBM Software Hub。
在 IBM Cloud Pak for Data中,无论数据位于何处,都可以连接到数据。
连接到数据的方式
连接到数据的方式取决于多个因素,包括安装在 Cloud Pak for Data上的服务。 某些服务可以使用在平台级别定义的连接,而其他服务使用特定于该服务的连接。
使用以下列表来确定适用于您的用例的方法。
- 在平台级别创建连接
- 通常,平台级别连接可简化创建和维护连接的过程。 创建连接,然后多个服务可以引用该连接。 如果更新连接,那么使用该连接的项目会自动选取这些更改。
您可以从 平台连接 页面创建平台级别连接。 这些连接可由整个平台上的各种服务使用。 但是,仅当安装了 Cloud Pak for Data common core services 时, 平台连接 页面才可用。
有关更多信息,请参阅 在平台级别连接到数据源。
如果以下语句成立,请考虑在平台级别创建连接:
- 服务支持平台级连接。
- 相同的连接需要由多个服务或实例使用或者在多个项目中使用。
- 您具有创建平台级别连接的相应许可权。
您必须在 " 平台连接 " 页面上具有 编辑者 或 管理员 角色。 更多信息,请参阅管理平台连接上的合作者。
平台连接对所有平台用户可视。 但是,只有具有数据源的凭证的用户才能使用连接。
如果您未看到要连接到的数据源类型,那么 Cloud Pak for Data 管理员可以上载 JDBC 驱动程序 JAR 文件,以便您可以创建与该数据源的通用 JDBC 连接。 有关更多信息,请参阅 导入数据源的 JDBC 驱动程序。
并非所有服务都支持相同类型的连接。 如果要使用 平台连接 目录中的连接,那么将根据服务支持的连接类型对连接列表进行过滤。 例如,如果使用连接将数据源添加到项目,那么仅显示项目支持的连接。
- 在服务级别创建连接
- 如果以下任何语句成立,请在服务级别创建连接:
- 您正在使用的服务不支持平台级连接。
- 您没有相应的许可权来创建平台级连接。
- 出于安全原因,您不希望将连接包含在 Connections 目录中。
有关更多信息,请参阅 在服务级别连接到数据源。
连接器
下表列出了可以从 Cloud Pak for Data连接到的数据源。
其他数据源
管理员可以上载 JDBC 驱动程序以启用与更多数据源的连接。 请参阅 导入数据源的 JBDC 驱动程序。
Watson Query 服务支持使用第三方 JDBC 驱动程序建立的连接。
数据文件
除了使用远程数据源或集成数据库中的数据之外,还可以使用文件中的数据。 您可以处理以下类型的文件中的数据。
| 数据文件的类型 | 支持于 |
|---|---|
| Avro | DataStage SPSS
Modeler Watson
Knowledge Catalog Watson
Studio |
| CSV | DataStage
SPSS
Modeler Watson
Knowledge Catalog Watson Query
Watson
Studio |
| JSON | DataStage
Watson
Knowledge Catalog Watson Query
Watson
Studio |
| Microsoft Excel 电子表格 | DataStage
SPSS
Modeler Watson
Knowledge Catalog Watson Query
Watson
Studio |
| ORC | Watson Query |
| Parquet | DataStage
Watson
Knowledge Catalog Watson Query
Watson
Studio |
| SAS | SPSS
Modeler Watson
Studio (Data Refinery) |
| SAV | SPSS Modeler |
| TSV | DataStage
Watson
Knowledge Catalog Watson Query
Watson
Studio (Data Refinery) |
| XML | DataStage
SPSS
Modeler |
连接到数据源(按服务分类)
使用以下资源在应用程序中创建连接。
- Cognos Dashboards
- 您可以使用 CSV 文件, Microsoft Excel 电子表格,已连接的数据资产和 Watson Query 资产作为仪表板的数据源。 必须先将所有这些数据源添加到项目中,然后才能将其用作数据源。
通过单击 " 所选源 " 窗格中的 添加源 (+) 按钮,将数据源添加到仪表板。
有关更多信息,请参阅 Cognos Dashboards。
- Data Refinery
您可以使用名为 Data Refinery的图形流编辑器工具来清理和优化表格数据。 要优化数据,必须向数据源添加连接,并且必须了解源文件限制。 有关更多信息,请参阅 优化数据 (Data Refinery) 和 Data Refinery支持的数据源。
- DataStage
- DataStage 使用 DataStage 画布上的 连接器 来处理远程数据源。 要连接到数据源,需要先为关联的 DataStage 连接器创建 连接资产 ,然后才能在 DataStage中使用该资产。
- 有关在 DataStage中连接到远程数据源的指示信息,请参阅 在 DataStage中连接到数据源。
- 有关可用 DataStage 连接器的列表,请参阅 DataStage中支持的数据源。
- 要添加本地文件 (例如 CSV 文件) ,请参阅 向项目添加数据。
- SPSS Modeler
- SPSS
Modeler 服务中的数据源支持只读访问,读/写访问和 SQL 回送。
SPSS Modeler 服务还支持其他几种文件类型。
有关更多信息,请参阅 SPSS Modeler支持的数据源。
- Watson Knowledge Catalog
- 您可以创建可在目录中使用的连接,也可以创建可用于组织数据的项目和连接。 通常,您可以从 平台连接 页面创建连接。 此外,您可以创建如下所示的连接:
- 可在目录 " 资产 " 页面的目录中使用的连接。 有关更多信息,请参阅 将连接资产添加到目录 (Watson Knowledge Catalog)。
- 可在项目的 资产 页面中的项目中使用的连接。 有关更多信息,请参阅 向项目添加数据。
- 创建元数据导入资产时可用于项目中元数据导入的连接。 有关更多信息,请参阅 管理元数据导入。
- Watson Query
- 您可以从以下位置创建可用于数据进行虚拟化的连接:
- 平台连接 页面
- Watson Query 服务中的 数据源 页面。
有关更多信息,请参阅 添加数据源 (Watson Query)。
- Watson Studio
理想情况下,请使用目录中已存在的数据。 在目录中搜索所需的数据,并将其添加到项目中。
或者,您可以从以下位置创建可在项目中使用的连接:- " 连接 " 页面
- 项目的 资产 页面
还可以添加文件中的数据。 要从文件添加数据,请转至项目的 资产 页面。
有关更多信息,请参阅 向项目添加数据。