支持的数据源
连接到数据的方式
使用以下列表来选择用于连接到用例的数据的方法。
- 在平台级别创建连接
- 通常,平台级别连接可简化创建和维护连接的过程。 创建连接,然后多个服务可以引用该连接。 如果更新连接,那么使用该连接的项目会自动选取这些更改。
您可以从 平台连接 页面创建平台级别连接。 这些连接可由整个平台上的各种服务使用。 但是,仅当安装了 Cloud Pak for Data common core services 时, 平台连接 页面才可用。
有关更多信息,请参阅 在平台级别连接到数据源。
如果以下语句成立,请考虑在平台级别创建连接:
- 服务支持平台级连接。
- 相同的连接需要由多个服务或实例使用或者在多个项目中使用。
- 您具有创建平台级别连接的相应许可权。
您必须在 " 平台连接 " 页面上具有 编辑者 或 管理员 角色。 有关更多信息,请参阅 管理平台连接上的合作者。
平台连接对所有平台用户可视。 但是,只有具有数据源的凭证的用户才能使用连接。
如果您未看到要连接到的数据源类型,那么 Cloud Pak for Data 管理员可以为该数据源创建 定制 JDBC 连接器 。 如果仅连接到一个数据源,并且用户不需要可重复的方法来连接到该数据源,那么可以创建 通用 JDBC 连接。
并非所有服务都支持相同类型的连接。 如果要使用 平台连接 目录中的连接,那么将根据服务支持的连接类型对连接列表进行过滤。 例如,如果使用连接将数据源添加到项目,那么仅显示项目支持的连接。
- 在服务级别创建连接
- 如果以下任何语句成立,请在服务级别创建连接:
- 您正在使用的服务不支持平台级连接。
- 您没有相应的许可权来创建平台级连接。
- 出于安全原因,您不希望将连接包含在 Connections 目录中。
有关更多信息,请参阅 在服务级别连接到数据源。
连接器
下表列出了可以从 Cloud Pak for Data连接到的数据源。
其他数据源
管理员可以上载 JDBC 驱动程序以启用与更多数据源的连接。 请参阅 导入数据源的 JBDC 驱动程序。
Data Virtualization 服务支持使用第三方 JDBC 驱动程序建立的连接。
数据文件
除了使用远程数据源或集成数据库中的数据之外,还可以使用文件中的数据。 您可以处理以下类型的文件中的数据。
| 数据文件的类型 | 支持于 |
|---|---|
| Avro | DataStage IBM Knowledge Catalog
SPSS
Modeler Watson Studio
|
| CSV | DataStage
Decision Optimization
IBM Knowledge Catalog
SPSS
Modeler Data Virtualization
Watson Studio
|
| JSON | DataStage
Decision Optimization (JSON 表格形式)
IBM Knowledge Catalog
Data Virtualization
Watson Studio
|
| Microsoft Excel 电子表格 | DataStage
IBM Knowledge Catalog
SPSS
Modeler Data Virtualization
Watson Studio
|
| ORC | DataStage
Data Virtualization
|
| Parquet | DataStage
IBM Knowledge Catalog
Data Virtualization
Watson Studio
|
| SAS | SPSS
Modeler Watson Studio (Data Refinery)
|
| SAV | DataStage
SPSS
Modeler |
| TSV | DataStage
IBM Knowledge Catalog
Data Virtualization
Watson Studio (Data Refinery)
|
| XML | DataStage
Decision Optimization (XML 表格形式)
SPSS
Modeler |
连接到数据源(按服务分类)
使用以下资源在应用程序中创建连接。
- Cognos Dashboards
- 您可以使用 CSV 文件, Microsoft Excel 电子表格,已连接的数据资产和 Data Virtualization 资产作为仪表板的数据源。 必须先将所有这些数据源添加到项目中,然后才能将其用作数据源。
通过单击 " 所选源 " 窗格中的 添加源 (+) 按钮,将数据源添加到仪表板。
有关更多信息,请参阅 Cognos Dashboards。
- Data Refinery
您可以使用名为 Data Refinery的图形流编辑器工具来清理和优化表格数据。 要优化数据,必须向数据源添加连接,并且必须了解源文件限制。 有关更多信息,请参阅 优化数据 (Data Refinery) 和 Data Refinery支持的数据源。
- Data Virtualization
- 您可以从以下位置创建可用于数据进行虚拟化的连接:
- 平台连接 页面
- Data Virtualization 服务中的 数据源 页面。
有关更多信息,请参阅 连接到 Data Virtualization中的数据源。
- DataStage
- DataStage 使用 DataStage 画布上的 连接器 来处理远程数据源。 要连接到数据源,需要先为关联的 DataStage 连接器创建 连接资产 ,然后才能在 DataStage中使用该资产。
- 有关在 DataStage中连接到远程数据源的指示信息,请参阅 在 DataStage中连接到数据源。
- 有关可用 DataStage 连接器的列表,请参阅 DataStage中支持的数据源。
- 要添加本地文件 (例如 CSV 文件) ,请参阅 向项目添加数据。
- Db2 Big SQL
- 您可以创建连接以从对象存储库或远程 Hadoop 集群查询数据。 在供应 Db2
Big SQL 实例时连接到数据源。
有关更多信息,请参阅 为 Db2 Big SQL创建服务实例。
- Decision Optimization
- 您可以使用 CSV , JSON (表格形式) , XML (表格形式) 或已连接的资产来构建和部署 Decision Optimization 模型。
- IBM Knowledge Catalog
- 您可以创建可在目录中使用的连接,也可以创建可用于组织数据的项目和连接。 通常,您可以从 平台连接 页面创建连接。 此外,您可以创建如下所示的连接:
- 可在目录 " 资产 " 页面的目录中使用的连接。 有关更多信息,请参阅 将连接资产添加到目录。
- 可在项目的 资产 页面中的项目中使用的连接。 有关更多信息,请参阅 向项目添加数据。
- 创建元数据导入资产时可用于项目中元数据导入的连接。 有关更多信息,请参阅 管理元数据导入。
- IBM watsonx.ai
从 Tuning Studio中调整基础模型时,将基础模型输入/输出对的样本添加为训练数据。 您可以从存储在已连接数据存储器中的 JSON 或 JSONL 文件中获取这些样本,也可以从存储在已连接数据库中的表格数据中获取这些样本。
必须先创建与要使用的数据源的连接,然后才能从 Tuning Studio对其进行访问。 然后,可以直接从已连接的数据源添加数据,也可以从使用已连接的数据源中的数据创建的数据资产添加数据。
有关受支持的数据源的更多信息,请参阅 用于调整基础模型的数据格式。
您可以从以下位置创建可在项目中使用的连接:- 平台连接 页面
- 项目的 资产 页面
有关更多信息,请参阅 向项目添加数据。
- SPSS Modeler
- SPSS
Modeler 服务中的数据源支持只读访问,读/写访问和 SQL 回送。
SPSS Modeler 服务还支持其他几种文件类型。
有关更多信息,请参阅 SPSS Modeler支持的数据源。
- Synthetic Data Generator
- Synthetic Data Generator 服务中的数据源支持只读访问和读/写访问。
Synthetic Data Generator 服务还支持其他几种文件类型。
有关更多信息,请参阅 Synthetic Data Generator支持的数据源。
- Watson Machine Learning Accelerator
- 您可以从以下位置创建可在项目中使用的连接:
- " 连接 " 页面
- 项目的 资产 页面
还可以添加文件中的数据。 要从文件添加数据,请转至项目的 资产 页面。
有关更多信息,请参阅 向项目添加数据。
- Watson Studio
理想情况下,请使用目录中已存在的数据。 在目录中搜索所需的数据,并将其添加到项目中。
或者,您可以从以下位置创建可在项目中使用的连接:- " 连接 " 页面
- 项目的 资产 页面
还可以添加文件中的数据。 要从文件添加数据,请转至项目的 资产 页面。
有关更多信息,请参阅 向项目添加数据。
- Data Product Hub
您可以添加连接以访问广泛的数据源,从而创建和交付数据产品。
有关更多信息,请参阅 Data Product Hub的连接器。