将数据从连接添加到项目
已连接的数据资产 是指向通过与外部数据源的连接访问的数据的指针。 您可以通过指定连接,任何中间结构或路径以及关系表或视图,一组分区数据文件或文件来创建已连接的数据资产。 访问已连接的数据资产时,将从数据源动态检索数据。
您还可以添加通过连接以相同方式访问的已连接文件夹资产。 请参阅 向项目添加已连接的文件夹资产。
如果文件满足以下要求,那么将识别分区数据并将其视为关系表:
- 这些文件具有前缀
part-。 - 这些文件位于 IBM Cloud Object Storage 中不包含其他文件的单个文件夹中。
分区数据资产具有预览和概要文件,例如关系表。 但是,您无法使用 Data Refinery 工具对分区数据资产进行塑形和清理。
要将数据资产从连接添加到项目,请执行以下操作:
- 打开要导入的资产列表。 在项目页面中,单击 资产 选项卡,然后单击 导入资产> 已连接数据。
- 选择现有连接资产作为数据源。 如果没有任何连接资产,请取消并转至 新建资产> 连接 和 创建连接资产。
- 如有必要,请输入以密钥图标
标记的已锁定数据连接的个人凭证。 这是为您永久解锁连接的一次性步骤。 解锁连接后,将不再显示密钥图标。 请参阅 向项目添加连接。 - 选择所需的数据。 您可以从同一连接中选择多个已连接的数据资产。 单击 导入。 对于分区数据,请选择包含文件的文件夹。 如果将这些文件识别为分区数据,那么您将看到消息
This folder contains a partitioned data set. - 输入名称和描述。
- 单击创建。 该资产将显示在项目的 " 资产 " 页面上。
单击资产名称时,可以看到有关已连接资产的以下信息:
观看此视频以了解如何创建连接并将已连接的数据添加到项目。
此视频提供了一种可视方法来学习本文档中的概念和任务。
后续步骤
了解更多
父主题: