IBM Cloud Pak® for Data 4.7 版本将于 2025 年 7 月 31 日结束支持(EOS)。 欲了解更多信息,请参阅 IBM Cloud Pak for Data 版本 4.X 的停止服务公告。
在 IBM Cloud Pak for Data 4.7 版本支持结束之前,升级到 IBM Software Hub 5.1 版本。 更多信息,请参阅 IBM Software Hub 版本 5.1 文档中的升级 IBM Software Hub。
将数据添加到项目 (Watson Studio 和 Watson Knowledge Catalog)
创建项目后,下一步是向其添加数据资产,以便您可以使用数据。 该项目中的所有合作者都会自动获得授权,可以访问该项目中的数据。
不同的资产类型可能具有重复的名称。 但是,不能多次添加同名的资产类型。
您可以使用以下方法将数据资产添加到项目:
| 方法 | 使用时间 |
|---|---|
| 添加本地文件 | 您在本地系统上具有 CSV 或类似文件中的数据。 |
| 创建数据库连接 | 您需要连接到远程数据源。 |
| 通过连接添加数据 | 您需要一个或多个来自远程数据源的表或文件。 |
| 从连接导入元数据 | 您需要来自远程数据源的许多表或文件。 您希望调度并重新运行导入过程。 |
| 从 IBM Cloud Object Storage | 您需要在 IBM Cloud Object Storage 中建立一个文件夹,其中包含一组动态文件,如新闻源。 |
| 添加目录资产 | 您需要目录中的一个或多个资产。 |
| 将项目存储器中的文件转换为资产 | 您希望将在项目中创建的文件转换为数据资产。 |
添加本地文件
您可以将本地系统中的文件添加为项目中的数据资产。
- 所需许可权
- 您必须在项目中具有编辑者或管理员角色。
- 限制
- 文件不能为空。
- 文件名不能包含以下字符:
< > : ” / | ( ) ?
- 文件名不能包含以下字符:
- 文件名不能超过 255 个字符。
要将数据文件添加到项目中,请执行以下操作:
在项目的 " 资产 "页面,单击 " 上传资产到项目 "图标 (
)。您也可以在笔记本或画布中单击相同的图标 (
)。在打开的窗格中,浏览文件或将其拖到窗格上。 您必须停留在该页面上,直至装入完成为止。 如果要停止装入文件,您可取消进行中的装入过程。
在项目的资产页面上,这些文件会列为数据资产。
单击数据资产名称时,可以从文件查看有关数据资产的以下信息:
- 资产名称和描述
- 资产的标记
- 创建资产的人员的名称
- 数据的大小
- 资产添加到项目的日期
- 上次修改资产的日期
- 数据的预览,适用于 CSV、Avro、Parquet、TSV、Microsoft Excel、PDF、文本、JSON 和图像文件
- 数据的 概要文件 ,用于 CSV , Avro , Parquet , TSV 和 Microsoft Excel 文件
您可以通过向项目添加具有相同名称和格式的文件,然后选择替换现有数据资产来更新文件中数据资产的内容。
您可以通过从资产名称旁边的操作菜单中选择 删除 选项来除去数据资产。 选择 准备数据 选项以使用 Data Refinery优化数据。
将项目存储器中的文件转换为资产
项目的存储器包含您上载到项目的数据资产,但它还可以包含其他文件。 例如,您可以将 DataFrame 保存在项目环境存储器的 Notebook 中。 您可以将项目存储器中的文件转换为资产。
要将项目存储器中的文件转换为资产:
- 从项目的 资产 选项卡中,单击 导入资产。
- 选择 项目文件。
- 选择 data_asset 文件夹。
- 选择资产,然后单击 导入。
后续步骤
父主题: 访问数据