重要说明:

IBM Cloud Pak® for Data 4.7 版本将于 2025 年 7 月 31 日结束支持(EOS)。 欲了解更多信息,请参阅 IBM Cloud Pak for Data 版本 4.X 的停止服务公告

在 IBM Cloud Pak for Data 4.7 版本支持结束之前,升级到 IBM Software Hub 5.1 版本。 更多信息,请参阅 IBM Software Hub 版本 5.1 文档中的升级 IBM Software Hub。

将数据添加到项目 (Watson Studio 和 Watson Knowledge Catalog)

创建项目后,下一步是向其添加数据资产,以便您可以使用数据。 该项目中的所有合作者都会自动获得授权,可以访问该项目中的数据。

不同的资产类型可能具有重复的名称。 但是,不能多次添加同名的资产类型。

您可以使用以下方法将数据资产添加到项目:

方法 使用时间
添加本地文件 您在本地系统上具有 CSV 或类似文件中的数据。
创建数据库连接 您需要连接到远程数据源。
通过连接添加数据 您需要一个或多个来自远程数据源的表或文件。
从连接导入元数据 您需要来自远程数据源的许多表或文件。 您希望调度并重新运行导入过程。
从 IBM Cloud Object Storage 您需要在 IBM Cloud Object Storage 中建立一个文件夹,其中包含一组动态文件,如新闻源。
添加目录资产 您需要目录中的一个或多个资产。
将项目存储器中的文件转换为资产 您希望将在项目中创建的文件转换为数据资产。

添加本地文件

您可以将本地系统中的文件添加为项目中的数据资产。

所需许可权
您必须在项目中具有编辑者管理员角色。
限制
  • 文件不能为空。
  • 文件名不能包含以下字符: < > : ” / | ( ) ?
  • 文件名不能超过 255 个字符。
重要信息: 不会检查您添加到项目的文件是否存在恶意代码。 您必须确保您的文件不含可供其他合作者下载的任何类型恶意软件。

要将数据文件添加到项目中,请执行以下操作:

  1. 在项目的 " 资产 "页面,单击 " 上传资产到项目 "图标 (显示 "查找数据" 图标。)。您也可以在笔记本或画布中单击相同的图标 (显示 "查找数据" 图标。)。

  2. 在打开的窗格中,浏览文件或将其拖到窗格上。 您必须停留在该页面上,直至装入完成为止。 如果要停止装入文件,您可取消进行中的装入过程。

在项目的资产页面上,这些文件会列为数据资产。

单击数据资产名称时,可以从文件查看有关数据资产的以下信息:

  • 资产名称和描述
  • 资产的标记
  • 创建资产的人员的名称
  • 数据的大小
  • 资产添加到项目的日期
  • 上次修改资产的日期
  • 数据的预览,适用于 CSV、Avro、Parquet、TSV、Microsoft Excel、PDF、文本、JSON 和图像文件
  • 数据的 概要文件 ,用于 CSV , Avro , Parquet , TSV 和 Microsoft Excel 文件

您可以通过向项目添加具有相同名称和格式的文件,然后选择替换现有数据资产来更新文件中数据资产的内容。

您可以通过从资产名称旁边的操作菜单中选择 删除 选项来除去数据资产。 选择 准备数据 选项以使用 Data Refinery优化数据。

将项目存储器中的文件转换为资产

项目的存储器包含您上载到项目的数据资产,但它还可以包含其他文件。 例如,您可以将 DataFrame 保存在项目环境存储器的 Notebook 中。 您可以将项目存储器中的文件转换为资产。

要将项目存储器中的文件转换为资产:

  1. 从项目的 资产 选项卡中,单击 导入资产
  2. 选择 项目文件
  3. 选择 data_asset 文件夹。
  4. 选择资产,然后单击 导入

后续步骤

父主题: 访问数据