准备数据
创建项目或连接项目后,下一步是向项目添加数据并准备数据以进行分析。
- 所需许可权
- 您必须在项目中具有 管理员 或 编辑者 角色才能添加或准备数据。
向项目添加数据的方法
您可以从本地系统,目录,资源中心或到数据源的连接添加数据资产。 请参阅将数据添加到项目。
您可将以下类型的数据资产添加到项目中:
- 来自于本地系统中的文件的数据资产,包括结构化数据、非结构化数据和图像。 文件存储在项目的 IBM Cloud Object Storage桶中。
- 包含用于连接到数据源的信息的连接资产。 您可以添加 IBM 或第三方数据源的连接。 请参阅 连接器 (Connectors)。
- 指定通过数据源连接进行访问的表、视图或文件的已连接数据资产。
- 在 IBM Cloud Object Storage 中指定路径的连接文件夹资产。
要快速入门,请学习教程。 请参阅 快速入门教程。
编制结构化数据的方法
您可以选择这些方法来准备结构化数据,如关系表。
| 任务 | 方法 |
|---|---|
| 清理和塑造数据 | Data Refinery |
| 生成合成数据 | Synthetic Data Generator |
| 保留特色 | 功能部件组 |
准备非结构化数据的方法
您可以选择这些方法来准备文档等非结构化数据。
| 任务 | 方法 |
|---|---|
| 将文件矢量化 | 向量索引 |
| 生成合成数据 | 合成数据生成应用程序接口 |