可视化数据

您可以通过创建可视化来从数据中发现洞察。 通过使用可视化从不同角度浏览数据,您可以识别该数据中的模式,连接和关系,并快速了解大量信息。

云平台
IBM Cloud AWS
数据格式
表格 :Avro , CSV , JSON , Parquet , TSV , SAV , Microsoft Excel .xls 和 .xlsx 文件, SAS ,定界文本文件和已连接数据。

有关受支持的数据源的更多信息,请参阅 连接器

数据大小
无限制

您可以创建类似于以下示例的图形,以显示湿度值随时间变化的情况。

示例可视化

创建可视化

您可以通过从 可视化 选项卡中选择预定义的图表类型来构建图表。

要创建使用项目中的资产的可视化:

  1. 在项目的 资产 选项卡上,单击资产类型列表中的 数据资产 ,然后选择数据资产。
  2. 单击 可视化 选项卡。
  3. 从图表或选择列开始。 在打开的 " 详细信息 " 窗格中选择图表并输入首选项。

    如果首先选择列,那么将根据所选列从最相关的图表开始对可用图表进行排序。 数据的最佳图表以图表名称旁边的点表示。 根据所选数据,只有支持这些数据类型的图表和列可用。

    构建图表时,画布会显示图表的预览,其中包含从数据中获取的变量标签和测量级别。

    如果您关闭数据资产,或者从 可视化 选项卡切换,那么创建的图表不会保存在数据资产中。

  4. 选择 操作> 将可视化保存到项目 以保存可视化。 选择 创建新资产 附加到现有资产。 提供可视化资产名称,可选描述和图表名称,然后单击 应用

    已保存的资产将列示在项目中的 可视化 下。 您可以为同一数据资产创建不同的图表,并单独保存这些图表,或者将它们附加到项目中的同一可视化资产。

项目中已保存的可视化内容

点击项目可视化中的可视化资产名称,即可查看或编辑项目中的可视化。

在可视化资产的 "布局"选项卡上,您可以基于同一数据资产安排多个图表的布局,并生成 PDF 格式或 HTML 链接输出。 您可以从 "输出"选项卡下载 PDF 文件或获取 HTML 链接。

根据多达 5000 条记录的样本数据集生成图表。

根据完整的数据集生成图表:
  1. 图表 选项卡中编辑可视化资产。
  2. 选择 "修改图表设置"。
  3. 更改图表设置,激活保存按钮。
  4. 单击保存

您还可以通过这种方式在可视化资产中添加更多图表,并将其保存在项目中,而无需重新打开数据资产。

如果创建了可视化资产,然后删除了相应的数据资产,可视化资产仍会出现在项目中,但使用的是样本数据。 你可以在数据选项卡中看到原始数据集的数据模式。 然后,您可以单击从项目中选择,选择使用相同模式的新数据源。 如果项目中不存在具有此模式的数据资产,则可视化资产在项目中仅保留样本数据,且无法修改。 如果选择了具有相同模式的新数据资产,则必须通过编辑图表设置来刷新可视化资产,然后再次保存。

配置文件选项卡会显示数据集列的审计质量信息。

"审计"选项卡上,您可以看到自动计算的基本统计数据。 例如:
  • 最小值和最大值
  • 平均值
  • 标准偏差
  • 偏度
  • 唯一值数目

在 "质量"选项卡上,您可以看到数据每列的异常值或空值数量。

您还可以通过点击轮廓工具栏上的图标来创建皮尔逊相关性和描述性统计,包括频率。

如果导出项目,可视化资产(如果选中)也会导出。

了解更多