资产概要文件
数据资产的概要文件包含生成的元数据和有关数据内容的统计信息。 您可以在目录或分析项目中的资产的 " 概要文件 " 页面上查看概要文件。 所有目录或项目成员都可以查看数据资产概要文件。
对于包含关系数据或结构化数据的数据资产,其概要文件会显示数据集中每一列的相关信息。 缺省情况下,该概要文件会基于前 5,000 行数据进行创建。 但是,如果该数据资产有 250 个以上的列,那么会基于前 1,000 行数据来创建概要文件。 概要文件显示推断的数据类以及有关每个列的数据的统计信息。 数据类描述列中的数据内容,例如,城市、帐号或信用卡号。 数据类可用于使用数据保护规则 屏蔽数据 。 此外,它们还可用于使用策略限制对数据资产的访问。 针对资产的 " 概述 " 页面和 " 概要文件 " 页面上的每一列显示数据类。
以下类型的关系数据和结构化数据按列进行概要分析:
- 从连接到数据源的 关系数据库中的数据资产 。
- 来自分区数据集的数据资产,其中分区数据集由多个文件组成,并由从本地文件系统上载的单个文件夹或从基于文件的连接到 数据源来表示。
来自从本地文件系统上载的文件或从数据源的基于文件的连接上载的文件的数据资产,具有以下格式:
- CSV
- XLSX (仅对工作簿中的第一个工作表进行概要分析。)
- Avro
- Parquet
但是,当数据资产未显式引用结构化数据文件时,不会对这些数据文件进行概要分析,例如在以下情况下:
- 这些文件在文件夹资产中。 可从文件夹资产访问的文件不会作为资产处理,并且不会进行概要分析。
- 这些文件在归档文件中。 该归档文件由数据资产引用,并且不会对压缩文件进行概要分析。
在受管理的目录中,缺省情况下会创建数据资产的概要文件。
在项目中,以及在未实施数据保护规则的目录中,您必须为数据资产手动创建概要文件。
了解更多信息
父主题: 资产类型和属性