“数据审核”节点
通过“数据审核”节点,可对您放置到 IBM® SPSS® Modeler 中并且以易于读取的矩阵(可对该矩阵进行排序并使用它生成正常大小的图形和各种数据准备节点)形式显示的数据有个初步的全面了解。
- “审核”选项卡显示具有汇总统计量、直方图和分布图的报告,它们有助于获得对数据的初步了解。该报告在字段名之前还显示存储图标。
- 审核报告中的“质量”选项卡显示有关离群值、极值和缺失值的信息,并提供用于处理这些值的工具。
使用“数据审核”节点
Data Audit 节点可直接附加到源节点,或附加到已实例化的 Type 节点的下游。您也可以根据结果生成多个数据准备节点。例如,可以生成过滤节点(该节点将具有过多缺失值的字段排除,不在建模中使用),并生成为任何或所有保留字段填补缺失值的超节点。这就是审核的真正作用所在,使您不仅可以评估数据的当前状态,还可以根据评估执行操作。
筛选数据或对数据抽样。初始审核在处理大数据时特别有效,因此可以在初始探索期间使用“样本”节点选择部分记录,以此缩短处理时间。在分析的探索阶段,也可以将 Data Audit 节点与 Feature Selection 节点和 Anomaly Detection 节点等节点组合使用。