功能聚焦

“变量”选项卡

“变量数据”对话框用于验证您的数据。“变量”选项卡显示了文件中的变量。首先选择需要的变量,并将它们移动到“分析变量”列表中。

基础检查

您可以指定应用于文件中变量和案例的基础检查。例如,您可以获取相关报告,确定具有很高比例的缺失值或空白案例的变量。

标准规则和定制规则

将规则应用于识别无效值(有效范围之外的值或缺失值)的个别变量。您还可以创建自己的规则,创建交叉变量规则或应用预定义规则。

建议

自动化数据准备过程可提供建议,支持用户反复斟酌这些建议。

自动一步准备好数据

手动数据准备过程复杂且耗时。在您亟需结果时,ADP 过程可帮助您以一步有效的方式,检测和纠正质量错误并插补缺失值。ADP 功能提供易于理解的报告,包含全面的建议和可视化效果,帮助您确定可用于分析的合适数据。

数据准备过程的其他选项

通过使用验证数据过程,执行自动数据检查,并帮助消除耗时且繁琐的手动检查。您可以通过此过程应用相关规则,根据每个变量的度量级别(无论是分类还是连续性的)执行数据检查。然后,在分析之前,由您自行决定数据有效性,以及除去或更正可疑的个例。

对尺度变量进行分箱或设置尺度变量的分割点

利用最佳分箱过程,您可以更准确地使用专为标称属性而设计的算法(如朴素贝叶斯和 Logit 模型)。最佳分箱过程使您能够对尺度变量进行分箱或设置尺度变量的分割点。

从三种最佳分箱类型中进行选择

在构建模型之前,选择其中一种最佳分箱类型对数据进行预处理。1) 无监督:创建相同计数的分箱。2) 监督:考虑目标变量以确定分割点。这种方法比“无监督”方法更准确;但是,它的计算也更密集。3) 混合方法:将“无监督”和“监督”方法相结合。如果您拥有大量的不同值,那么这种方法非常有用。

技术详细信息

软件需求

IBM SPSS Data Preparation 需要有效的 IBM SPSS Statistics Base 许可证。

  • 必备软件:IBM SPSS Statistics

硬件需求

  • 处理器:2 GHz 或更高主频
  • 显示器:1024*768 或更高
  • 内存:4 GB RAM(必需),8 GB RAM 或更高(建议)
  • 磁盘空间:2 GB 或更大空间

了解工作方式

立即购买并开始使用