探索

此功能需要 Statistics Base 选项。

“探索”过程既可以为所有个案也可以分别为个案组生成汇总统计和图形显示。 使用“探索”过程有很多原因:数据过滤、离群值识别、描述、假设检验以及描述子群体(个案组)之间差异的特征。 通过数据过滤可以得知您具有异常值、极值、数据中的缺口或其他特性。 探索数据可以帮助确定您正考虑用于数据分析的统计方法是否合适。 如果该方法要求数据呈正态分布,您可能通过探索得知需要进行转换数据。 或者,您可能认为需要进行非参数检验。

示例。 看一下老鼠在四种不同强化时制下的迷宫学习时间的分布。 对于四个组中的每一个,可以发现时间是否近似呈正态分布,以及四个方差是否相等。 您也可以标识具有 5 个最长时间和 5 个最短时间的个案。 箱图和茎叶图以图形方式汇总每个组的学习时间的分布。

统计和图。 平均值、中位数、5% 切尾平均值、标准误差、方差、标准差、最小值、最大值、范围、四分位距、偏度和峰度及它们的标准误差、平均值的置信区间(和指定的置信度级别)、百分位、Huber 的 M 估计、Andrews 波估计量、Hampel 的重新下降 M 估计和 Tukey 的双权重估计量、五个最大值和五个最小值、带用于检验正态性的 Lilliefors 显著性水平的 Kolmogorov-Smirnov 统计和 Shapiro-Wilk 统计。 箱图、茎叶图、直方图、正态图、带 Levene 检验和转换的分布-水平图。

探索数据注意事项

数据。 “探索”过程可用于定量变量(定距或者定比级别度量)。 因子变量(用于将数据分为个案组)应具有合理数量的不相同的值(类别)。 这些值可以是短字符串或数值。 用于在箱图中标记离群值的个案标签变量可以是短字符串、长字符串(前 15 个字节)或数值。

假设。 数据不必呈对称或正态分布。

探索数据

此功能需要 Statistics Base 选项。

  1. 从菜单中选择:

    分析 > 描述统计 > 浏览 ...

    注意: 红色标记的字段为必填项。 在所有必填字段中输入有效值后," 粘贴 "和 "确定 "按钮将被启用。
  2. 选择一个或多个因变量。

您可以选择性地执行下列操作:

  • 选择一个或多个因子变量,其值将定义个案组。
  • 选择标识变量用于标记个案。
  • 单击统计以获得稳健估计量、离群值、百分位和频率表。
  • 单击以获得直方图、正态概率图和检验以及带 Levene 统计的分布-水平图。
  • 单击选项以处理缺失值。

此过程将粘贴 检查组 命令语法。