显示统计量
使用“显示统计量”对话框,可以选择显示在“审核”选项卡上的统计量。初始设置是在 Data Audit 节点中指定的。有关更多信息,请参阅数据审核节点的设置选项卡主题。
最小值 (Minimum). 数值变量的最小值。
最大值 (Maximum). 数值变量的最大值。
Sum. 所有带有非缺失值的观测值的值的合计或总计。
范围 (Range). 数字变量的最大值与最小值的差值就是用最大值减最小值后得出的值。
均值 (Mean). 集中趋势的测量值。算术平均值,等于总和除以观测值数。
均值标准误差 (Standard Error of Mean). 来自同一分布的各样本之间均值差异的测量值。用于粗略将观测到的均数与假设值对比(即,如果差异与标准误差的比率小于 -2 或大于 +2,则可以得出此均数与假设值不同的结论)。
标准差 (standard deviation). 均数离差的度量值,等于方差的平方根。以和原始变量相同的单位度量标准差。
偏差. 平均值离散度的测量值,等于均值的平方差除以观测值数减一的差。方差按单元计量,即变量自身单元数的平方。
偏度 (Skewness). 分布的不对称度量值。正态分布是一种对称性分布,其偏度值为 0。具有显著性正偏度的分布右侧尾部较长。具有显著负偏态的分布具有向左延伸的长尾。提示:取大于其标准误差两倍的偏度值指示离开对称的距离。
偏度标准误差 (Standard Error of Skewness). 偏态与其标准误差的比率可用作正态检验(即,如果该比率小于 -2 或大于 -2,则可以拒绝正态)。偏度正值越大表示长尾向右越长;负极值表示向左的长尾。
峰度 (Kurtosis). 存在离群值的程度的测量。对于正态分布,峰度统计量的值为零。正峰度值表示数据呈现比正态分布更极端的离群值。负峰度值表示数据呈现比正态分布极端程度较低的离群值。
峰度标准误差 (Standard Error of Kurtosis). 峰度与其标准误差的比率可用作正态检验(即如果比率小于 -2 或大于 +2,则可以拒绝正态)。峰度较大的正值表示该分布的尾部比正态分布的尾部长;峰度的负值表示较短的尾部(与箱形均匀分布的尾部变得相似)。
唯一. 同步评估所有效应,同时为任意类型的所有其他效应调整每一个效应。
有效. 有效观测值既不包含系统缺失值,也不包含定义为用户缺失的值。 请注意,null(未定义的)值、空白值、空格和空字符串总是被视为无效值。
中位数 (Median). 第 50 个百分位,大于该值和小于该值的观测值数各占一半。如果有偶数个观测值,则中位数为它们以升序或降序排列时两个中间观测值的平均值。中位数是集中趋势的一种测量,对离群值不敏感(与平均值不同,平均值会受部分极高或极低值的影响)。
众数 (Mode). 最常出现的值。如果多个值共享最大出现频率,则每个值都是一个众数。
请注意,为了提高性能,缺省情况下不会显示中位数和众数,但是您可以在 Data Audit 节点的“设置”选项卡上将其选中。有关更多信息,请参阅数据审核节点的设置选项卡主题。
重叠的统计量
如果连续(数值范围)重叠字段正在使用,则下列统计量也可用:
协方差 (Covariance). 两个变量间关联性的非标准化测量值,等于叉积偏差除以 N-1。