平均值:选项

您可以为每个分组变量的每个类别中的变量选择下列一个或多个子组统计:合计、个案数、平均值、中位数、组内中位数、平均值的标准误差、最小值、最大值、范围、分组变量的第一个类别的变量值、分组变量的最后一个类别的变量值、标准差、方差、峰度、峰度标准误差、偏度、偏度标准误差、总和百分比、总个案数百分比、合计百分比、个案数百分比、几何平均值以及调和平均值。 您可更改子组统计出现的顺序。 统计在“单元格统计”列表中出现的顺序是它们在输出中显示的顺序。 还将显示跨所有类别的每个变量的汇总统计。

第一个显示在数据文件中遇到的第一个数据值。

几何平均值数据值的乘积的 n 次根,其中 n 代表个案数目。

分组中位数针对编码到组中的数据计算的中位数。 例如,如果对于每个 30 年代的年龄数据的值都编码为 35,40 年代的编码为 45,依次类推,那么组内中位数是由已编码的数据计算得出的。

调和平均值在组中的样本大小不相等的情况下用来估计平均组大小。 调和平均值是样本总数除以样本大小的倒数总和。

峰度有离群值的程度的测量。 对于正态分布,峰度统计的值为 0。 正峰度指示数据表现出比正态分布更多的极值离群值。 负峰度值表示数据的异常离群值低于正态分布。 使用的库托比的定义(其中的值为 0 表示正常分布),有时被称为过量的峰度。 某些软件可能会报告库图,使值为 3 表示正态分布。

最后一个显示在数据文件中遇到的最后一个数据值。

最大值数值变量的最大值。

平均值集中趋势的测量。 算术平均,总和除以个案个数。

中位数第 50 个百分位,大于该值和小于该值的个案数各占一半。 如果个案个数为偶数,那么中位数是个案在以升序或降序排列的情况下最中间的两个个案的平均。 中位数是集中趋势的测量,但对于远离中心的值不敏感(这与平均值不同,平均值容易受到少数多个非常大或非常小的值的影响)。

最小值数值变量的最小值。

N个案(观测值或记录)的数目。

总个案数的百分比每个类别中的个案总数的百分比。

总和的百分比每个类别中的总和百分比。

范围数字变量最大值和最小值之间的差;最大值减去最小值。

偏度分布的不对称性测量。 正态分布是对称的,偏度值为 0。 具有显著的正偏度的分布有很长的右尾。 具有显著的负偏度的分布有很长的左尾。 作为一个指导,当偏度值超过标准误差的两倍时,那么认为不具有对称性。

标准差对围绕平均值的离差的测量。 在正态分布中,68% 的个案在平均值的一倍标准差范围内,95% 的个案在平均值的两倍标准差范围内。 例如,在正态分布中,如果平均年龄为 45,标准差为 10,那么 95% 的个案将处于 25 到 65 之间。

Kurtosis 的标准误差 (Standard Error of Kurtosis)峰度与其标准误差的比可用作正态性检验(即,如果比值小于 -2 或大于 +2,就可以拒绝正态性)。 大的正峰度值表示分布的尾部比正态分布的尾部要长一些;负峰度值表示比较短的尾部(变为像框状的均匀分布尾部)。

平均值的标准误差取自同一分布的样本与样本之间的平均值之差的测量。 用于粗略将观测到的均数与假设值对比(即,如果差异与标准误差的比率小于 -2 或大于 +2,则可以得出此均数与假设值不同的结论)。

标准误差 (Standard Error of Skewness)偏度与其标准误差的比可用作正态性检验(即,如果比值小于 -2 或大于 +2,就可以拒绝正态性)。 大的正偏度值表示长右尾;极负值表示长左尾。

合计所有带有非缺失值的个案的值的合计或总计。

方差对围绕平均值的离差的测量,值等于与平均值的差的平方和除以个案数减一。 度量方差的单位是变量本身的单位的平方。

第一层的统计

Anova 表和 eta显示单因素方差分析表,并为第一层中的每个自变量计算 eta 和 eta 平方(相关性测量)。

线性相关度检验计算与线性和非线性成分相关联的平方和、自由度和均方,以及 F 比、R 和 R 方。 如果自变量为短字符串,那么不计算线性相关度。

指定平均值的选项

此功能需要 Statistics Base 选项。

  1. 从菜单中选择:

    分析 > 比较平均值 > 平均值 ...

  2. 在“平均值”对话框中,选择选项