线性回归
“线性回归”估计包含一个或多个自变量的线性方程的系数,这些系数能最佳地预测因变量的值。 例如,可尝试根据诸如年龄、教育程度和从业年数等自变量来预测销售人员的全年销售额(因变量)。
示例。 某个篮球队在一个赛季中获胜的场次与该队在每场比赛中的平均得分相关吗? 散点图表示这些变量线性相关。 获胜的场次与对手的平均得分也是线性相关的。 这些变量负相关。 随着获胜场次的增加,对手的平均得分减少。 通过线性回归,您可以对这些变量的关系进行建模。 好的模型可以用来预测球队的获胜场次。
统计。 对于每个变量:有效个案数、平均值和标准差。 对于每个模型:回归系数、相关性矩阵、部分相关和偏相关、复 R、R 2、调整 R 2、R 2 变化、估计值的标准误差、方差分析表、预测值和残差。 另外还包括:每个回归系数的 95% 置信区间、方差-协方差矩阵、方差膨胀因子、容差、Durbin-Watson 检验、距离测量(Mahalanobis、Cook 和杠杆值)、DfBeta、DfFit、预测区间和个案诊断信息。 图:散点图、部分图、直方图和正态概率图。
线性回归数据注意事项
的合法性。 因变量和自变量必须是定量的。 分类变量(例如宗教、主要研究领域或居住地)需要记录到二分类(哑元)变量或其他类型的对比变量中。
假设。 对于自变量的每个值,因变量必须呈正态分布。 对于自变量的所有值,因变量分布的方差必须是恒定的。 因变量和每个自变量之间的关系应是线性的,且所有观察值应是独立的。
获取线性回归分析
此功能需要 Statistics Base 选项。
- 从菜单中选择:
- 在“线性回归”对话框中,选择一个数值型因变量。
- 选择一个或多个数值型自变量。
您可以选择性地执行下列操作:
- 将自变量分组成块,并对不同的变量子集指定不同的进入方法。
- 选择一个选择变量,将分析限于包含此变量特定值的个案子集。
- 选择个案标识变量,用于标识图上的点。
- 选择数值型 WLS 权重变量以进行加权最小二次方分析。
WLS。 允许您获取加权最小二次方模型。 以数据点方差的倒数对数据点进行加权。 这意味着方差较大的观测值对分析的影响比方差较小的观测值要小。 如果加权变量的值为 0、负数或缺失,那么将该个案从分析中排除。
此过程将粘贴 REGRESSION 命令语法。