什么是线性回归?
使用易于理解的数学公式生成预测结果
深入了解 SPSS Statistics
说明线性回归中趋势、数据分析和预测之间关系的插图
什么是线性回归?

线性回归分析用于根据一个变量的值来预测另一个变量的值。您要预测的变量称为因变量。用于预测另一个变量值的变量称为自变量。

这种形式的分析估算的是线性方程的系数,涉及一个或多个最能预测因变量值的自变量。线性回归拟合出一条直线或曲面,使预测值与实际输出值之间的差异最小。有一些简单的线性回归计算器使用“最小二乘法”为一组配对数据找出最佳拟合线。然后,您可以根据 Y(自变量)估算出 X(因变量)的值。

用于线性回归的 SPSS Statistics

IBM® SPSS Statistics 使您能够计算一组数据点对特定结果的影响,并对线性和非线性关系进行建模。

更轻松地生成预测结果

您可以在 Microsoft Excel 中进行线性回归,也可以使用诸如 IBM SPSS Statistics 之类的统计软件包,这些软件包极大地简化了使用线性回归方程、线性回归模型和线性回归公式的过程。SPSS Statistics 可用于简单线性回归和多元线性回归等技术。

您可以在各种程序和环境中执行线性回归方法,包括:

  • R 线性回归
  • MATLAB 线性回归
  • Sklearn 线性回归
  • 线性回归 Python
  • Excel 线性回归
线性回归为何重要

线性回归模型相对简单,并提供易于理解的数学公式,可以生成预测结果。线性回归可以应用于商业和学术研究的各个领域。

您会发现线性回归广泛应用于从生物、行为、环境和社会科学到商业的各个领域。线性回归模型已成为科学可靠地预测未来的可靠方法。 由于线性回归是一种历史悠久的统计过程,因此线性回归模型的属性已广为人知,并且可以非常快速地进行训练。

一种科学可靠地预测未来的行之有效的方法

业务和组织领导者可以通过使用线性回归技术做出更好的决策。组织收集大量数据,线性回归可以帮助他们利用这些数据更好地管理现实,而不是依赖经验和直觉。您可以获取大量原始数据,并将其转化为可操作的信息。

您还可以使用线性回归来揭示业务同事以前可能已经看到并自以为已经理解的模式和关系,从而提供更好的洞察分析。例如,对销售和购买数据进行分析可以帮助您发现特定日期或特定时间的特定购买模式。从回归分析中获得的洞察分析可以帮助企业领导者预测公司产品需求旺盛的时期。

在 IBM Knowledge Center 了解更多有关线性回归的信息
有效线性回归的关键假设

线性回归分析成功需要考虑的假设:

  • 对于每个变量:考虑有效案例的数量、平均值和标准差。
  • 对于每个模型:考虑回归系数、相关矩阵、部分和局部相关性、多重 R、R2、调整 R2、R2 变化、估计值的标准误差、方差分析表、预测值和残差。此外,还要考虑每个回归系数的 95% 置信区间、方差-协方差矩阵、方差膨胀因子、容差、Durbin-Watson 检验、距离测量(Mahalanobis、Cook 和杠杆值)、DfBeta、DfFit、预测区间和个案诊断信息。 
  • 绘图:考虑散点图、局部图、直方图和正态概率图。
  • 数据:因变量和自变量应该是定量的。类别变量,例如宗教、主要研究领域或居住地区,需要重新编码为二元(虚拟)变量或其他类型的对比变量。
  • 其他假设:对于自变量的每个值,因变量的分布必须是正态的。对于所有自变量值,因变量分布的方差应保持不变。 因变量和每个自变量之间的关系应该是线性的,并且所有观察结果应该是独立的。
免费试用 SPSS Statistic
确保您的数据符合线性回归假设

在尝试进行线性回归之前,您需要确保可以使用该程序分析您的数据。您的数据必须通过某些必要的假设。

以下是检查这些假设的方法:

  1. 变量应在连续水平上进行测量。连续变量的示例包括时间、销售额、体重和测试分数。 
  2. 使用散点图可以快速确定这两个变量之间是否存在线性关系。
  3. 这些观测值应该相互独立(也就是说,不应存在依赖关系)。
  4. 您的数据不应有明显的异常值。 
  5. 检查同方差性——一种统计概念,其中最佳拟合线性回归线上的方差在整条线上都保持相似。
  6. 最佳拟合回归线的残差(误差)呈正态分布。
使用本实践教程了解更多有关线性回归数据假设的信息
线性回归成功示例
评估趋势和销售估算值

您还可以使用线性回归分析法,尝试根据年龄、教育程度和工作年限等自变量来预测销售人员的年销售总额(因变量)。

分析定价弹性

定价变化通常会影响消费者行为——线性回归可以帮助您分析影响方式。例如,如果特定产品的价格不断变化,您可以使用回归分析来查看消费是否随着价格上涨而下降。如果消费没有随着价格上涨而大幅下降呢? 买家在什么价位停止购买产品? 这些信息对于零售企业的领导者非常有帮助。

评估保险公司的风险

线性回归技术可用于分析风险。例如,一家保险公司用于调查房主保险索赔的资源可能有限;利用线性回归,该公司的团队可以建立一个模型来估算索赔成本。这项分析可以帮助公司领导者做出重要的商业决策,决定应该承担哪些风险。

运动分析

线性回归并不总是与商业有关。这在体育运动中也很重要。 例如,您可能想知道篮球队在一个赛季中获胜的比赛场数是否与球队每场比赛的平均得分有关。散点图表示这些变量是线性相关的。 获胜场数和对手的平均得分也呈线性关系。这些变量存在负相关关系。随着获胜场数增加,对手的平均得分会减少。 通过线性回归,您可以对这些变量之间的关系进行建模。 优秀的模型可以用来预测球队会赢多少场比赛。

相关解决方案
IBM SPSS Statistics 软件

利用这种快速、强大的解决方案推动研究和分析。

探索 SPSS Statistics
IBM SPSS Statistics GradPack 和 Faculty Pack

学生、教师和研究人员可以以低廉的价格使用预测分析软件。

Explore SPSS Statistics Grad Pack 和 Faculty Pack 免费试用 SPSS Statistic
IBM Cognos® Analytics

这种经验证的自助服务分析解决方案可帮助您混合和匹配数据并创建引人注目的可视化效果。

深入了解 Cognos Software
资源 IBM Knowledge Center 中的线性回归详细信息 免费教程中的线性回归简单示例 如何使用线性回归建立汽车销售模型 方法选择变量回归模型 关于线性回归集规则 线性回归统计 线性回归图 线性回归变量选择方法 保存新变量、预测值、残差和其他统计数据