什么是线性回归?

美国,亚利桑那州,羚羊峡谷

什么是线性回归?

线性回归是一种用于预测数值型结果的基础统计建模技术。线性回归通过建立自变量与因变量之间的线性关系,帮助企业对关键业务指标进行建模和趋势预测,是现代机器学习商业分析中的常见方法之一。

 

这种形式的分析估算的是线性方程的系数,涉及一个或多个最能预测因变量值的自变量。线性回归拟合出一条直线或曲面,使预测值与实际输出值之间的差异最小。有一些简单的线性回归计算器使用“最小二乘法”为一组配对数据找出最佳拟合线。然后,您可以根据 Y(自变量)估算出 X(因变量)的值。

小球在轨道上滚动的三维设计

最新的 AI 新闻 + 洞察分析

在每周的 Think 时事通讯中,发现专家精选的有关 AI、云等的洞察分析和新闻。 

使用线性回归更轻松地生成预测结果

您可以在 Microsoft Excel 中进行线性回归,也可以使用诸如 IBM® SPSS Statistics 之类的统计软件包,这些软件包极大地简化了使用线性回归方程、线性回归模型和线性回归公式的过程。SPSS Statistics 可用于简单线性回归和多元线性回归等技术。

您可以在各种程序和环境中执行线性回归方法,包括:

  • R 线性回归。
  • MATLAB 线性回归。
  • Sklearn 线性回归。
  • 线性回归 Python。
  • Excel 线性回归。
Mixture of Experts | 8 月 28 日,第 70 集

解码 AI:每周新闻摘要

加入我们世界级的专家小组——工程师、研究人员、产品负责人等将为您甄别 AI 领域的真知灼见,带来最新的 AI 资讯与深度解析。

线性回归为什么很重要

线性回归模型相对简单,并提供易于理解的数学公式,可以生成预测结果。线性回归可以应用于商业和学术研究的各个领域。

您会发现线性回归广泛应用于从生物、行为、环境和社会科学到商业的各个领域。线性回归模型已成为科学可靠地预测未来的可靠方法。由于线性回归是一种历史悠久的统计过程,因此线性回归模型的属性已广为人知,并且可以非常快速地进行训练。

线性回归:科学可靠的预测未来的方法

业务和组织领导者可以通过使用线性回归技术做出更好的决策。组织收集大量数据,线性回归可以帮助他们利用这些数据更好地管理现实,而不是依赖经验和直觉。您可以获取大量原始数据,并将其转化为可操作的信息。

您还可以使用线性回归来揭示业务同事以前可能已经看到并自以为已经理解的模式和关系,从而提供更好的洞察分析。例如,对销售和购买数据进行分析可以帮助您发现特定日期或特定时间的特定购买模式。从回归分析中获得的洞察分析可以帮助企业领导者预测公司产品需求旺盛的时期。

有效线性回归的关键假设

线性回归分析成功需要考虑的假设:

  • 针对每个变量:考虑有效案例的数量、平均值和标准差。
  • 针对每个模型:考虑回归系数、相关矩阵、部分和局部相关性、多重 R、R2、调整 R2、R2 变化、估计值的标准误差、方差分析表、预测值和残差。此外,还要考虑每个回归系数的 95% 置信区间、方差-协方差矩阵、方差膨胀因子、容差、Durbin-Watson 检验、距离测量(Mahalanobis、Cook 和杠杆值)、DfBeta、DfFit、预测区间和个案诊断信息。
  • 绘图:考虑散点图、局部图、直方图和正态概率图。
  • 数据:因变量和自变量应该为定量。类别变量,例如宗教、主要研究领域或居住地区,需要重新编码为二元(虚拟)变量或其他类型的对比变量。
  • 其他假设:对于自变量的每个值,因变量必须是正态分布。对于所有自变量值,因变量分布的方差应保持不变。因变量和每个自变量之间的关系应该是线性的,并且所有观察结果应该是独立的。

确保您的数据符合线性回归假设

在尝试进行线性回归之前,您需要确保可以使用线性回归程序分析您的数据。您的数据必须通过某些必要的假设。

以下是检查这些线性回归假设的方法:

  1. 变量应在连续水平上进行测量。连续变量的示例包括时间、销售额、体重和测试分数。
  2. 使用散点图可以快速确定这两个变量之间是否存在线性关系。
  3. 这些观测值应该相互独立(也就是不应存在依赖关系)。
  4. 您的数据不应有明显的异常值。
  5. 检查同方差性 - 一种统计概念,其中最佳拟合线性回归线上的方差在整条线上都保持相似。
  6. 最佳拟合回归线的残差(误差)呈正态分布。

线性回归成功示例

评估趋势和销售估算值

您还可以使用线性回归分析法,尝试根据年龄、教育程度和工作年限等自变量来预测销售人员的年销售总额(因变量)。

分析定价弹性

定价变化通常会影响消费者行为 - 线性回归可以帮助您分析影响方式。例如,如果特定产品的价格不断变化,您可以使用回归分析来查看消费是否随着价格上涨而下降。如果消费没有随着价格上涨而大幅下降呢?买家在什么价位停止购买产品?这些信息对于零售企业的领导者非常有帮助。

评估保险公司的风险

线性回归技术可用于分析风险。例如,一家保险公司用于调查房主保险索赔的资源可能有限;利用线性回归,该公司的团队可以建立一个模型来估算索赔成本。这项分析可以帮助公司领导者做出重要的商业决策,决定应该承担哪些风险。

运动分析

线性回归并不总是与商业有关。这在体育运动中也很重要。例如,您可能想知道篮球队在一个赛季中获胜的比赛场数是否与球队每场比赛的平均得分有关。散点图表示这些变量是线性相关的。获胜场数和对手的平均得分也呈线性关系。这些变量存在负相关关系。随着获胜场数增加,对手的平均得分会减少。通过线性回归,您可以对这些变量之间的关系进行建模。优秀的模型可以用来预测球队会赢多少场比赛。

相关解决方案
IBM watsonx.ai

使用面向 AI 构建器的新一代企业级开发平台 IBM watsonx.ai,可以训练、验证、调整和部署生成式 AI、基础模型和机器学习功能。使用一小部分数据,即可在很短的时间内构建 AI 应用程序。

了解 watsonx.ai
人工智能 (AI) 解决方案

借助 IBM 业界领先的人工智能专业知识和解决方案组合,让人工智能在您的业务中发挥作用。

深入了解 AI 解决方案
AI 咨询与服务

通过增加 AI 重塑关键工作流程和运营,最大限度提升体验、实时决策和商业价值。

深入了解人工智能服务
采取后续步骤

一站式访问跨越 AI 开发生命周期的功能。利用用户友好型界面、工作流并访问行业标准 API 和 SDK,生成功能强大的 AI 解决方案。

深入了解 watsonx.ai 预约实时演示