Regresión lineal

Genere predicciones con una fórmula matemática fácil de interpretar

Abstract line pattern.

¿Qué es la regresión lineal?

El análisis de regresión lineal se utiliza para predecir el valor de una variable según el valor de otra. La variable que desea predecir se denomina variable dependiente. La variable que está utilizando para predecir el valor de la otra variable se denomina variable independiente.

Esta forma de análisis estima los coeficientes de la ecuación lineal, involucrando una o a más variables independientes que predigan mejor el valor de la variable dependiente. La regresión lineal se ajusta a una línea recta o a una superficie que minimiza las discrepancias entre los valores de salida previstos y reales. Hay calculadoras de regresión lineal simple que utilizan el método de "mínimos cuadrados" para determinar la línea que mejor se ajusta para un conjunto de datos pareados. A continuación, se calcula el valor de X (variable dependiente) con respecto a Y (variable independiente).


Genere predicciones con mayor facilidad

Es posible realizar la regresión lineal en Microsoft Excel o utilizar paquetes de software estadísticos, como IBM SPSS® Statistics, que simplifican enormemente el proceso de ecuaciones, modelos y fórmulas de regresión lineal. SPSS Statistics puede utilizarse para aplicar técnicas como la regresión lineal simple y la regresión lineal múltiple.

Puede utilizar el método de regresión lineal  en una variedad de programas y entornos, incluyendo:

  • Regresión lineal en R
  • Regresión lineal en MATLAB
  • Regresión lineal en Sklearn
  • Regresión lineal en Python
  • Regresión lineal en Excel

¿Por qué es importante la regresión lineal?

Los modelos de regresión lineal son relativamente simples y proporcionan una fórmula matemática fácil de interpretar que puede generar predicciones. La regresión lineal puede aplicarse a varias áreas comerciales y académicas.

Descubrirá que la regresión lineal se utiliza en todo, desde las ciencias biológicas, conductuales, ambientales y sociales hasta en los negocios. Los modelos de regresión lineal se han convertido en una forma comprobada de predecir el futuro de forma científica y confiable. Como la regresión lineal es un procedimiento estadístico establecido hace mucho tiempo, las propiedades de sus modelos son bien conocidos y pueden entrenarse muy rápido.


Una forma comprobada de predecir el futuro de forma científica y confiable

Los líderes de empresas y organizaciones pueden tomar mejores decisiones con técnicas de regresión lineal. Las organizaciones recopilan enormes cantidades de datos, y la regresión lineal les ayuda a utilizar esos datos para gestionar mejor la realidad, en lugar de depender de la experiencia y la intuición. Es posible tomar grandes cantidades de datos brutos y transformarlos en información accionable.

La regresión lineal también puede utilizarse para proporcionar mejores insights mediante el descubrimiento de patrones y relaciones que sus colegas ya pueden haber visto y pensado que han entendido. Por ejemplo, el análisis de los datos de ventas y compras puede ayudarle a descubrir patrones de compra específicos para días o momentos determinados. Los insights que se recopilan de los análisis de regresión pueden ayudar a que los líderes de empresas anticipen los momentos en los cuales los productos tendrán alta demanda.


Principales hipótesis de la regresión lineal efectiva

Supuestos que se deben tener en cuenta para el éxito del análisis de regresión lineal:

  • Para cada variable: Considere el número de casos válidos, la media y la desviación estándar. 
  • Para cada modelo: Considere los coeficientes de regresión, la matriz de correlación, las correlaciones parciales y semiparciales, múltiple R, R2, R2 ajustado, cambio en R2, error estándar de la estimación, tabla de análisis de varianza, valores previstos y residuales. Además, considere intervalos de confianza de 95 % para cada coeficiente de regresión, matriz de varianza-covarianza, factor de inflación de la varianza, tolerancia, prueba de Durbin-Watson, medidas de distancia (Mahalanobis, Cook y valores de apalancamiento), DfBeta, DfFit, intervalos de predicción e información de diagnóstico sobre cada caso. 
  • Plots: Considere diagramas de dispersión, gráficos parciales, de probabilidad normal e histogramas.
  • Datos: Las variables dependientes e independientes deben ser cuantitativas. Las variables categóricas, como la religión, el campo principal del estudio o la región de residencia, deben volver a codificarse para ser variables binarias (ficticias) u otros tipos de variables de contraste.  
  • Otros supuestos: Para cada valor de la variable independiente, la distribución de la variable dependiente debe ser normal. La varianza de la distribución de la variable dependiente debe ser constante para todos los valores de la variable independiente. La relación entre la variable dependiente y cada variable independiente debe ser lineal; además, todas las observaciones deben ser independientes.

Asegúrese de que los datos cumplen las hipótesis de la regresión lineal

Antes de intentar realizar la regresión lineal, debe asegurarse de que los datos pueden analizarse utilizando este procedimiento. Sus datos deben pasar por determinadas hipótesis necesarias.

A continuación, le indicamos cómo puede verificar estas suposiciones:

  1. Las variables deben medirse a nivel continuo. Algunas variables continuas son el tiempo, las ventas, el peso y las puntuaciones de las pruebas. 
  2. Utilice un diagrama de dispersión para determinar rápidamente si hay una relación lineal entre estas dos variables.
  3. Las observaciones deben ser independientes entre sí (es decir, no debe haber ninguna dependencia).
  4. Los datos no deberían tener valores atípicos significativos. 
  5. Compruebe la homocedasticidad, un concepto estadístico en el que las varianzas de la línea de regresión lineal de mejor ajuste siguen siendo similares a lo largo de toda esa línea.
  6. Los residuales (errores) de la línea de regresión de mejor ajuste siguen el patrón de una distribución normal.

Casos de éxito de regresión lineal

Cómo evaluar las tendencias y las estimaciones de ventas

También puede utilizar el análisis de regresión lineal para intentar predecir las ventas anuales totales (la variable dependiente) de un vendedor a partir de variables independientes, como edad, educación y años de experiencia.

Analice la elasticidad de los precios

Los cambios en los precios a menudo afectan el comportamiento del consumidor, y la regresión lineal puede ayudarle a analizar cómo lo hacen. Por ejemplo, si el precio de un producto específico sigue cambiando, el análisis de regresión puede utilizarse para ver si el consumo disminuye a medida que aumenta el precio. ¿Qué pasa si el consumo no se reduce significativamente a medida que aumenta el precio? ¿En qué precio los compradores dejan de comprar el producto? Esta información sería de gran ayuda para los líderes de los comercios minoristas.

Evalúe el riesgo de una compañía de seguros

Pueden utilizarse técnicas de regresión lineal para analizar el riesgo. Por ejemplo, una compañía de seguros podría tener pocos recursos con los que investigar las reclamaciones de seguros de los propietarios de viviendas; con la regresión lineal, el equipo de la compañía puede crear un modelo para calcular los costos de las reclamaciones. El análisis podría ayudar a que los líderes de las empresas tomen decisiones empresariales importantes acerca de los riesgos que pueden correrse.

Análisis deportivo

La regresión lineal no solo se utiliza para los negocios. También es importante en el mundo de los deportes. Por ejemplo, es posible que se pregunte si el número de partidos que gana un equipo de baloncesto en una temporada está relacionado con el número promedio de puntos que el equipo anota por partido. Un diagrama de dispersión indica que estas variables están relacionadas linealmente. El número de partidos ganados y el número promedio de puntos del oponente también están relacionados linealmente. Estas variables están relacionadas de forma negativa. Cuando el número de partidos ganados aumenta, el número promedio de puntos del oponente disminuye. Con la regresión lineal, es posible crear modelos de la relación entre estas variables. Puede utilizarse un buen modelo para predecir cuántos partidos ganarán los equipos.


Soluciones relacionadas

Software IBM SPSS Statistics

Impulse la investigación y el análisis con esta solución rápida y potente.


IBM SPSS Statistics Grad Pack y Faculty Packs

Los estudiantes, profesores e investigadores obtienen acceso por un precio módico al software de analítica predictiva.


IBM Cognos Statistics

Esta solución comprobada de analítica de autoservicio permite combinar y comparar sus datos, y crear visualizaciones convincentes.