¿Qué es la regresión lineal?

El análisis de la regresión lineal se utiliza para predecir el valor de una variable según el valor de otra. La variable que desea predecir se denomina la variable dependiente. La variable que está utilizando para predecir el valor de la otra variable se denomina la variable independiente.

Esta forma de análisis estima los coeficientes de la ecuación lineal, involucrando a una o a más variables independientes que mejor predicen el valor de la variable dependiente. La regresión lineal se ajusta a una línea recta o a una superficie que minimiza las discrepancias entre los valores de salida previstos y reales. Hay calculadoras de regresión lineal simples que utilizan el método de "mínimos cuadrados" para descubrir la línea que mejor se ajusta para un conjunto de datos pareados. A continuación, se calcula el valor de X (variable dependiente) con respecto a Y (variable independiente).

Ejemplo de gráfico de dispersión de regresión lineal

Genere predicciones con más facilidad

Es posible realizar la regresión lineal en Microsoft Excel o utilizar paquetes de software estadísticos como IBM SPSS® Statistics que simplifican enormemente el proceso de la utilización de ecuaciones de regresión lineal, modelos de regresión lineal y la fórmula de regresión lineal. SPSS Statistics se puede utilizar para aplicar técnicas como la regresión lineal simple y la regresión lineal múltiple.

El método de regresión lineal se puede realizar en múltiples programas y entornos, entre ellos:

  • Regresión lineal R
  • Regresión lineal de MATLAB
  • Regresión lineal de Sklearn
  • Regresión lineal de Python
  • Regresión lineal de Excel

¿Por qué la regresión lineal es importante?

Los modelos de regresión lineal son relativamente simples y proporcionan una fórmula matemática fácil de interpretar que puede generar predicciones. La regresión lineal se puede aplicar a varias áreas de la empresa y de los estudios académicos.

Descubrirá que la regresión lineal se utiliza en todo, desde las ciencias biológicas, conductuales, ambientales y sociales hasta en los negocios. Los modelos de regresión lineal se han convertido en una forma comprobada de predecir el futuro de forma científica y confiable. Como la regresión lineal es un procedimiento estadístico establecido hace mucho tiempo, las propiedades de sus modelos son bien conocidas y se pueden enseñar muy rápidamente.

Una forma comprobada de predecir el futuro de forma científica y confiable

Los líderes empresariales y de las organizaciones pueden tomar mejores decisiones con las técnicas de regresión lineal. Las organizaciones recopilan enormes cantidades de datos, y la regresión lineal las ayuda a utilizar esos datos para gestionar mejor la realidad, en lugar de depender de la experiencia y la intuición. Es posible tomar grandes cantidades de datos sin procesar y transformarlos en información procesable.

La regresión lineal también se puede utilizar para proporcionar mejores insights mediante el descubrimiento de patrones y relaciones que sus colegas de la empresa ya pueden haber visto previamente y pensado que ya habían entendido. Por ejemplo, la realización del análisis de los datos de ventas y compras puede ayudarle a descubrir patrones de compra específicos para días o momentos determinados. Los insights que se recopilan de los análisis de regresión pueden ayudar a que los líderes empresariales anticipen los momentos en los que los productos de su empresa tendrán una demanda alta.

Principales hipótesis de la regresión lineal efectiva

Hipótesis que se deben tener en cuenta para tener éxito con el análisis de la regresión lineal:

  • Para cada variable: Considere el número de casos válidos, la media y la desviación estándar. 
  • Para cada modelo: Tenga en cuenta los coeficientes de regresión, la matriz de correlación, las correlaciones parciales y semi-parciales, múltiple R, R2, R2 ajustado, cambio en R2, error estándar de la estimación, tabla de análisis de varianza, valores previstos y residuales. Además, considere intervalos de 95 por ciento de confianza para cada coeficiente de regresión, matriz de varianza-covarianza, factor de inflación de la varianza, tolerancia, prueba de Durbin-Watson, medidas de distancia (Mahalanobis, Cook y valores de apalancamiento), DfBeta, DfFit, intervalos de predicción e información de diagnóstico sobre cada caso. 
  • Gráficas: Considere los diagramas de dispersión, los gráficos parciales, los histogramas y las gráficas de probabilidad normal.
  • Datos: Las variables dependientes e independientes deben ser cuantitativas. Las variables categóricas, como la religión, el campo principal del estudio o la región de residencia, se deben recodificar para ser variables binarias (ficticias) u otros tipos de variables de contraste.  
  • Otras hipótesis: Para cada valor de la variable independiente, la distribución de la variable dependiente debe ser normal. La varianza de la distribución de la variable dependiente debe ser constante para todos los valores de la variable independiente. La relación entre la variable dependiente y cada variable independiente debe ser lineal, además, todas las observaciones deben ser independientes.

Asegúrese de que los datos cumplen las hipótesis de la regresión lineal

Antes de que intente realizar la regresión lineal, debe asegurarse de que los datos se pueden analizar utilizando este procedimiento. Sus datos deben pasar por determinadas hipótesis necesarias.

Así se pueden comprobar estas hipótesis:

  1. Las variables se deben medir a un nivel continuo. Ejemplos de variables continuas son el tiempo, las ventas, el peso y las puntuaciones de las pruebas. 
  2. Utilice un diagrama de dispersión para averiguar rápidamente si hay una relación lineal entre estas dos variables.
  3. Las observaciones deben ser independientes entre sí (es decir, no debe haber ninguna dependencia).
  4. Los datos no deberían tener valores atípicos significativos. 
  5. Comprobar la homocedasticidad, un concepto estadístico en el que las varianzas de la línea de regresión lineal de mejor ajuste siguen siendo similares a lo largo de toda esa línea.
  6. Los residuales (errores) de la línea de regresión de mejor ajuste siguen la forma de una distribución normal.

Cómo evaluar las tendencias y las estimaciones de ventas

Usted también puede utilizar el análisis de la regresión lineal para tratar de predecir las ventas anuales totales de un vendedor (la variable dependiente) a partir de variables independientes como la edad, la educación y años de experiencia.

Analice la elasticidad de los precios

Los cambios en los precios a menudo afectan al comportamiento del consumidor, y la regresión lineal puede ayudarle a analizar cómo lo hacen. Por ejemplo, si el precio de un producto específico sigue cambiando, el análisis de regresión se puede utilizar para ver si el consumo disminuye a medida que aumenta el precio. ¿Qué pasa si el consumo no se reduce significativamente a medida que aumenta el precio? ¿En qué precio los compradores dejan de comprar el producto? Esta información sería de gran ayuda para los líderes de los comercios minoristas.

Evalúe el riesgo de una compañía de seguros

Las técnicas de regresión lineal se pueden utilizar para analizar el riesgo. Por ejemplo, una compañía de seguros podría tener pocos recursos con los que investigar las reclamaciones de seguros de los propietarios de viviendas; con la regresión lineal, el equipo de la compañía puede construir un modelo para calcular los costos de las reclamaciones. El análisis podría ayudar a que los líderes de las empresas tomasen decisiones empresariales importantes acerca de los riesgos que se pueden tomar.

Análisis deportivo

La regresión lineal no solo se utiliza para los negocios. También es importante en el mundo de los deportes. Por ejemplo, es posible que se pregunte si el número de partidos ganados por un equipo de baloncesto en una temporada está relacionado con el número medio de puntos que el equipo anota por partido. Un diagrama de dispersión indica que estas variables están relacionadas linealmente. El número de partidos ganados y el número medio de puntos anotados por el oponente también están relacionados linealmente. Estas variables están relacionadas de forma negativa. Cuando el número de partidos ganados aumenta, el número medio de puntos anotados por el oponente disminuye. Con la regresión lineal, es posible crear modelos de la relación entre estas variables. Un buen modelo se puede utilizar para predecir cuántos partidos ganarán los equipos.

Productos de la regresión lineal

Software IBM SPSS Statistics

Impulse la investigación y el análisis con esta solución rápida y potente.

IBM SPSS Statistics Grad Pack y Faculty Packs

Los estudiantes, profesores e investigadores obtienen un acceso accesible al software de analítica predictiva.

IBM Cognos Statistics

Esta solución comprobada de analítica de autoservicio le permite mezclar y comparar sus datos y crear visualizaciones convincentes.