¿Qué es la regresión lineal?

El análisis de regresión lineal se utiliza para prever el valor de una variable con base en el valor de otra variable. La variable que desea prever se denomina variable dependiente. La variable que está utilizando para prever el valor de la otra variable se denomina variable independiente.

Esta forma de análisis estima los coeficientes de la ecuación lineal, involucrando a una o más variables independientes que prevén mejor el valor de la variable dependiente. La regresión lineal se ajusta a una línea recta o a una superficie que minimiza las discrepancias entre los valores de salida previstos y reales. Hay calculadoras de regresión lineal simples que utilizan un método de "mínimos cuadrados" para descubrir la línea que mejor se ajuste a un conjunto de datos emparejados. A continuación, puede calcular el valor de X (variable dependiente) a partir de Y (variable independiente).

Ejemplo de diagrama de dispersión de regresión lineal

Genere previsiones con más facilidad

Puede realizar la regresión lineal en Microsoft Excel o utilizar paquetes de software estadísticos como IBM SPSS® Stadistics que simplifican en gran medida el proceso de utilización de ecuaciones de regresión lineal, modelos de regresión lineal y fórmulas de regresión lineal. SPSS Statistics se puede aplicar en técnicas como la regresión lineal simple y la regresión lineal múltiple.

Puede realizar el método de regresión lineal en una variedad de programas y entornos, incluyendo:

  • Regresión lineal de R
  • Regresión lineal de MATLAB
  • Regresión lineal de Sklearn
  • Regresión lineal de Python
  • Regresión lineal de Excel

¿Por qué es importante la regresión lineal?

Los modelos de regresión lineal son relativamente simples y proporcionan una fórmula matemática fácil de interpretar que permite generar previsiones. La regresión lineal se puede aplicar a varias áreas en el estudio académico y de negocio.

Descubrirá que la regresión lineal se utiliza en todo, desde las ciencias biológicas, conductuales, ambientales y sociales hasta en el ámbito empresarial. Los modelos de regresión lineal se han convertido en un método demostrado para prever el futuro científicamente de forma fiable. Como la regresión lineal es un procedimiento estadístico consolidado, las propiedades de los modelos de regresión lineal son fáciles de comprender y se pueden entrenar rápidamente.

Un método demostrado para prever el futuro científicamente de forma fiable

Los líderes empresariales pueden mejorar la toma de decisiones aplicando técnicas de regresión lineal. Las organizaciones recopilan grandes cantidades de datos, y la regresión lineal les ayuda a utilizar estos datos para gestionar mejor la realidad, en lugar de depender de la experiencia y la intuición. Puede absorber grandes cantidades de datos sin procesar y transformarlos en información práctica.

También puede utilizar la regresión lineal para obtener mejores conocimientos mediante el descubrimiento de patrones y relaciones que sus colegas de negocio pueden haber visto previamente y creído que ya los habían comprendido. Por ejemplo, realizar un análisis de los datos de ventas y compras puede ayudarle a descubrir patrones de compra específicos en días determinados o en determinados momentos. La información de valor recopilada del análisis de regresión puede ayudar a los líderes de negocio a anticipar picos de demanda de los productos de su empresa.

→ Más información sobre la regresión lineal en IBM Knowledge Center

Las principales suposiciones de una regresión lineal efectiva

Suposiciones que se deben tener en cuenta para un correcto análisis de regresión lineal:

  • Para cada variable: Considere el número de casos válidos, la media y la desviación estándar. 
  • Para cada modelo: Tenga en cuenta los coeficientes de regresión, la matriz de correlación, las correlaciones parciales y semi-parciales, múltiple R, R2, R2 ajustado, cambio en R2, error estándar de la estimación, tabla de análisis de varianza, valores previstos y residuales. Además, considere los intervalos de confianza del 95 por ciento para cada coeficiente de regresión, matriz de covarianza-varianza, factor de inflación de varianza, tolerancia, prueba de Durbin-Watson, medidas de distancia (Mahalanobis, Cook y valores de influencia), DfBeta, DfFit, intervalos de predicción e información de diagnóstico por casos. 
  • Gráficos: Considere diagramas de dispersión, gráficos parciales, histogramas y gráficos de probabilidad normal.
  • Datos: Las variables dependientes e independientes deben ser cuantitativas. Las variables categóricas, tales como la religión, el campo principal del estudio o la región de residencia, deben ser recodificadas a variables binarias (ficticias) u otros tipos de variables de contraste.  
  • Otros supuestos: Para cada valor de la variable independiente, la distribución de la variable dependiente debe ser normal. La varianza de la distribución de la variable dependiente debe ser constante para todos los valores de la variable independiente. La relación entre la variable dependiente y cada variable independiente debe ser lineal y todas las observaciones deben ser independientes.

Asegúrese de que los datos cumplen los supuestos de regresión lineal

Antes de intentar realizar la regresión lineal, debe asegurarse de que los datos se pueden analizar utilizando este procedimiento. Sus datos deben pasar a través de ciertos supuestos necesarios.

Mediante el siguiente método podrá comprobar estos supuestos:

  1. Las variables deben medirse a un nivel continuo. Ejemplos de variables continuas son el tiempo, las ventas, el peso y las puntuaciones de prueba. 
  2. Utilice un diagrama de dispersión para averiguar rápidamente si hay una relación lineal entre estas dos variables.
  3. Las observaciones deben ser independientes entre sí (es decir, no debe haber dependencia).
  4. Los datos no deberían tener valores atípicos significativos. 
  5. Comprobar la homocedasticidad — un concepto estadístico en el que las varianzas a lo largo de la línea de regresión lineal más adecuada siguen siendo similares en toda esa línea.
  6. Los residuales (errores) de la línea de regresión más adecuada siguen la distribución normal.

→ Utilice este tutorial práctico para obtener más información sobre las hipótesis de datos de regresión lineal (enlace externo a IBM)

Ejemplos de éxito de regresión lineal

Evaluación de tendencias y estimaciones de ventas

También puede utilizar el análisis de regresión lineal para intentar prever el total de ventas anuales de un vendedor (la variable dependiente) a partir de variables independientes como la edad, la educación y los años de experiencia.

Análisis de la elasticidad de los precios

Los cambios en los precios a menudo afectan al comportamiento del consumidor - y la regresión lineal puede ayudarle a analizar cómo. Por ejemplo, si el precio de un producto en particular sigue cambiando, se puede utilizar el análisis de regresión para ver si el consumo disminuye a medida que aumenta el precio. ¿Qué pasa si el consumo no se reduce significativamente a medida que aumenta el precio? ¿En qué punto de precio los compradores dejan de comprar el producto? Esta información sería de gran ayuda para los líderes de un negocio minorista.

Evaluación de los riesgos en una compañía de seguros

Las técnicas de regresión lineal se pueden utilizar para analizar riesgos. Por ejemplo, una compañía de seguros podría tener recursos limitados con los que investigar las reclamaciones de seguros de los propietarios; con la regresión lineal, el equipo de la compañía puede crear un modelo para calcular los costes de las reclamaciones. El análisis podría ayudar a los líderes de las empresas a tomar decisiones de negocio importantes acerca de los riesgos que se pueden tomar.

Análisis deportivo

La regresión lineal no siempre gira en torno al negocio. También es importante en los deportes. Por ejemplo, es posible que se pregunte si el número de partidos ganados por un equipo de baloncesto en una temporada está relacionado con el promedio de puntos que el equipo anota por partido. Un diagrama de dispersión indica que estas variables están relacionadas linealmente. El número de partidos ganados y el promedio de puntos anotados por el oponente también están relacionados linealmente. Estas variables tienen una relación negativa. A medida que el número de partidos ganados aumenta, el promedio de puntos anotados por el oponente disminuye. Con la regresión lineal, puede modelar la relación de estas variables. Un buen modelo se puede utilizar para prever cuántos partidos ganarán los equipos.

Productos de regresión lineal

Software IBM SPSS Statistics

Impulse la investigación y el análisis con esta solución rápida y potente.

IBM SPSS Statistics Grad Pack y Faculty Packs

Estudiantes, profesores e investigadores obtienen acceso asequible al software de analítica predictiva.

IBM Cognos® Statistics

Esta solución de analítica de autoservicio demostrada le permite combinar y comparar sus datos y crear visualizaciones atractivas.