¿Qué es la regresión lineal?
El análisis de la regresión lineal se utiliza para predecir el valor de una variable según el valor de otra. La variable que desea predecir se denomina variable dependiente. La variable que está utilizando para predecir el valor de la otra variable se denomina variable independiente.
Esta forma de análisis estima los coeficientes de la ecuación lineal, involucrando una o a más variables independientes que mejor predicen el valor de la variable dependiente. La regresión lineal se ajusta a una línea recta o a una superficie que minimiza las discrepancias entre los valores de salida previstos y reales. Hay calculadoras de regresión lineal simple que utilizan el método de “mínimos cuadrados” para determinar la línea que mejor se ajusta para un conjunto de datos pareados. A continuación, se calcula el valor de X (variable dependiente) con respecto a Y (variable independiente).

Genere predicciones con más facilidad
Es posible realizar la regresión lineal en Microsoft Excel o utilizar paquetes de software estadísticos, como IBM SPSS® Statistics, que simplifican enormemente el proceso de ecuaciones, modelos y la fórmula de regresión lineal. SPSS Statistics puede utilizarse para aplicar técnicas, como la regresión lineal simple y la regresión lineal múltiple.
El método de regresión lineal puede realizarse en múltiples programas y entornos, tales como:
- Regresión lineal R
- Regresión lineal de MATLAB
- Regresión lineal de Sklearn
- Regresión lineal de Python
- Regresión lineal de Excel
¿Por qué es importante la regresión lineal?
Los modelos de regresión lineal son relativamente sencillos y proporcionan una fórmula matemática fácil de interpretar que puede generar predicciones. La regresión lineal puede aplicarse a varias áreas de la empresa y de los estudios académicos.
Descubrirá que la regresión lineal se utiliza en todo, desde las ciencias biológicas, conductuales, ambientales y sociales hasta en los negocios. Los modelos de regresión lineal se han convertido en una forma comprobada de predecir el futuro de forma científica y confiable. Como la regresión lineal es un procedimiento estadístico establecido hace mucho tiempo, las propiedades de sus modelos de regresión lineal se conocen bien y pueden enseñarse muy rápido.
Una forma comprobada de predecir el futuro de forma científica y confiable
Los líderes de empresas y organizaciones pueden tomar mejores decisiones con técnicas de regresión lineal. Las organizaciones recopilan enormes cantidades de datos, y la regresión lineal les ayuda a utilizar esos datos para gestionar mejor la realidad, en lugar de depender de la experiencia y la intuición. Es posible tomar grandes cantidades de datos sin procesar y transformarlos en información accionable.
La regresión lineal también puede utilizarse para proporcionar mejores insights mediante el descubrimiento de patrones y relaciones que sus colegas ya pueden haber visto y pensado que habían entendido. Por ejemplo, el análisis de los datos de ventas y compras puede ayudarle a descubrir patrones de compra específicos para días o momentos determinados. Los insights que se recopilan de los análisis de regresión pueden ayudar a que los líderes de empresas anticipen los momentos en los cuales los productos tendrán una demanda alta.
Obtenga más información sobre la regresión lineal en IBM Knowledge Center
Principales hipótesis de la regresión lineal efectiva
Hipótesis que se deben tener en cuenta para tener éxito con el análisis de la regresión lineal:
- Para cada variable: Considere el número de casos válidos, la media y la desviación estándar.
- Para cada modelo: Tenga en cuenta los coeficientes de regresión, la matriz de correlación, las correlaciones parciales y semiparciales, múltiple R, R2, R2 ajustado, cambio en R2, error estándar de la estimación, tabla de análisis de varianza, valores previstos y residuales. Además, considere intervalos de confianza de 95 por ciento para cada coeficiente de regresión, matriz de varianza-covarianza, factor de inflación de la varianza, tolerancia, prueba de Durbin-Watson, medidas de distancia (Mahalanobis, Cook y valores de apalancamiento), DfBeta, DfFit, intervalos de predicción e información de diagnóstico sobre cada caso.
- Gráficos: Considere diagramas de dispersión, gráficos parciales y de probabilidad normal, e histogramas.
- Datos: Las variables dependientes e independientes deben ser cuantitativas. Las variables categóricas, como la religión, el campo principal del estudio o la región de residencia, deben volver a codificarse para ser variables binarias (ficticias) u otros tipos de variables de contraste.
- Otras hipótesis: Para cada valor de la variable independiente, la distribución de la variable dependiente debe ser normal. La varianza de la distribución de la variable dependiente debe ser constante para todos los valores de la variable independiente. La relación entre la variable dependiente y cada variable independiente debe ser lineal; además, todas las observaciones deben ser independientes.
Asegúrese de que los datos cumplen las hipótesis de la regresión lineal
Antes de que intente realizar la regresión lineal, debe asegurarse de que los datos pueden analizarse utilizando este procedimiento. Sus datos deben pasar por determinadas hipótesis necesarias.
Así pueden comprobarse estas hipótesis:
- Las variables deben medirse a un nivel continuo. Algunas variables continuas son el tiempo, las ventas, el peso y las puntuaciones de las pruebas.
- Utilice un diagrama de dispersión para determinar rápidamente si hay una relación lineal entre estas dos variables.
- Las observaciones deben ser independientes entre sí (es decir, no debe haber ninguna dependencia).
- Los datos no deberían tener valores atípicos significativos.
- Comprobar la homocedasticidad, un concepto estadístico en el que las varianzas de la línea de regresión lineal de mejor ajuste siguen siendo similares a lo largo de toda esa línea.
- Los residuales (errores) de la línea de regresión de mejor ajuste siguen el patrón de una distribución normal.
Casos de éxito de regresión lineal
Cómo evaluar las tendencias y las estimaciones de ventas
Usted también puede utilizar el análisis de la regresión lineal para tratar de predecir las ventas anuales totales (la variable dependiente) de un vendedor a partir de variables independientes, como edad, educación y años de experiencia.
Analice la elasticidad de los precios
Los cambios en los precios a menudo afectan el comportamiento del consumidor, y la regresión lineal puede ayudarle a analizar cómo lo hacen. Por ejemplo, si el precio de un producto específico sigue cambiando, el análisis de regresión puede utilizarse para ver si el consumo disminuye a medida que aumenta el precio. ¿Qué pasa si el consumo no se reduce significativamente a medida que aumenta el precio? ¿En qué punto de precio los compradores dejan de adquirir el producto? Esta información sería de gran ayuda para los líderes de los comercios minoristas.
Evalúe el riesgo de una compañía de seguros
Pueden utilizarse técnicas de regresión lineal para analizar el riesgo. Por ejemplo, una compañía de seguros podría tener pocos recursos con los que investigar las reclamaciones de seguros de los propietarios de viviendas; con la regresión lineal, el equipo de la compañía puede crear un modelo para calcular los costos de las reclamaciones. El análisis podría ayudar a que los líderes de las empresas tomen decisiones empresariales importantes acerca de los riesgos que pueden correrse.
Análisis deportivo
La regresión lineal no solo se utiliza para los negocios. También es importante en el mundo de los deportes. Por ejemplo, es posible que se pregunte si el número de partidos que gana un equipo de baloncesto en una temporada está relacionado con el número promedio de puntos que el equipo anota por partido. Un diagrama de dispersión indica que estas variables están relacionadas linealmente. El número de partidos ganados y el número promedio de puntos del oponente también están relacionados linealmente. Estas variables están relacionadas de forma negativa. Cuando el número de partidos ganados aumenta, el número promedio de puntos del oponente disminuye. Con la regresión lineal, es posible crear modelos de la relación entre estas variables. Puede utilizarse un buen modelo para predecir cuántos partidos ganarán los equipos.
Productos de regresión lineal
Software IBM SPSS Statistics
Impulse la investigación y el análisis con esta solución rápida y potente.
IBM SPSS Statistics Grad Pack y Faculty Packs
Los estudiantes, profesores e investigadores obtienen acceso por un precio módico al software de analítica predictiva.
IBM Cognos® Statistics
Esta solución comprobada de analítica de autoservicio permite combinar y comparar sus datos, y crear visualizaciones convincentes.