¿Qué es la regresión lineal?
Genere predicciones utilizando una fórmula matemática fácil de interpretar
Descubra SPSS Statistics
Ilustración que muestra la relación entre tendencias, análisis de datos y predicción en la regresión lineal
¿Qué es la regresión lineal?

El análisis de regresión lineal se utiliza para predecir el valor de una variable basándose en el valor de otra variable. La variable que desea predecir se denomina variable dependiente. La variable que está utilizando para predecir el valor de la otra variable se denomina variable independiente.

Esta forma de análisis estima los coeficientes de la ecuación lineal, involucrando una o más variables independientes que mejor predicen el valor de la variable dependiente. La regresión lineal se ajusta a una línea recta o superficie que minimiza las discrepancias entre los valores de salida predichos y reales. Hay calculadoras de regresión lineal simples que utilizan un método de "mínimos cuadrados" para descubrir la línea de mejor ajuste para un conjunto de datos emparejados. A continuación, estime el valor de X (variable dependiente) de Y (variable independiente).

SPSS Statistics para regresión lineal

IBM® SPSS Statistics le permite calcular el impacto de un grupo de puntos de datos en un resultado concreto y modelar relaciones lineales y no lineales.

Genera predicciones más fácilmente

Puede realizar regresión lineal en Microsoft Excel o utilizar paquetes de software estadístico como IBM® SPSS Statistics que simplifiquen enormemente el proceso de utilizar ecuaciones de regresión lineal, modelos de regresión lineal y fórmula de regresión lineal. SPSS Statistics se pueden aprovechar en técnicas como la regresión lineal simple y la regresión lineal múltiple.

Puede realizar el método de regresión lineal en una variedad de programas y entornos, entre ellos:

  • Regresión lineal R
  • Regresión lineal MATLAB
  • Regresión lineal Sklearn
  • Regresión lineal Python
  • Regresión lineal de Excel
¿Por qué es importante la regresión lineal?

Los modelos de regresión lineal son relativamente simples y proporcionan una fórmula matemática fácil de interpretar que puede generar predicciones. La regresión lineal se puede aplicar a varias áreas de los estudios empresariales y académicos.

Descubrirá que la regresión lineal se utiliza en todo, desde ciencias biológicas, conductuales, ambientales y sociales hasta negocios. Los modelos de regresión lineal se han convertido en una forma probada de predecir el futuro de forma científica y fiable. Debido a que la regresión lineal es un procedimiento estadístico establecido desde hace mucho tiempo, las propiedades de los modelos de regresión lineal se comprenden bien y se pueden entrenar muy rápidamente.

Una forma probada de predecir el futuro de forma científica y fiable

Los líderes empresariales y organizativos pueden tomar mejores decisiones al utilizar técnicas de regresión lineal. Las organizaciones recopilan grandes cantidades de datos y la regresión lineal les ayuda a utilizar esos datos para gestionar mejor la realidad, en lugar de confiar en la experiencia y la intuición. Puede tomar grandes cantidades de datos sin procesar y transformarlos en información procesable.

También puede utilizar la regresión lineal para proporcionar una mejor información al descubrir patrones y relaciones que sus colegas empresariales podrían haber visto anteriormente y creer que ya entendieron. Por ejemplo, realizar un análisis de los datos de ventas y compras puede ayudarlo a descubrir patrones de compra específicos en días particulares o en ciertos momentos. La información recopilada del análisis de regresión puede ayudar a los líderes empresariales a anticipar tiempos en los que los productos de su empresa estarán en alta demanda.

Más información sobre la regresión lineal en IBM Knowledge Center
Supuestos clave de la regresión lineal efectiva

Supuestos que deben tenerse en cuenta para el éxito del análisis de regresión lineal:

  • Para cada variable: considere el número de casos válidos, la media y la desviación estándar. 
  • Para cada modelo: considere coeficientes de regresión, matriz de correlación, correlaciones parciales y de piezas, múltiples R, R2, R2 ajustado, cambio en R2, error estándar de la estimación, tabla de análisis de varianza, valores predichos y residuales. Además, considere los intervalos de confianza del 95 por ciento para cada coeficiente de regresión, la matriz de varianza-covarianza, el factor de inflación de la varianza, la tolerancia, la prueba de Durbin-Watson, las medidas de distancia (valores de Mahalanobis, Cook y apalancamiento), DfBeta, DfFit, los intervalos de predicción y la información diagnóstica de casos por caso. 
  • Gráficos: considere gráficos de dispersión, gráficos parciales, histogramas y gráficos de probabilidad normales.
  • Datos: las variables dependientes e independientes deben ser cuantitativas. Las variables categóricas, como la religión, el campo de estudio principal o la región de residencia, deben recodificarse en variables binarias (ficticias) u otros tipos de variables de contraste.  
  • Otras suposiciones: para cada valor de la variable independiente, la distribución de la variable dependiente debe ser normal. La varianza de la distribución de la variable dependiente debe ser constante para todos los valores de la variable independiente. La relación entre la variable dependiente y cada variable independiente debe ser lineal y todas las observaciones deben ser independientes.
Pruebe SPSS Statistics de manera gratuita
Asegúrese de que sus datos cumplen las suposiciones de regresión lineal

Antes de intentar realizar una regresión lineal, debe asegurarse de que los datos se pueden analizar mediante este procedimiento. Sus datos deben cumplir con ciertos supuestos obligatorios.

A continuación le indicamos cómo comprobar estas suposiciones:

  1. Las variables deben medirse en un nivel continuo. Ejemplos de variables continuas son el tiempo, las ventas, el peso y las puntuaciones de los exámenes. 
  2. Utilice un diagrama de dispersión para averiguar rápidamente si hay una relación lineal entre esas dos variables.
  3. Las observaciones deben ser independientes entre sí (es decir, no debe haber dependencia).
  4. Sus datos no deben tener valores atípicos significativos. 
  5. Compruebe la homocedasticidad, un concepto estadístico en el que las varianzas a lo largo de la línea de regresión lineal de mejor ajuste siguen siendo similares en toda la línea.
  6. Los residuales (errores) de la línea de regresión de mejor ajuste siguen la distribución normal.
Utilice este tutorial práctico para obtener más información sobre las suposiciones de datos de regresión lineal
Ejemplos de éxito de regresión lineal
Evaluación de tendencias y estimaciones de ventas.

También puede usar el análisis de regresión lineal para intentar predecir las ventas anuales totales de un vendedor (la variable dependiente) a partir de variables independientes como la edad, la educación y los años de experiencia.

Analizar la elasticidad de los precios

Los cambios en los precios a menudo afectan al comportamiento del consumidor, y la regresión lineal puede ayudarle a analizar cómo. Por ejemplo, si el precio de un producto en particular sigue cambiando, puede utilizar el análisis de regresión para ver si el consumo disminuye a medida que aumenta el precio. ¿Qué pasa si el consumo no cae significativamente a medida que aumenta el precio? ¿A qué precio dejan los compradores de comprar el producto? Esta información sería muy útil para los líderes de un negocio minorista.

Evaluar el riesgo en una compañía de seguros

Las técnicas de regresión lineal se pueden utilizar para analizar el riesgo. Por ejemplo, una compañía de seguros podría tener recursos limitados para investigar las reclamaciones de seguros de los propietarios de viviendas; con la regresión lineal, el equipo de la empresa puede crear un modelo para estimar los costes de las reclamaciones. El análisis podría ayudar a los líderes de la empresa a tomar decisiones empresariales importantes sobre qué riesgos tomar.

Análisis deportivo

La regresión lineal no siempre tiene que ver con negocios. También es importante para los deportes. Por ejemplo, puede que se pregunte si el número de partidos ganados por un equipo de baloncesto en una temporada está relacionado con la media de puntos que anota el equipo por partido. Un diagrama de dispersión indica que estas variables están relacionadas linealmente. El número de partidas ganadas y el número promedio de puntos obtenidos por el oponente también están relacionados linealmente. Estas variables tienen una relación negativa. A medida que aumenta el número de partidas, disminuye el número promedio de puntos obtenidos por el oponente. Con la regresión lineal, puede modelar la relación de estas variables. Se puede utilizar un buen modelo para predecir cuántos juegos ganarán los equipos.

Soluciones relacionadas
Software IBM® SPSS Statistics

Impulse la investigación y el análisis con esta solución rápida y potente.

Explorar SPSS Statistics
IBM SPSS Statistics GradPack y Faculty Packs

Los estudiantes, profesores e investigadores obtienen un acceso asequible al software de análisis predictivo.

Explore SPSS Statistics GradPack y Faculty Packs Pruebe SPSS Statistics de manera gratuita
IBM Cognos® Analytics

Esta solución de análisis de autoservicio probada le permite combinar sus datos y crear visualizaciones atractivas.

Explore el software de Cognos
Recursos Los detalles de la regresión lineal en IBM Knowledge Center Un ejemplo sencillo de regresión lineal en un tutorial gratuito Cómo utilizar la regresión lineal para modelar las ventas de vehículos Modelos de regresión de variables de selección de métodos Acerca de la regla de conjunto de regresión lineal Estadísticas de regresión lineal Gráficos de regresión lineal Métodos de selección variable de regresión lineal Guardar nuevas variables, valores predichos, residuales y otras estadísticas