¿Qué es la regresión lineal?

Antelope Canyon, Arizona, Estados Unidos

¿Qué es la regresión lineal?

El análisis de regresión lineal es una técnica de analisis de datos que se utiliza para predecir el valor de una variable en función del valor de otra variable. La variable que desea predecir se llama dependiente. La variable que está utilizando para predecir el valor de la otra variable se llama independiente.

Esta forma de análisis estima los coeficientes de la ecuación lineal, involucrando una o más variables independientes que predicen mejor el valor de la variable dependiente. La regresión lineal se ajusta a una línea recta o superficie que minimiza las discrepancias entre los valores de salida previstos y reales.

Existen calculadoras de regresión lineal simples que utilizan un método de "mínimos cuadrados" para descubrir la línea de mejor ajuste para un conjunto de datos pareados. Luego, estime el valor de X (variable dependiente) a partir de Y (variable independiente).

Diseño 3D de pelotas rodando en una pista

Las últimas novedades e insights sobre IA

Descubra insights y noticias de expertos sobre IA, la nube y mucho más en el boletín semanal Think. 

Genere predicciones fácilmente

Puede realizar regresión lineal en Microsoft Excel o utilizar paquetes de software estadístico, como IBM SPSS Statistics que simplifican enormemente el proceso de uso de ecuaciones de regresión lineal, modelos de regresión lineal y fórmula de regresión lineal. SPSS Statistics puede aprovecharse en técnicas como la regresión lineal simple y la regresión lineal múltiple.

Puede realizar el método de regresión lineal en una variedad de programas y entornos, entre ellos:

  • Regresión lineal R
  • Regresión lineal MATLAB
  • Regresión lineal Sklearn
  • Regresión lineal Python
  • Regresión lineal de Excel
Mixture of Experts | 28 de agosto, episodio 70

Decodificación de la IA: Resumen semanal de noticias

Únase a nuestro panel de ingenieros, investigadores, responsables de producto y otros profesionales de talla mundial que se abren paso entre el revuelo de la IA para ofrecerle las últimas noticias e insights al respecto.

La importancia de la regresión lineal

Los modelos de regresión lineal son relativamente simples y proporcionan una fórmula matemática fácil de interpretar que puede generar predicciones. La regresión lineal se puede aplicar a varias áreas de los estudios empresariales y académicos.

Descubrirá que la regresión lineal se utiliza en todo, desde ciencias biológicas, conductuales, ambientales y sociales hasta negocios. Los modelos de regresión lineal se han convertido en una forma comprobada de predecir el futuro de manera científica y confiable. Debido a que la regresión lineal es un procedimiento estadístico establecido desde hace mucho tiempo, las propiedades de los modelos de regresión lineal se entienden bien y se pueden entrenar muy rápido.

Predecir el futuro de forma científica y confiable

Los líderes empresariales y organizacionales pueden tomar mejores decisiones mediante el uso de técnicas de regresión lineal. Las organizaciones recopilan grandes cantidades de datos y la regresión lineal les ayuda a utilizar esos datos para gestionar mejor la realidad, en lugar de depender de la experiencia y la intuición. Puede tomar grandes cantidades de datos sin procesar y transformarlos en información procesable.

También puede utilizar la regresión lineal para proporcionar mejores insights al descubrir patrones y relaciones que sus colegas de negocios podrían haber visto anteriormente y pensado que ya entendían. Por ejemplo, realizar un análisis de los datos de ventas y compras puede ayudarle a descubrir patrones de compra específicos en determinados días o momentos. Los insights recopilados a partir del análisis de regresión puede ayudar a los líderes empresariales a anticipar los momentos en que los productos de su empresa tendrán una gran demanda.

Supuestos clave de la regresión lineal

Supuestos a considerar para tener éxito con el análisis de regresión lineal:

  • Para cada variable: considere el número de casos válidos, la media y la desviación estándar. 
  • Para cada modelo: considere coeficientes de regresión, matriz de correlación, correlaciones de partes y parciales, R múltiple, R2, R2 ajustado, cambio en R2, error estándar de la estimación, tabla de análisis de varianza, valores predichos y residuales. Además, considere intervalos de confianza del 95 por ciento para cada coeficiente de regresión, matriz de varianza-covarianza, factor de inflación de varianza, tolerancia, prueba de Durbin-Watson, medidas de distancia (Mahalanobis, Cook y valores de apalancamiento), DfBeta, DfFit, intervalos de predicción e información de diagnóstico según el caso. 
  • Gráficos: considere gráficos de dispersión, gráficos parciales, histogramas y gráficos de probabilidad normales.
  • Datos: las variables dependientes e independientes deben ser cuantitativas. Las variables categóricas, como la religión, el campo de estudio principal o la región de residencia, deben recodificarse como variables binarias (ficticias) u otros tipos de variables de contraste.
  • Otros supuestos: para cada valor de la variable independiente, la distribución de la variable dependiente debe ser normal. La varianza de la distribución de la variable dependiente debe ser constante para todos los valores de la variable independiente. La relación entre la variable dependiente y cada variable independiente debe ser lineal, y todas las observaciones deben ser independientes.

Sus datos deben cumplir con los supuestos de regresión lineal

Antes de intentar realizar una regresión lineal, debe asegurarse de que sus datos se puedan analizar mediante este procedimiento. Sus datos deben pasar por ciertos supuestos obligatorios: 

  1. Las variables deben medirse a un nivel continuo. Ejemplos de variables continuas son el tiempo, las ventas, el peso y los puntajes de las pruebas. 
  2. Utilice un diagrama de dispersión para averiguar rápidamente si existe una relación lineal entre esas dos variables.
  3. Las observaciones deben ser independientes entre sí (es decir, no debe haber dependencia).
  4. Sus datos no deben tener valores atípicos significativos. 
  5. Compruebe la homocedasticidad, un concepto estadístico en el que las varianzas a lo largo de la línea de regresión lineal de mejor ajuste siguen siendo similares en toda la línea.
  6. Los residuales (errores) de la línea de regresión de mejor ajuste siguen la distribución normal.

Ejemplos de regresión lineal

Evaluación de tendencias y estimaciones de ventas

También puede usar el análisis de regresión lineal para intentar predecir las ventas anuales totales de un vendedor (la variable dependiente) a partir de variables independientes, como la edad, la educación y los años de experiencia.

Analizar la elasticidad de los precios

Los cambios en los precios a menudo afectan el comportamiento del consumidor, y la regresión lineal puede ayudarle a analizar cómo.

Por ejemplo, si el precio de un producto en particular sigue cambiando, puede usar el análisis de regresión para ver si el consumo cae a medida que aumenta el precio. ¿Qué pasa si el consumo no cae significativamente a medida que aumenta el precio? ¿A qué precio dejan de comprar el producto los compradores? Esta información sería muy útil para los líderes de un negocio minorista.

Evaluar el riesgo en una compañía

Para analizar el riesgo, pueden utilizarse técnicas de regresión lineal. Por ejemplo, una compañía de seguros puede tener recursos limitados para investigar las reclamaciones de seguros de los propietarios de viviendas; con la regresión lineal, el equipo de la compañía puede construir un modelo para estimar los costos de las reclamaciones.

El análisis podría ayudar a los directivos de las empresas a tomar importantes decisiones comerciales sobre qué riesgos asumir.

Análisis deportivo

La regresión lineal no siempre tiene que ver con los negocios. También es importante en el deporte. Por ejemplo, podría preguntarse si el número de partidos ganados por un equipo de baloncesto en una temporada está relacionado con el promedio de puntos que el equipo anota por partido.

Un diagrama de dispersión indica que estas variables están relacionadas linealmente. El número de partidos ganados y el promedio de puntos anotados por el adversario también están relacionados linealmente. Estas variables tienen una relación negativa. A medida que aumenta el número de juegos ganados, disminuye el promedio de puntos anotados por el oponente. Con la regresión lineal, puede modelar la relación de estas variables. Un buen modelo puede utilizarse para predecir cuántos partidos ganarán los equipos.

Soluciones relacionadas
IBM watsonx.ai

Entrene, valide, ajuste y despliegue IA generativa, modelos fundacionales y capacidades de machine learning con IBM watsonx.ai, un estudio empresarial de próxima generación para creadores de IA. Diseñe aplicaciones de IA en menos tiempo y con menos datos.

Descubra watsonx.ai
Soluciones de inteligencia artificial

Ponga la IA a trabajar en su negocio con la experiencia en IA líder en la industria y la cartera de soluciones de IBM a su lado.

Explore las soluciones de IA
Consultoría y servicios de IA

Reinvente los flujos de trabajo y las operaciones críticas añadiendo IA para maximizar las experiencias, la toma de decisiones en tiempo real y el valor empresarial.

Conozca los servicios de IA
Dé el siguiente paso

Obtenga acceso único a capacidades que abarcan el ciclo de vida del desarrollo de IA. Produzca potentes soluciones de IA con interfaces fáciles de usar, flujos de trabajo y acceso a API y SDK estándar de la industria.

Explore watsonx.ai Reserve una demostración en vivo