¿Qué es la regresión lineal?

¿Qué es la regresión lineal?

La regresión lineal es una técnica de análisis utilizada para predecir el valor de una variable dependiente basada en el valor de una o más variables independientes. La variable que desea predecir se denomina variable dependiente. La variable que está utilizando para predecir el valor de la otra variable se denomina variable independiente.

Esta forma de análisis estima los coeficientes de la ecuación lineal, involucrando una o más variables independientes que mejor predicen el valor de la variable dependiente. La regresión lineal se ajusta a una línea recta o superficie que minimiza las discrepancias entre los valores de salida predichos y reales. Hay calculadoras de regresión lineal simples que utilizan un método de "mínimos cuadrados" para descubrir la línea de mejor ajuste para un conjunto de datos emparejados. A continuación, estime el valor de X (variable dependiente) de Y (variable independiente).

Diseño 3D de bolas rodando por un circuito

Las últimas noticias + conocimientos de IA 


Descubra ideas y noticias de expertos sobre IA, nube y mucho más en el boletín semanal Think. 

Genera predicciones más fácilmente

Puede realizar la regresión lineal en Microsoft Excel o utilizar paquetes de software estadístico como IBM SPSS Statistics que simplifiquen enormemente el proceso de utilizar ecuaciones de regresión lineal, modelos de regresión lineal y fórmulas de regresión lineal. SPSS Statistics puede aprovecharse en técnicas como la regresión lineal simple y la regresión lineal múltiple.

Puede realizar el método de regresión lineal en una variedad de programas y entornos, entre ellos:

  • Regresión lineal R.
  • Regresión lineal MATLAB.
  • Regresión lineal Sklearn.
  • Regresión lineal Python.
  • Regresión lineal de Excel.
Mixture of Experts | Pódcast

Descifrar la IA: resumen semanal de noticias

Únase a nuestro panel de ingenieros, investigadores, responsables de producto y otros profesionales de talla mundial que se abren paso entre el bullicio de la IA para ofrecerle las últimas noticias y conocimientos al respecto.

¿Por qué es importante la regresión lineal?

Los modelos de regresión lineal son relativamente simples y proporcionan una fórmula matemática fácil de interpretar que puede generar predicciones. La regresión lineal se puede aplicar a varias áreas de los estudios empresariales y académicos.

Descubrirá que la regresión lineal se utiliza en todos los campos, desde las ciencias biológicas, conductuales, ambientales y sociales hasta en el mundo empresarial. Los modelos de regresión lineal se han convertido en un método probado de predecir el futuro de forma científica y fiable. Debido a que la regresión lineal es un procedimiento estadístico establecido desde hace mucho tiempo, las propiedades de los modelos de regresión lineal se comprenden bien y se pueden entrenar muy rápidamente.

Un método probado de predecir el futuro de forma científica y fiable

Los líderes empresariales y organizativos pueden tomar mejores decisiones al utilizar técnicas de regresión lineal. Las organizaciones recopilan grandes cantidades de datos y la regresión lineal les ayuda a utilizar esos datos para gestionar mejor la realidad, en lugar de confiar en la experiencia y la intuición. Puede tomar grandes cantidades de datos sin procesar y transformarlos en información procesable.

También puede utilizar la regresión lineal para proporcionar una mejor información al descubrir patrones y relaciones que sus colegas empresariales podrían haber visto anteriormente y creer que ya entendieron. Por ejemplo, realizar un análisis de los datos de ventas y compras puede ayudarlo a descubrir patrones de compra específicos en días particulares o en ciertos momentos. La información recopilada del análisis de regresión puede ayudar a los líderes empresariales a anticiparse a los momentos en que los productos de su empresa tendrán una mayor demanda.

Supuestos clave de la regresión lineal efectiva

Supuestos que deben tenerse en cuenta para el éxito del análisis de regresión lineal:

  • Para cada variable: considere el número de casos válidos, la media y la desviación estándar. 
  • Para cada modelo: considere coeficientes de regresión, matriz de correlación, correlaciones parciales y de piezas, múltiples R, R2, R2 ajustado, cambio en R2, error estándar de la estimación, tabla de análisis de varianza, valores predichos y residuales. Además, considere los intervalos de confianza del 95 % para cada coeficiente de regresión, la matriz de varianza-covarianza, el factor de inflación de la varianza, la tolerancia, la prueba de Durbin-Watson, las medidas de distancia (valores de Mahalanobis, Cook y apalancamiento), DfBeta, DfFit, los intervalos de predicción y la información diagnóstica por caso. 
  • Gráficos: considere gráficos de dispersión, gráficos parciales, histogramas y gráficos de probabilidad normales.
  • Datos: las variables dependientes e independientes deben ser cuantitativas. Las variables categóricas, como la religión, el campo de estudio principal o la región de residencia, deben recodificarse en variables binarias (dummy) o en otras variables de contraste.
  • Otras suposiciones: para cada valor de la variable independiente, la distribución de la variable dependiente debe ser normal. La varianza de la distribución de la variable dependiente debe ser constante para todos los valores de la variable independiente. La relación entre la variable dependiente y cada variable independiente debe ser lineal y todas las observaciones deben ser independientes.

Asegúrese de que sus datos cumplen las suposiciones de regresión lineal

Antes de intentar realizar una regresión lineal, debe asegurarse de que los datos se pueden analizar mediante este procedimiento. Sus datos deben cumplir con ciertos supuestos obligatorios.

A continuación le indicamos cómo comprobar estas suposiciones:

  1. Las variables deben medirse en un nivel continuo. Ejemplos de variables continuas son el tiempo, las ventas, el peso y las puntuaciones de los exámenes. 
  2. Utilice un diagrama de dispersión para averiguar rápidamente si hay una relación lineal entre esas dos variables.
  3. Las observaciones deben ser independientes entre sí (es decir, no debe haber dependencia).
  4. Sus datos no deben tener valores atípicos significativos. 
  5. Compruebe la homocedasticidad, un concepto estadístico en el que las varianzas a lo largo de la línea de regresión lineal de mejor ajuste siguen siendo similares en toda la línea.
  6. Los residuales (errores) de la línea de regresión de mejor ajuste siguen la distribución normal.

Ejemplos de éxito de regresión lineal

Evaluación de tendencias y estimaciones de ventas.

También puede usar el análisis de regresión lineal para intentar predecir las ventas anuales totales de un vendedor (la variable dependiente) a partir de variables independientes como la edad, la educación y los años de experiencia.

Analizar la elasticidad de los precios

Los cambios en los precios a menudo afectan al comportamiento del consumidor, y la regresión lineal puede ayudarle a analizar cómo. Por ejemplo, si el precio de un producto en particular sigue cambiando, puede utilizar el análisis de regresión para ver si el consumo disminuye a medida que aumenta el precio. ¿Qué pasa si el consumo no cae significativamente a medida que aumenta el precio? ¿A qué precio dejan los compradores de comprar el producto? Esta información sería muy útil para los líderes de un negocio minorista.

Evaluar el riesgo en una compañía de seguros

Las técnicas de regresión lineal se pueden utilizar para analizar el riesgo. Por ejemplo, una compañía de seguros podría tener recursos limitados para investigar las reclamaciones de seguros de los propietarios de viviendas; con la regresión lineal, el equipo de la empresa puede crear un modelo para estimar los costes de las reclamaciones. El análisis podría ayudar a los líderes de la empresa a tomar decisiones empresariales importantes sobre qué riesgos tomar.

Análisis deportivo

La regresión lineal no siempre tiene que ver con los negocios. También es importante para los deportes. Por ejemplo, puede que se pregunte si el número de partidos ganados por un equipo de baloncesto en una temporada está relacionado con la media de puntos que anota el equipo por partido. Un diagrama de dispersión indica que estas variables están relacionadas linealmente. El número de partidos ganados y el número promedio de puntos obtenidos por el oponente también están relacionados linealmente. Estas variables tienen una relación negativa. A medida que aumenta el número de partidos ganados, disminuye el número promedio de puntos obtenidos por el oponente. Con la regresión lineal, puede modelar la relación de estas variables. Se puede utilizar un buen modelo para predecir cuántos partidos ganarán los equipos.

Soluciones relacionadas
IBM watsonx.ai

Entrene, valide, ajuste e implemente IA generativa, modelos fundacionales y capacidades de machine learning con IBM watsonx.ai, un estudio empresarial de nueva generación para desarrolladores de IA. Cree aplicaciones de IA en menos tiempo y con menos datos.

Descubra watsonx.ai
Soluciones de inteligencia artificial

Ponga la IA a trabajar en su negocio con la experiencia líder en IA del sector de IBM y junto a su cartera de soluciones.

Explore las soluciones de IA
Consultoría y servicios de IA

Reinvente las operaciones y flujos de trabajo críticos añadiendo IA para maximizar las experiencias, la toma de decisiones en tiempo real y el valor empresarial.

Explore los servicios de IA
Dé el siguiente paso

Obtenga acceso único a capacidades que abarcan el ciclo de vida de desarrollo de la IA. Produzca potentes soluciones de IA con interfaces intuitivas, flujos de trabajo y acceso a API y SDK estándar del sector.

Explore watsonx.ai Solicite una demostración en directo