Regresión lineal

La regresión lineal estima los coeficientes de la ecuación lineal, con una o más variables independientes, que mejor prediga el valor de la variable dependiente. Por ejemplo, puede intentar predecir el total de ventas anuales de un vendedor (la variable dependiente) a partir de variables independientes tales como la edad, la formación y los años de experiencia.

Ejemplo. ¿Están relacionados el número de partidos ganados por un equipo de baloncesto en una temporada con la media de puntos que el equipo marca por partido? Un diagrama de dispersión indica que estas variables están relacionadas linealmente. El número de partidos ganados y la media de puntos marcados por el equipo adversario también están relacionados linealmente. Estas variables tienen una relación negativa. A medida que el número de partidos ganados aumenta, la media de puntos marcados por el equipo adversario disminuye. Con la regresión lineal es posible modelar la relación entre estas variables. Puede utilizarse un buen modelo para predecir cuántos partidos ganarán los equipos.

Estadísticas. Para cada variable: número de casos válidos, media y desviación estándar. Para cada modelo: coeficientes de regresión, matriz de correlaciones, correlaciones parciales y semiparciales, R múltiple, R cuadrado, R cuadrado corregida, cambio en R cuadrado, error estándar de la estimación, tabla de análisis de varianza, valores pronosticados y residuos. Además, intervalos de confianza al 95% para cada coeficiente de regresión, matriz de varianzas-covarianzas, factor de inflación de la varianza, tolerancia, prueba de Durbin-Watson, medidas de distancia (Mahalanobis, Cook y valores de influencia), DfBeta, DfFit, intervalos de predicción e información de diagnóstico por caso. Gráficos: diagramas de dispersión, gráficos parciales, histogramas y gráficos de probabilidad normal.

Regresión lineal: Consideraciones sobre los datos

datos. Las variables dependiente e independientes deben ser cuantitativas. Las variables categóricas, como la religión, estudios principales o el lugar de residencia, han de recodificarse como variables binarias (dummy) o como otros tipos de variables de contraste.

Supuestos. Para cada valor de la variable independiente, la distribución de la variable dependiente debe ser normal. La varianza de distribución de la variable dependiente debe ser constante para todos los valores de la variable independiente. La relación entre la variable dependiente y cada variable independiente debe ser lineal y todas las observaciones deben ser independientes.

Para obtener un análisis de regresión lineal

Esta característica requiere la opción Statistics Base.

  1. En los menús seleccione:

    Analizar > Regresión > Lineal ...

  2. En el cuadro de diálogo Regresión lineal, seleccione una variable numérica dependiente.
  3. Seleccione una más variables numéricas independientes.

Si lo desea, puede:

  • Agrupar variables independientes en bloques y especificar distintos métodos de entrada para diferentes subconjuntos de variables.
  • Elegir una variable de selección para limitar el análisis a un subconjunto de casos que tengan valores particulares para esta variable.
  • Seleccionar una variable de identificación de casos para identificar los puntos en los diagramas.
  • Seleccione una variable numérica de Ponderación MCP para el análisis de mínimos cuadrados ponderados.

WLS. Permite obtener un modelo de mínimos cuadrados ponderados. Los puntos de los datos se ponderan por los inversos de sus varianzas. Esto significa que las observaciones con varianzas grandes tienen menor impacto en el análisis que las observaciones asociadas a varianzas pequeñas. Si el valor de la variable de ponderación es cero, negativo o perdido, el caso queda excluido del análisis.

Este procedimiento pega la sintaxis del comando REGRESSION .