Regresión lineal: almacenamiento de variables nuevas

Puede guardar los valores pronosticados, los residuos y otros estadísticos útiles para la información de diagnóstico. Cada selección añade una o más variables nuevas a su archivo de datos activo.

Valores pronosticados. Son los valores que el modelo de regresión pronostica para cada caso.

  • No tipificados. Valor predicho por el modelo para la variable dependiente.
  • Tipificados. Transformación de cada valor predicho a su forma estandarizada. Es decir, se sustrae el valor predicho medio al valor predicho y el resultado se divide por la desviación estándar de los valores pronosticados. Los valores pronosticados estandarizados tienen una media de 0 y una desviación estándar de 1.
  • Corregidos. Valor predicho para un caso cuando dicho caso no se incluye en los cálculos de los coeficientes de regresión.
  • Error estándar de predicciones de media. Error estándar de los valores pronosticados. Estimación de la desviación estándar del valor promedio de la variable dependiente para los casos que tengan los mismos valores en las variables independientes.

Distancias. Son medidas para identificar casos con combinaciones poco usuales de valores para las variables independientes y casos que puedan tener un gran impacto en el modelo.

  • Mahalanobis. Medida de cuánto difieren del promedio para todos los casos los valores en las variables independientes de un caso dado. Una distancia de Mahalanobis grande identifica un caso que tenga valores extremos en una o más de las variables independientes.
  • De Cook. Una medida de cuánto cambiarían los residuos de todos los casos si un caso particular se excluyera del cálculo de los coeficientes de regresión. Una Distancia de Cook grande indica que la exclusión de ese caso del cálculo de los estadísticos de regresión hará variar substancialmente los coeficientes.
  • Valores de influencia. Mide la influencia de un punto en el ajuste de la regresión. Influencia centrada varía entre 0 (no influye en el ajuste) a (N-1)/N.

Intervalos de predicción. Los límites superior e inferior para los intervalos de predicción individual y promedio.

  • Media. Límites inferior y superior (dos variables) para el intervalo de predicción de la respuesta pronosticada promedio.
  • Individual. Límites superior e inferior (dos variables) del intervalo de predicción para la variable dependiente para un caso individual.
  • Intervalo de confianza. Introduzca un valor entre 1 y 99,99 para especificar el nivel de confianza para los dos intervalos de predicción. Debe seleccionar Media o Individuos antes de introducir este valor. Los valores habituales de los intervalos de confianza son 90, 95 y 99.

Residuos. El valor actual de la variable dependiente menos el valor predicho por la ecuación de regresión.

  • No tipificados. Diferencia entre un valor observado y el valor predicho por el modelo.
  • Tipificados. El residuo dividido por una estimación de su error estándar. Los residuos estandarizados, que son conocidos también como los residuos de Pearson o residuos estandarizados, tienen una media de 0 y una desviación estándar de 1.
  • Estudentizado. Residuo dividido por una estimación de su desviación estándar que varía de caso en caso, dependiendo de la distancia de los valores de cada caso en las variables independientes respecto a las medias en las variables independientes. A veces se hace referencia a ellos como residuos estudentizados internamente.
  • Suprimido. Residuo para un caso cuando éste se excluye del cálculo de los coeficientes de la regresión. Es igual a la diferencia entre el valor de la variable dependiente y el valor predicho corregido.
  • Eliminados estudentizados. Residuo eliminado para un caso dividido por su error estándar. La diferencia entre un residuo eliminado estudentizado y su residuo estudentizado asociado indica cuánta diferencia supone eliminar un caso en su propia predicción. A veces se hace referencia a ellos como residuos estudentizados externamente.

Estadísticos de influencia. El cambio en los coeficientes de regresión (DfBeta) y en los valores pronosticados (DfAjuste) que resulta de la exclusión de un caso particular. También están disponibles los valores tipificados para las DfBeta y para las DfAjuste, junto con la razón entre covarianzas.

  • DfBetas. La diferencia en el valor de beta es el cambio en el valor de un coeficiente de regresión que resulta de la exclusión de un caso particular. Se calcula un valor para cada término del modelo, incluyendo la constante.
  • Estandarizado DfBeta. Valor de la diferencia en beta estandarizada. El cambio en un coeficiente de regresión cuando se elimina del análisis un caso particular. Puede interesarle examinar aquellos casos cuyos valores absolutos sean mayores que 2 dividido por la raíz cuadrada de N, donde N es el número de casos. Se calcula un valor para cada término del modelo, incluyendo la constante.
  • DfFit. La diferencia en el valor ajustado es el cambio en el valor predicho que resulta de la exclusión de un caso particular.
  • Tipificado DfFit. Diferencia estandarizada en el valor ajustado. El cambio en el valor predicho que resulta de la exclusión de un caso particular. Puede interesarle examinar aquellos valores estandarizados cuyo valor absoluto sea mayor que 2 dividido por la raíz cuadrada de p/N, donde p es el número de variables independientes en la ecuación y N es el número de casos.
  • Razón entre covarianzas. Razón del determinante de la matriz de covarianza con un caso particular excluido del cálculo de los coeficientes de regresión, respecto al determinante de la matriz de covarianza con todos los casos incluidos. Si la razón se aproxima a 1, el caso no altera significativamente la matriz de covarianza.

Estadísticos de los coeficientes. Almacena los coeficientes de regresión en un conjunto de datos o en un archivo de datos. Los conjuntos de datos están disponibles para su uso posterior durante la misma sesión, pero no se guardarán como archivos a menos que se hayan guardado explícitamente antes de que finalice la sesión. El nombre de un conjunto de datos debe cumplir las normas de denominación de variables. Consulte el tema Nombres de variables para obtener más información.

Exportar información del modelo a un archivo XML. Las estimaciones de los parámetros y (si lo desea) sus covarianzas se exportan al archivo especificado en formato XML (PMML). Puede utilizar este archivo de modelo para aplicar la información del modelo a otros archivos de datos para puntuarlo. Consulte el tema Asistente de puntuación para obtener más información.

Para guardar nuevas variables en una regresión lineal

Esta característica requiere la opción Statistics Base.

  1. En los menús seleccione:

    Analizar > Regresión > Lineal ...

  2. En el cuadro de diálogo Regresión lineal, pulse Guardar.
  3. Seleccione los valores o estadísticos que desee.