Selección de un procedimiento para la regresión logística binaria

Los modelos de regresión logística binaria se pueden ajustar mediante el procedimiento de regresión logística y el procedimiento de regresión logística multinomial. Cada uno de estos dos procedimientos contiene opciones que no están disponibles en el otro. Existe entre ambos una distinción teórica importante: el procedimiento de Regresión logística genera todas las predicciones, residuos, estadísticos de influencia y pruebas de bondad de ajuste utilizando los datos a nivel de los casos individuales, independientemente de la forma en que los datos hayan sido introducidos y de si el número de patrones en las covariables es o no menor que el número total de casos; el procedimiento de Regresión logística multinomial, por su parte, agrega los casos de manera interna para formar subpoblaciones con patrones en las covariables idénticos para las variables predictoras, generando predicciones, residuos y pruebas de bondad de ajuste basadas en las citadas subpoblaciones. Si todas las variables predictoras son categóricas, o si alguna variable predictora continua toma sólo un número limitado de valores (de manera que haya varios casos para cada patrón en las covariables), la aproximación mediante subpoblaciones puede generar pruebas de bondad de ajuste válidas y residuos que sean informativos, mientras que el método a nivel de los casos individuales no lo permite.

Regresión logística
Proporciona las características exclusivas siguientes:
  • Prueba de bondad de ajuste del modelo de Hosmer-Lemeshow
  • Análisis por pasos
  • Contrastes para definir la parametrización del modelo
  • Puntos de corte alternativos para la clasificación
  • Gráficos de clasificación
  • Aplicación de un modelo ajustado mediante un conjunto de casos sobre otro conjunto de casos reservados
  • Almacenamiento de predicciones, residuos y estadísticos de influencia
Regresión logística multinomial
Proporciona las características exclusivas siguientes:
  • Pruebas chi-cuadrado de Pearson y de desvianza sobre la bondad de ajuste del modelo
  • Especificación de subpoblaciones para el agrupamiento de los datos, para las pruebas de bondad de ajuste
  • Listado de las frecuencias, frecuencias pronosticadas y residuos por subpoblaciones
  • Corrección de las estimaciones de la varianza por sobredispersión
  • Matriz de covarianzas para las estimaciones de los parámetros
  • Contrastes sobre combinaciones lineales de los parámetros
  • Especificación explícita de modelos anidados
  • Ajuste de modelos de regresión logística condicional con emparejamiento 1-1 usando variables diferenciadas
Notas:
  • Ambos de estos procedimientos ajustan un modelo para datos binarios que es un modelo lineal generalizado con una distribución binomial y la función de enlace logit. Si una función de enlace diferente es más apropiada para sus datos, deberá utilizar el procedimiento de modelos lineales generalizados.
  • Si tiene mediciones repetidas de datos binarios, o registros que están correlacionados de otra forma, deberá tener en cuenta los procedimientos de modelos mixtos lineales generalizados o ecuaciones de estimación generalizadas.