Regresión ordinal

El procedimiento Regresión ordinal (al que se hace referencia como PLUM en la sintaxis) le permite crear modelos, generar predicciones y evaluar la importancia de diversas variables predictoras en los casos en los que la variable dependiente (objetivo) es de naturaleza ordinal.

Para obtener más información, vaya a Base Edition > Características principales > Regresión ordinal

Dependientes ordinales y regresión lineal. Cuando intenta predecir respuestas ordinales, los modelos de regresión lineal habituales no funcionan muy bien. Estos métodos sólo pueden funcionar suponiendo que la variable de resultado (dependiente) se mida en una escala de intervalo. Debido a que esto no es cierto para las variables de resultados ordinales, los supuestos simplificadores en los que se basa la regresión lineal no se satisfacen y, por lo tanto, el modelo de regresión puede no reflejar con precisión las relaciones en los datos. En concreto, la regresión lineal es sensible a la forma en que se definen las categorías de la variable objetivo. Con una variable ordinal, lo importante es el orden de las categorías. Por lo tanto, si contrae dos categorías adyacentes en una categoría más grande, sólo está realizando un pequeño cambio, y los modelos creados utilizando las categorizaciones antigua y nueva deben ser muy similares. Desafortunadamente, debido a que la regresión lineal es sensible a la categorización utilizada, un modelo creado antes de fusionar categorías podría ser muy diferente de uno construido después.

Generalized Linear Models. Un enfoque alternativo utiliza una generalización de regresión lineal denominada modelo lineal generalizado para predecir probabilidades acumuladas para las categorías. Con este método, se ajusta una ecuación separada para cada categoría de la variable dependiente ordinal. Cada ecuación da una probabilidad pronosticada de estar en la categoría correspondiente o cualquier categoría inferior.

Tabla 1. Distribución hipotética de dependiente ordinal
Categoría	Probabilidad de pertenencia	Probabilidad acumulada
Actual	0.80	0.80
30 días vencidos	0.07	0.87
60 días vencidos	0.07	0.94
90 días de vencimiento	0.05	0.99
No recopilable	0.01	1.00

Por ejemplo, mire la distribución que se muestra en la tabla. Sin predictores en el modelo, las predicciones se basan sólo en las probabilidades globales de estar en cada categoría. La probabilidad acumulada pronosticada para la primera categoría es 0.80. La predicción para la segunda categoría es 0.80+0.07=0.87. La predicción para el tercero es 0.80+0.07+0.07=0.94, y así sucesivamente. La predicción para la última categoría es siempre 1.0, ya que todos los casos deben estar en la última categoría o en una categoría inferior. Debido a esto, la ecuación de predicción para la última categoría no es necesaria.