Subcomando METHOD (comando TREE)
El submandato METHOD especifica el método de crecimiento y los parámetros opcionales. Cada palabra clave va seguida de un signo igual (=) y el valor de dicha palabra clave.
Ejemplo
TREE risk [o] BY income age creditscore
/METHOD TYPE=CRT MAXSURROGATES=2 PRUNE=SE(0).
Palabra clave TYPE
TYPE especifica el método de crecimiento. Para CRT y QUEST, las divisiones son siempre binarias. CHAID y CHAID exhaustivo permiten divisiones multidireccional.
CHAID. Detección automática de interacciones mediante chi-cuadrado (CHi-square Automatic Interaction Detection). En cada paso, CHAID elige la variable independiente (predictora) que presenta la interacción más fuerte con la variable dependiente. Las categorías de cada predictor se fusionan si no son significativamente diferentes con respecto a la variable dependiente. Éste es el método predeterminado.
EXHAUSTIVECHAID. CHAID exhaustivo. Modificación de CHAID que examina todas las formas posibles de fusionar categorías de predictores.
CRT. Árboles de clasificación y regresión. CRT divide los datos en segmentos para que sean lo más homogéneos que sea posible respecto a la variable dependiente.
PRUEBA. Árbol estadístico rápido, insesgado y eficiente (Quick, Unbiased, Efficient Statistical Tree). Método rápido y que evita el sesgo que presentan otros métodos al favorecer los predictores con muchas categorías. QUEST sólo se puede especificar si la variable dependiente es nominal. Se produce un error si la variable dependiente es ordinal o de escala.
Palabra clave MAXSUPLGATES
CRT y QUEST pueden utilizar sustitutos para variables independientes (predictoras). Para los casos en los que falta el valor de ese predictor, se utilizan para la clasificación otros predictores que tienen asociaciones altas con el predictor original. A estas variables predictoras alternativas se les denomina sustitutos. La palabra clave MAXSURROGATES especifica el número máximo de predictores suplentes a calcular.
Si el método de crecimiento es CHAID o EXHAUSTIVECHAID, esta palabra clave se ignora y se emite un aviso.
Automático. El máximo es el número de variables independientes menos uno. Este es el valor predeterminado.
valor. Valor especificado por el usuario. El valor debe ser un entero no negativo que sea menor que el número de variables independientes en el modelo. Si no desea utilizar sustitutos en el modelo, especifique MAXSURROGATES=0. Si el valor es igual o mayor que el número de variables independientes, el valor se ignora y se emite un aviso.
Palabra clave PRUNE
Para CRT y QUEST, el árbol se puede podar automáticamente. La poda puede ayudar a evitar crear un árbol que sobreajuste los datos. Si solicita la poda, el árbol se cultiva hasta que se cumplen los criterios de detención. A continuación, se recorta automáticamente de acuerdo con el criterio especificado.
Si el método de crecimiento es CHAID o EXHAUSTIVECHAID, PRUNE se ignora y se emite un aviso.
none. El árbol no se poda. Este es el valor predeterminado.
SE (valor). Podar árbol utilizando el criterio de error estándar. El procedimiento se poda hasta el subárbol más pequeño con un valor de riesgo dentro de un número especificado de errores estándar del subárbol con el riesgo mínimo. Puede especificar el número de errores estándar entre paréntesis. El valor predeterminado es 1. El valor debe ser no negativo. Para obtener el subárbol con el mínimo riesgo, especifique 0.