Generación de la ruta

Para crear una ruta que cree un modelo, necesitamos al menos tres elementos:
- Un nodo de origen que lea los datos de un origen externo, en este caso, un archivo de datos IBM® SPSS Statistics.
- Un nodo de origen o nodo Tipo que especifique propiedades de campo, como el nivel de medición (el tipo de datos que contiene el campo) y el rol de cada campo como objetivo o entrada en modelado.
- Un nodo de modelado que genera un nugget de modelo cuando se ejecuta la ruta.
En este ejemplo estamos usando un nodo de modelado CHAID. CHAID, o Detección automática de interacciones mediante chi-cuadrado, es un método de clasificación que genera árboles de decisión utilizando un tipo específico de estadísticos denominados estadísticos chi-cuadrado para determinar los mejores lugares para realizar las divisiones en el árbol de decisión.
Si se especifican niveles de medición en el nodo de origen, se puede eliminar el nodo Tipo independiente. Funcionalmente, el resultado es el mismo.
Esta ruta también tiene los nodos Tabla y Análisis que se utilizarán para ver los resultados de puntuación después de crear el nugget de modelo y añadirlo a la ruta.
El nodo de origen Archivo Statistics lee los datos en formato IBM SPSS Statistics del archivo de datos tree_credit.sav, que está instalado en la carpeta Demos. (Una variable especial denominada $CLEO_DEMOS se utiliza para hacer referencia a esta carpeta en la instalación actual de IBM SPSS Modeler. Esto garantiza que la ruta será válida independientemente de la carpeta o versión de la instalación actual.)

El nodo Tipo especifica el nivel de medición de cada campo. El nivel de medición es una categoría que indica el tipo de datos del campo. Nuestro archivo de datos de origen utiliza tres niveles de medición diferentes.
Un campo Continuo (como el campo Edad) contiene valores numéricos continuos, mientras que un campo Nominal (como el campo Valoración de crédito) tiene dos o más valores distintos, por ejemplo, Malo, Bueno o Sin historial de crédito. Un campo Ordinal (como el campo Nivel de ingresos) describe datos con varios valores distintos que tienen un orden inherente, en este caso Bajo, Medio y Alto.

Para cada campo, el nodo Tipo también especifica un rol para indicar el papel que desempeña cada campo en el modelado. El rol se define como Objetivo para el campo Valoración de crédito, que es el campo que indica si un cliente determinado ha causado mora en el pago del préstamo. Éste es el objetivo o campo cuyo valor queremos predecir.
El rol se define a Entrada para los otros campos. Los campos de entrada se conocen a menudo como predictores, o campos cuyos valores se utilizan en el algoritmo de modelado para predecir el valor del campo objetivo.
El nodo de modelado CHAID genera el modelo.
En la pestaña Campos del nodo de modelado está seleccionada la opción Utilizar los roles predefinidos, lo que significa que se utilizarán el objetivo y las entradas especificados en el nodo Tipo. En este punto podríamos cambiar los roles de campo, pero en este ejemplo los usaremos como están.
- Pulse en la pestaña Opciones de generación.
Figura 4. Nodo de modelado CHAID, pestaña Campos 
Aquí hay varias opciones en las que podemos especificar el tipo de modelo que queremos generar.
Si queremos un modelo totalmente nuevo usaremos la opción predeterminada Crear modelo nuevo.
También deseamos un único modelo de árbol de decisión estándar sin mejoras, por lo que dejaremos la opción de objetivo predeterminada Crear un árbol único.
Aunque también podemos iniciar una sesión de modelado interactivo que nos permite ajustar con precisión el modelo, este ejemplo simplemente genera un modelo utilizando la configuración de modo predeterminada Generar modelo.
Figura 5. Nodo de modelado CHAID, pestaña Opciones de generación 
Por ejemplo, queremos que el árbol sea bastante sencillo, así que limitaremos el crecimiento del árbol elevando el número mínimo de casos para los nodos padre e hijo.
- En la pestaña Opciones de generación, seleccione Reglas de parada desde el panel de navegación de la izquierda.
- Seleccione la opción Utilizar valor absoluto.
- Establezca Número mínimo de registros en rama padre como 400.
- Establezca Número mínimo de registros por rama hija como 200.

Podemos usar todas las demás opciones predeterminadas para este ejemplo, por lo que pulse en Ejecutar para crear el modelo. (También puede pulsar con el botón derecho del ratón en el nodo y seleccionar Ejecutar del menú contextual o seleccionar el nodo y Ejecutar del menú Herramientas.)