Creación de modelos con IBM Netezza Analytics e IBM Data Warehouse
Cada uno de los algoritmos compatibles tiene un nodo de modelado correspondiente. Puede acceder a los nodos de modelos de IBM Data Warehouse e IBM Netezza desde la pestaña Modelado de bases de datos en la paleta de nodos.
Consideraciones sobre los datos
Los campos en el origen de datos pueden contener variables de varios tipos de datos, dependiendo del nodo de modelado. En IBM® SPSS Modeler, los tipos de datos se denominan niveles de medición. La pestaña Campos del nodo de modelado utiliza iconos para indicar los tipos de nivel de medición permitidos en sus campos de entrada y de objetivo.
Campo objetivo El campo objetivo es el campo cuyo valor está intentando predecir. Si se puede especificar un objetivo, solamente se puede seleccionar uno de los campos de datos de origen como el campo objetivo.
Campo ID de registro Especifica el campo utilizado para identificar de forma exclusiva cada caso. Por ejemplo, puede tratarse de un campo de ID, como CustomerID. Si los datos de origen no incluyen un campo ID, puede crearlo mediante un nodo Derivar, tal y como indica el siguiente procedimiento.
- Seleccione el nodo de origen.
- En la pestaña Operaciones con campos de la paleta de nodos, pulse dos veces en el nodo Derivar.
- Abra el nodo Derivar pulsando dos veces en su icono en el lienzo.
- En el campo Nodo Derivar, introduzca (por ejemplo) ID.
- En el campo Fórmula, introduzca @INDEX y pulse en Aceptar.
- Conecte el nodo Derivar al resto de la ruta.
NUMERIC(18,0), a veces,
SPSS Modeler
puede redondear los datos durante la importación. Para evitar este problema, guarde los datos utilizando el tipo de datos BIGINT o NUMERIC(36,0).Gestión de valores nulos
Si los datos de entrada contienen valores nulos, si utiliza algunos de los nodos de Netezza se pueden producir mensajes de error o rutas repetitivas, por lo que recomendamos eliminar los registros con valores nulos. Utilice el siguiente método.
- Conecte un nodo Seleccionar al nodo de origen.
- Defina la opción Modo del nodo Seleccionar como Descartar.
- Introduzca lo siguiente en el campo Condición:
Asegúrese de incluir todos los campos de entrada.@NULL(field1) [or @NULL(field2)[... or @NULL(fieldN]]) - Conecte el nodo Seleccionar al resto de la ruta.
Resultado de modelo
Es posible que una ruta que contenga un nodo de modelado de Data Warehouse o Netezza genere resultados ligeramente diferentes cada vez que se ejecuta. Esto se debe a que el orden en el que el nodo lee los datos de origen no es siempre el mismo, ya que los datos se leen en tablas temporales antes de la generación de modelos. Sin embargo, las diferencias producidas por este efecto carecen de significado.
Comentarios generales
- En IBM SPSS Collaboration and Deployment Services, no es posible crear configuraciones de puntuación utilizando rutas que contengan nodos de modelado de IBM Data Warehouse o IBM Netezza.
- La exportación o importación de PMML no es posible para los modelos creados por los nodos de Data Warehouse o Netezza.