Configuración de opciones de optimización de las rutas
Puede utilizar la configuración de optimización para optimizar el rendimiento de la ruta. Tenga en cuenta que la configuración de la optimización y el rendimiento en IBM® SPSS Modeler Server (si se utiliza) reemplaza cualquier configuración equivalente en el cliente. Si estos valores están inhabilitados en el servidor, el cliente no los puede habilitar. Pero si están habilitados en el servidor, el cliente puede optar por inhabilitarlos.
Si la conectividad está activada, verá la opción Activación de servidor en la pestaña Estado de licencia.
Consulte Conexión con si desea obtener más información.
Activar reescritura de rutas. Seleccione esta opción para activar la reescritura de rutas en IBM SPSS Modeler. Hay cuatro tipos de reescritura disponibles, y puede seleccionar una o más. La reescritura reordena los nodos de una ruta en segundo plano para obtener un funcionamiento más eficiente sin alterar la semántica de la ruta.
- Optimizar generación de SQL. Esta opción permite reordenar los nodos de la ruta de manera que se puedan retrotraer más operaciones usando la generación de SQL para su ejecución en la base de datos. Si encuentra un nodo que no se puede representar en SQL, el optimizador leerá previamente para comprobar si hay algún nodo posterior en la ruta que se pueda representar en SQL y mover con seguridad al nodo problema sin que la semántica de la ruta se vea afectada. No sólo la base de datos puede realizar operaciones de un modo más eficiente que IBM SPSS Modeler, sino que los puntos de retrotracción actúan para reducir el tamaño del conjunto de datos que se devuelve a IBM SPSS Modeler para su procesamiento. A su vez, esto puede reducir el tráfico de red y acelerar las operaciones de las rutas. Tenga en cuenta que la casilla de verificación Generar SQL debe estar seleccionada para que la optimización de SQL tenga algún efecto.
- Optimizar expresión CLEM. Esta opción permite al optimizador buscar las expresiones CLEM que se pueden preprocesar antes de que se ejecute la ruta para poder aumentar la velocidad de proceso. Como ejemplo sencillo, si tiene una expresión tal como log(salario), el optimizador calculará el valor del salario real y lo pasará al proceso. Esto puede utilizarse para mejorar la retrotracción SQL y el rendimiento de IBM SPSS Modeler Server.
- Optimizar ejecución de sintaxis. Este método de reescritura de rutas incrementa la eficiencia de las operaciones que incorporan más de un nodo con la sintaxis de IBM SPSS Statistics. La optimización se logra combinando los comandos de sintaxis en una única operación, en lugar de ejecutar cada operación como separada.
- Optimizar otra ejecución. Este método de reescritura de rutas incrementa la eficiencia de las operaciones que no se pueden delegar a la base de datos. La optimización se consigue reduciendo la cantidad de datos de la ruta lo antes posible. Al tiempo que se mantiene la integridad de los datos, la ruta se reescribe para colocar las operaciones más cerca del origen de datos, reduciendo de este modo los datos de la parte de abajo en la ruta en el caso de operaciones costosas, como las uniones.
Activar procesamiento paralelo. Cuando trabaje en un ordenador con varios procesadores, esta opción permite al sistema equilibrar la carga a través de estos procesadores, que puede resultar en rendimiento más rápido. El uso de varios nodos, o de los siguientes nodos individuales, puede mejorar gracias al procesamiento paralelo: C5.0, Fundir (por clave), Ordenar, Intervalo (métodos de mosaico y rango) y Agregar (utilizando uno o más campos clave).
Generar SQL. Seleccione esta opción para activar la optimización de SQL, permitiendo que las operaciones de ruta se retrotraigan a la base de datos mediante el código SQL para generar los procesos de ejecución, que puede mejorar el rendimiento. Para mejorar aún más el rendimiento, se puede seleccionar Optimizar generación de SQL para maximizar el número de operaciones retrotraídas a la base de datos. Si las operaciones de un nodo se han retrotraído a la base de datos, el nodo se resaltará en color púrpura cuando se ejecute la ruta.
- Almacenamiento en caché de base de datos. Para que se ejecuten las rutas que generan SQL en la base de datos, los datos se pueden almacenar en caché en medio de la ruta en una tabla temporal en la base de datos en lugar de en el sistema de archivos. Al combinarlo con la optimización de SQL, se puede mejorar considerablemente el rendimiento. Por ejemplo, el resultado de una ruta que fusiona varias tablas para crear una vista de minería de datos se puede guardar en caché y reutilizar cuando sea necesario. Con el almacenamiento en caché de la base de datos activado, sólo tiene que pulsar con el botón derecho del ratón en cualquier nodo no terminal para almacenar en caché los datos en ese punto, y la caché se creará de forma directa y automática en la base de datos la próxima vez que se ejecute la ruta. Esto permite generar SQL para nodos posteriores en la ruta, mejorando aún más el rendimiento. Si lo prefiere, esta opción se puede desactivar si es necesario, por ejemplo, cuando las directivas o los permisos excluyen los datos que se escriben en la base de datos. Si no se activa el almacenamiento en caché de la base de datos o la optimización de SQL, la caché se escribirá en el sistema de archivos en lugar de en la base de datos. Consulte el tema Opciones de almacenamiento en memoria caché para nodos para obtener más información.
- Utilizar conversión relajada. Esta opción permite la conversión de datos de cadenas a números y viceversa si están almacenados en un formato adecuado. Por ejemplo, si los datos se almacenan como cadena en una base de datos, pero contienen un número significativo, los datos se pueden convertir para utilizarlos cuando se realice la retrotracción.
Guardar como valor predeterminado. Las opciones especificadas se aplican solamente a la ruta actual. Pulse en este botón para establecer estas opciones como el valor predeterminado para todas las rutas.