Rendimiento/Optimización

Reescritura de rutas. (stream_rewriting_enabled) Permite al servidor optimizar rutas volviéndolas a escribir. Por ejemplo, el servidor debería distribuir operaciones de reducción de datos más cerca del nodo de origen para minimizar el tamaño del conjunto de datos lo más rápido posible. Se recomienda normalmente la desactivación de esta opción cuando la optimización provoca un error o resultados inesperados. Esta configuración reemplaza la configuración de optimización de cliente correspondiente. Si esta configuración está inhabilitada en el servidor, el cliente no puede habilitarla. Pero si está habilitado en el servidor, el cliente puede optar por inhabilitarlo.

Paralelismo. (max_parallelism) Describe el número de subprocesos de trabajo en paralelo que se permite utilizar a SPSS Modeler al ejecutar una ruta. El establecimiento de esto en 0 o cualquier otro número negativo hace que IBM® SPSS Modeler haga coincidir el número de hebras con el número de procesadores disponibles en el sistema; el valor por defecto para esta opción es –1. Para desactivar el procesamiento en paralelo (para máquinas con varios procesadores), establezca este número en 1. Para permitir el procesamiento paralelo limitado, establézcalo en un número menor al número de procesadores de la máquina. Tenga en cuenta que un procesador con doble núcleo o con subprocesos múltiples se trata como dos procesadores.

Tamaño del búfer (bytes). (io_buffer_size) Los archivos de datos transferidos desde el servidor al cliente se pasan por un búfer de este número de bytes.

Compresión de caché. (cache_compression) Un valor entero entre 0 y 9 que controla la compresión de caché y otros archivos en el directorio temporal del servidor. La compresión reduce la cantidad de espacio de disco utilizado, que puede ser importante cuando el espacio está limitado. Además aumenta el tiempo de procesador pero casi siempre mediante la reducción del tiempo de acceso a disco. Observe que únicamente se pueden comprimir ciertas memorias caché, aquellas a las que se accede de manera secuencial. Esta opción no se aplica las cachés de acceso aleatorio, como las que utilizan los algoritmos de entrenamiento de redes. Un valor de 0 desactiva la compresión por completo. Los valores de 1 en adelante proporcionan grados crecientes de compresión, pero con un coste correspondiente en tiempo de acceso. El valor predeterminado es 1; es posible que sean necesarios valores mayores cuando el espacio en disco es muy importante.

Multiplicador del uso de memoria. (memory_usage) Controla la proporción de memoria física asignada para ordenar y realizar otras funciones en cachés de memoria. El valor predeterminado es 100, que se corresponde con un 10% de memoria física aproximadamente. Aumente este valor para mejorar el rendimiento de clasificación donde la memoria libre está disponible, pero con precaución ya que si lo aumenta mucho puede provocar una paginación excesiva.

Porcentaje del límite de memoria de modelado. (modelling_memory_limit_percentage) Controla la proporción de memoria física asignada para modelos Kohonen de entrenamiento y k-medias. El valor predeterminado es 25%. Aumente este valor para mejorar el rendimiento de entrenamiento donde la memoria libre está disponible, pero hágalo con precaución: si lo aumenta mucho puede provocar una paginación excesiva al volcar datos en el disco.

Permitir reemplazo de memoria de modelado. (allow_modelling_memory_override) Habilita o inhabilita la opción Optimizar velocidad en determinados nodos de modelado. El valor predeterminado está activado. Esta opción permite al algoritmo de modelado reclamar toda la memoria disponible, omitiendo la opción de límite de porcentaje. Puede querer desactivar esto si necesita compartir recursos de memoria en el equipo servidor.

Puerto del servidor máximo y mínimo. (max_server_port y min_server_port) Especifica el rango de números de puerto que se pueden utilizar para las conexiones de los sockets adicionales entre cliente y servidor necesarios para modelos interactivos y ejecución de rutas. Esto requiere que el servidor esté en línea en otro puerto; si no se restringe el rango, los usuarios en sistemas con cortafuegos podrían tener problemas. El valor predeterminado para ambos es -1, lo que indica "no restricción." Así, por ejemplo, para establecer el servidor en línea en un puerto 8000 o superior, establecería min_server_port en 8000 y max_server_port en –1.

Tenga en cuenta que debe abrir puertos adicionales en el puerto del servidor principal para abrir o ejecutar una ruta y más puertos de forma correspondiente si desea abrir o ejecutar rutas concurrentes. Esto es necesario para capturar información a partir de la ejecución de la ruta.

De forma predeterminada, IBM SPSS Modeler utilizará cualquier puerto abierto que esté disponible; si no encuentra ninguno (por ejemplo, si están todos cerrados por un cortafuegos), aparecerá un error cuando ejecute la ruta. Para configurar el intervalo de puertos, IBM SPSS Modeler necesitará dos puertos abiertos (junto con el puerto principal del servidor) disponibles por ruta concurrente, además de 3 puertos adicionales para cada conexión ODBC desde dentro de cualquier cliente conectado (2 puertos para la conexión ODBC lo que dure dicha conexión, y un puerto temporal adicional para autenticación).

Nota: Una conexión ODBC es una entrada en la lista de conexiones de bases de datos y se puede compartir entre varios nodos de base de datos especificados con la misma conexión a base de datos.

Nota: Es posible que los puertos de autenticación se puedan compartir si las conexiones se realizan en distintos momentos.

Nota: Según el método recomendado, deben usarse los mismos puertos para comunicarse con el cliente IBM SPSS Collaboration and Deployment Services y SPSS Modeler. Estos se pueden establecer como max_server_port y min_server_port.

Nota: Si cambia estos parámetros, deberá reiniciar SPSS Modeler Server para que el cambio surta efecto.

Optimización de obtención de matrices. (sql_row_array_size) Controla la forma en que SPSS Modeler Server obtiene datos del origen de datos ODBC. El valor predeterminado es 1, que obtiene una sola fila cada vez. Al aumentar el valor el servidor lee la información en fragmentos mayores, obteniendo el número especificado de filas en una matriz. Con algunas combinaciones de sistemas operativos/bases de datos, esto podría producir mejoras en el rendimiento de instrucciones SELECT.