性能/优化
流重写。(stream_rewriting_enabled) 允许服务器通过重写流对流进行优化。例如,服务器可能会在接近源节点的位置进行数据削减操作,以尽早实现数据集规模的最小化。通常,仅当此优化导致错误或其他意外结果时,才建议禁用此选项。此设置将覆盖相应的客户端的优化设置。如果在服务器中禁用了此设置,那么客户机无法将其启用。但是,如果在服务器中启用了此设置,那么客户机可以选择将其禁用。
并行性。(max_parallelism) 描述运行流时允许 SPSS® Modeler 使用的并行工作程序线程数。如果设置为 0 或任何负数,那么 IBM® SPSS Modeler 将认为允许使用的线程数是计算机上的可用处理器数;此选项的缺省值为-1。要对多处理器计算机关闭并行处理,请将此选项设置为 1。要限制并行处理,请将此选项设置为小于计算机上的处理器数的数字。注意:超线程或双核处理器将被当作两个处理器。
缓冲区大小(字节)。(io_buffer_size) 从服务器传输到客户端的数据文件通过此字节数的缓冲区进行传递。
缓存压缩。(cache_compression) 这是 0 到 9 范围内的整数值,用于控制服务器临时目录中缓存文件和其他文件的压缩。压缩可以减少使用的磁盘空间量,这在磁盘空间有限时非常重要。 虽然压缩会延长处理器时间,但因为缩短了磁盘访问时间,因而得到几乎等量的补偿。请注意,只有按顺序访问的特定缓存才可压缩。此选项不适用于随机访问缓存,例如网络训练算法使用的缓存。值为 0 将完全禁用压缩。值从 1 增大,压缩程度会随之提高,但相应的访问时间也会延长。缺省值为 1;在磁盘空间非常宝贵的情况下,可能需要更高的值。
内存使用乘数。(memory_usage) 控制分配给排序和其他此类内存内缓存的物理内存比例。缺省值为 100,这相当于大约 10% 的物理内存。有可用的空闲内存时,增加该值可提高排序性能,但要注意,如果该值增加得太高则有可能导致过度分页。
建模内存限制百分比。(modelling_memory_limit_percentage) 控制为了训练 Kohonen 和 K-Means 模型而分配的物理内存比例。缺省值为 25%。有可用的空闲内存时,增加该值可提高训练性能,但要注意,如果该值增加得太高则有可能在数据溢出到磁盘时导致过度分页。
允许覆盖建模内存。(allow_modelling_memory_override) 在特定建模节点中启用或禁用优化速度选项。缺省值为 enabled。此选项使建模算法能够要求获得所有可用的内存,而忽略百分比限制选项。如果需要在服务器上共享内存资源,则可能希望禁用此选项。
最大和最小服务器端口。(max_server_port 和 min_server_port)指定端口号范围,这些端口号可以用于客户端与服务器之间交互模型和流执行所需的其他套接字连接。这些套接字连接要求服务器侦听其他端口;未限制范围将对在带防火墙的系统上工作的用户造成问题。两者的缺省值均为 -1,表示“无限制”。例如,要通过设置使服务器侦听端口 8000 或数值更大的端口,必须将 min_server_port 设置为 8000,将 max_server_port 设置为 -1。
请注意,您必须打开主服务器端口上方的其他端口才能打开或执行流,如果要打开或执行并发流,那么还需要打开更多的相应端口。必须执行此操作才能捕获执行流所产生的反馈。
缺省情况下,IBM SPSS Modeler 将使用任何一个可用的打开端口;如果它未找到端口(例如,所有的端口都被防火墙关闭),那么执行流时就会显示错误信息。要配置端口范围,对于每个并发流,IBM SPSS Modeler 除了需要主服务器端口以外还需要两个打开的可用端口,并另外需要 3 个端口以用于任何相连客户机中的每个 ODBC 连接(2 个端口在该 ODBC 连接的持续时间内用于 ODBC 连接,以及一个用于认证的附加临时端口)。
数组访存优化。(sql_row_array_size) 控制 SPSS Modeler Server 从 ODBC 数据源访存数据的方法。缺省值为 1,表示一次访存一行。增大此值将使服务器读取更大数据块的信息,即,访存指定数目的行并将其放入数组。对于某些操作系统/数据库组合,这样做可以提高 SELECT 语句的性能。