lsf_dynamic_host_timeout

定义 LSF 在自动从集群中移除不可用的动态主机之前等待的时间长度。

语法

  • LSF_DYNAMIC_HOST_TIMEOUT=时间
  • LSF_DYNAMIC_HOST_TIMEOUT=分钟m|M
  • LSF_DYNAMIC_HOST_TIMEOUT="EXPIRY[time_minutesm|M] THRESHOLD[number] INTERVAL[time_minutesm|M]"(此外,从 FP14 开始,您也可以使用此语法)

描述

要提高超大型集群中的性能,请执行以下操作:
  • 在使用 Fix Pack 14 之前,请禁用此功能,并手动从 hostcache 文件中删除不需要的主机。
  • 从 FP14 开始,使用 LSF_DYNAMIC_HOST_TIMEOUT="EXPIRY[time_minutesm|M] THRESHOLD[numberm|M] INTERVAL[time_minutesm|M]" 语法定义 LSF_DYNAMIC_HOST_TIMEOUT 参数。 根据集群中的动态主机数,指定其他 THRESHOLDINTERVAL 值。

使用此参数可指定 LSF管理 主机自动除去不可用的动态主机之前等待的时间长度。 从Fix Pack 14开始,您可以使用 lsadmin expire命令标记这些不可用的主机;然后, LSF 会根据此 LSF_DYNAMIC_HOST_TIMEOUT 设置删除这些主机。 在Fix Pack 15之前,每当 LSF 删除一个动态主机时, mbatchd 都会自动重新配置。 从Fix Pack 15开始, LSF 可以移除动态主机,而无需重新配置或重启守护进程。

有效值

FP14 之前的版本:
  • 超时值必须大于或等于 10 分钟。
  • 小于 10 分钟的值设置为最小允许值 10 分钟; 大于 100 小时的值设置为最大允许值 100 小时。
从 FP14 开始,使用下列任何选项或使用双引号括起的组合来指定超时值:
"EXPIRY[time_hours]EXPIRY[time_minutesm|M]"
主机保持为不可用的时间量 (以小时或分钟为单位)。 在此时间之后,它将标记为已到期并仅从 hostcache 中清除,但保留在 MLIMmbatchd 内存中。 如果指定了 THRESHOLDINTERVAL 选项,那么到期的主机将开始等待清除。

到期时间的缺省单位以小时为单位 (例如, EXPIRY[60] 指示 60 小时)。 要指定时间 (以分钟为单位) ,请在值后指定 mM (例如, EXPIRY[60m] 指示 60 分钟)。 有效值为 0 到 2147483647 之间的任何数字。

"THRESHOLD[number]"
当到期的动态主机数达到此阈值时, MLIM 将从内存中除去这些主机,并且 mbatchd 守护程序将在除去主机后获取主机信息时重新配置一次。 有效值为 1 到 2147483647 之间的任何数字。 从Fix Pack 15开始, mbatchd 守护进程将动态删除主机。
"INTERVAL[time_hours]INTERVAL[time_minutesm|M]"
MLIM 尝试从其内存中清除到期动态主机的频率 (以小时或分钟计)。 mbatchd 守护程序在除去主机后获取主机信息时,将重新配置一次。

此时间间隔的缺省单位以小时为单位 (例如, INTERVAL[20] 表示每 20 小时)。 要指定时间 (以分钟为单位) ,请在值后指定 mM (例如, INTERVAL[20m] 表示每 20 分钟)。 有效值为 0 到 2147483647 之间的任何数字。

提示:"THRESHOLDINTERVAL 设置可延迟主机移除并分组主机进行清理,从而为超大集群提供更好的性能。

示例

如果动态主机在 15 小时内不可用,请将其从集群中除去:
LSF_DYNAMIC_HOST_TIMEOUT=15
从 FP14 开始,等效语法为:
LSF_DYNAMIC_HOST_TIMEOUT="EXPIRY[15] THRESHOLD[1]"
从 FP14 开始,当集群达到 100 个到期的动态主机时,请从集群中除去这些主机:
LSF_DYNAMIC_HOST_TIMEOUT="THRESHOLD[100]"
从 FP14 开始,每 15 分钟从集群中除去一次到期的动态主机:
LSF_DYNAMIC_HOST_TIMEOUT="INTERVAL[15m]"
从 FP14 开始,使动态主机处于不可用状态 15 分钟,然后将其标记为已到期。 当到期的动态主机数达到 100 时,将其从集群中移除:
LSF_DYNAMIC_HOST_TIMEOUT="EXPIRY[15m] THRESHOLD[100]"
从 FP14 开始,使动态主机处于不可用状态 15 分钟,然后标记为已到期。 每小时从集群中除去这些到期的动态主机:
LSF_DYNAMIC_HOST_TIMEOUT="EXPIRY[15m] INTERVAL[1]"
从 FP14 开始,每 15 分钟检查一次到期的动态主机数,如果主机数达到 100 ,请将它们从集群中移除:
LSF_DYNAMIC_HOST_TIMEOUT="THRESHOLD[100] INTERVAL[15m]"
从 FP14 开始,使动态主机处于不可用状态 15 分钟,然后标记为已到期。 每 30 分钟检查一次到期的动态主机数,如果主机数达到 100 ,请将其从集群中移除:
LSF_DYNAMIC_HOST_TIMEOUT="EXPIRY[15m] THRESHOLD[100] INTERVAL[30m]"

EGO 参数

EGO_DYNAMIC_HOST_TIMEOUT

缺省值

尚未定义。 不会从集群中除去不可用的主机。