自动将 LSF 守护程序绑定到特定 CPU 核心

将一组已定义的 LSF 守护程序绑定到 CPU 核心,以在关键功能之间分配 CPU 资源并提高调度性能。

通过在 lsf.conf 文件中将 LSF_INTELLIGENT_CPU_BIND 参数设置为 Y ,可以将 LSF 守护程序绑定到特定 CPU 核心。

根据该主机的 CPU 绑定配置文件, LSFLSF 守护程序绑定到 CPU 核心。 如果主机不存在 CPU 绑定文件,那么 LIM 会自动检测该主机的拓扑,并根据自动绑定策略绑定 LSF 守护程序。

LSF 最初检测每个 管理 主机和 管理 候选者的拓扑,根据自动绑定策略绑定 LSF 守护程序,并为该主机生成 CPU 绑定配置文件。 这些配置文件位于 LSF_ENVDIR/cpu_binding 目录中,文件名格式为 host_name.cluster_name ,位于 LSF_ENVDIR/cpu_binding 目录中。 根据此 CPU 绑定配置文件, LSFLSF 守护程序绑定到 CPU 核心。

如果主机的 CPU 绑定配置文件不再存在,那么 LIM 会自动再次检测该主机的拓扑,并根据自动绑定策略绑定 LSF 守护程序。

如果更改了 CPU 绑定配置文件,那么必须通过按以下顺序运行以下命令来重新启动 LSF 守护程序,以应用新的 CPU 绑定设置:
  1. bctrld restart lim
  2. bctrld restart sbd
  3. badmin mbdrestart
注: CPU 绑定配置文件不支持注释。 在 LIM 重新启动后, LSF 将除去 CPU 绑定配置文件中的任何注释。

LSF_INTELLIGENT_CPU_BIND 参数优先于其他 CPU 绑定参数。 如果启用 LSF_INTELLIGENT_CPU_BIND,那么 LSF 将忽略以下参数:

  • EGO_DAEMONS_CPUS
  • ESTIMATOR_CPUS
  • LSF_DAEMONS_CPUS
  • MBD_QUERY_CPUS
注: 由于此功能部件将 LSF 守护程序绑定到 8 个 CPU 核心,因此如果 管理管理 候选主机的 CPU 核心少于 8 个,那么将忽略 LSF_INTELLIGENT_CPU_BIND 参数。