配置集群

设置 LSF 环境,为用户启用 LSF ,启动集群,并运行一些基本命令来测试安装。 您可以选择运行 hostsetup 脚本以将 LSF 设置为自动启动。

关于本任务

要完成 LSF 安装并使集群启动和运行,请遵循 lsf_getting_started.html 文件中的步骤。 设置 LSF 服务器主机并验证集群是否正确运行后,请参阅 lsf_quick_admin.html 文件以了解有关新 LSF 集群的更多信息。 安装后,请记住通过应用最新更新和错误修订来更新集群。

程序

  1. root用户身份登录到 LSF 管理 主机,并设置 LSF 环境:
    • cshtcsh shell 中,运行 source 命令:
      % source <LSF_TOP>/conf/cshrc.lsf
    • shkshbash shell 中运行以下命令:
      $ . <LSF_TOP>/conf/profile.lsf
  2. 可选。 为用户启用 LSF

    确保所有用户在其 .cshrc.profile 文件中包含 <LSF_TOP>/conf/cshrc.lsf<LSF_TOP>/conf/profile.lsf

  3. 运行 lsfstartup 命令以启动集群。

    lsfstartup 命令使用 RSH 连接到集群中的所有节点并启动 LSF。 如果未在环境中配置 RSH ,那么可以通过将以下行添加到 lsf.conf 文件来将 lsfstartup 命令配置为使用 SSH:

    LSF_RSH=ssh
  4. 可选。 运行 hostsetup 命令以设置 LSF 主机和自动 LSF 启动。
    注: 仅当您将使用 IBM® Parallel Environment (IBM PE) 运行 IBM POE 作业时,才需要运行 hostsetup 命令。
    1. root用户身份登录到每个 LSF 服务器主机。 从 LSF 管理 主机开始。
      注: 如果要将 LSFIBM PE集成,那么必须以 root用户身份登录。

      否则,如果您不是 root用户,那么可以继续主机设置,但缺省情况下,只有 root 才能启动 LSF 守护程序。

    2. 在每个 LSF 服务器主机上运行 hostsetup 命令。
      重要信息: 在运行 hostsetup 命令之前,请确保要设置的主机位于 lsf.cluster.cluster_name 文件中。
      例如,运行以下命令以使用安装在 /usr/share/lsf 目录中的 LSF 集群,并将 LSF 守护程序配置为在引导时自动启动:
      # cd /usr/share/lsf/10.1.0/install
      # ./hostsetup --top="/usr/share/lsf" --boot="y"
      

      要完整使用 hostsetup 命令,请运行 hostsetup -h 命令。

  5. 通过运行一些基本 LSF 命令来测试集群。

    例如,运行 lsidlshostsbhosts 命令。

    测试集群后,请确保所有 LSF 用户都在其 .cshrc.profile 文件中包含 LSF_CONFDIR/cshrc.lsfLSF_CONFDIR/profile.lsf 命令。