Badmin
badmin 命令是 LSF的管理工具。
概要
badmin 子命令 选项描述
badmin 命令提供了一组用于控制和监视 LSF的子命令。 如果不包含子命令,那么badmin命令从标准输入提示输入子命令。
有关每个子命令的信息可通过 -h 选项获取。
badmin 子命令包括特权和非特权子命令。 只有 root 用户或 LSF 管理员才能运行特权子命令。 以下子命令具有特权:
- diagnose
- gpddebug
- gpdrestart
- gpdtime
- hclose
- hghostadd
- hghostdel
- hopen
- hpower
- lsfproxyd
- mbddebug
- mbdrestart
- perflog
- perfmon
- qact
- qclose
- qinact
- qopen
- rc
- reconfig
- security
配置文件 lsf.sudoers 必须设置为由非 root 用户使用特权命令 hstartup 。
所有其他命令都是非特权命令,可供任何 LSF 用户使用。 如果未在 lsf.conf 文件中定义 LSF_AUTH 参数,那么将使用特权端口,并且必须安装 badmin 命令,因为它需要通过特权端口发送请求。 badmin 可执行文件在安装时已启用 setuid 标志 关于 。
使用可指定多个主机名的子命令时,请勿将主机名括在引号内。
子命令概要
ckconfig [-v]选项
- 子命令
- 运行指定的子命令。 请参阅 "用法" 部分。
- -h
- 将命令用法打印到 stderr 并退出。
- -V
- 将 LSF 发行版打印到 stderr 并退出。
用途
- ckconfig [-v]
- 检查位于 LSB_CONFDIR/cluster_name/configdir 目录中的 LSF 配置文件,并检查 LSF_ENVDIR/lsf.licensescheduler 文件。
LSB_CONFDIR 变量在 lsf.conf 文件中的 LSF_ENVDIR 或 /etc 中定义 (如果未定义 LSF_ENVDIR )。
缺省情况下, badmin ckconfig 命令仅显示配置文件检查的结果。 如果发现警告错误,那么 badmin 命令会提示您显示详细消息。- -v
- 详细方式。 向 stderr显示有关配置文件检查的详细消息。
- 诊断 pend jobid ...
- 如果在 lsb.params 文件中设置了 CONDENSE_PENDING_REASONS=Y ,那么显示完全暂挂原因列表。
badmin diagnose 1057 - 诊断 -c jobreq [-f snapshot_file_name] [-t xml | -t json]
- 仅限 UNIX。 将调度程序作业存储区信息的当前内容作为原始数据保存到 XML 或 JSON 快照文件中。
根据资源需求和不同的调度策略,将作业放入调度存储区中。 通过解析文件或对其内容运行简单文本搜索,将内容保存到快照文件中对于数据分析很有用。
如果要检查对调度程序的突然大型性能影响,那么此功能很有用。 使用快照文件来标识具有多个存储区或大型属性值的任何用户。
可以使用以下选项:
- -c 作业要求
- 必需。
- -f 文件名
- 指定要在其中保存信息的快照文件。 它是位于 DIAGNOSE_LOGDIR 目录中的文件名或完整路径文件名。 如果指定的快照文件存在,那么将使用当前信息覆盖该文件。
快照文件的缺省名称为 jobreq_<hostname>_<dateandtime>.<format>,其中 <format> 是 xml 或 json,具体取决于快照文件的指定格式。
日志文件的所有者是在 LSF_ADMIN 参数中指定的用户。 日志文件许可权与 mbatchd 守护程序日志许可权相同。 每个人都具有读和执行访问权,但 LSF_ADMIN 所有者具有写,读和执行访问权。
- -t xml | -t json
- 指定快照文件的格式。 为快照文件指定 -t xml 以 XML 格式,或为快照文件指定 -t json 以 JSON 格式。
快照文件的缺省格式为 XML ,快照文件的扩展名为 .xml。 如果快照文件为 JSON 格式,那么快照文件的扩展名为 .json。
- 诊断 -c lsfproxyd [-f logfile_name] [-d minutes] | [-o]]
- 如果意外的 lsfproxyd 装入 (对于从 FP14 开始的 LSF 速率限制器 ) 导致集群缓慢或无法响应请求,那么此功能很有用。 例如,许多 bjobs 命令查询可能会导致高网络负载并阻止 lsfproxyd 守护程序响应。 运行此命令及其选项使 lsfproxyd 守护程序能够将查询源信息转储到日志文件中。
日志文件显示有关查询源的信息,以便于进行故障诊断。 日志文件显示发出这些请求的人员,请求来自的位置以及查询的数据大小。
您还可以通过在 lsb.params 文件中启用 ENABLE_DIAGNOSE 参数来配置此功能,以便在集群启动时立即记录整个查询信息。 但是,命令中的动态设置将覆盖静态参数设置。 另外,在您指定的跟踪查询信息的持续时间到期后,静态诊断设置将生效。
您可以使用以下选项来动态设置时间,指定日志文件,并允许 lsfproxyd 守护程序收集信息:
- -c lsfproxyd
- 必需。
- -f
- 指定要在其中保存信息的日志文件。 它是文件名或完整路径文件名。
日志文件的缺省名称为 query_info.queryproxylog.hostname。
日志文件的所有者是在 LSF_ADMIN 参数中指定的用户。 日志文件许可权与 lsfproxyd 守护程序日志许可权相同。 每个人都具有读和执行访问权,但 LSF_ADMIN 用户具有写,读和执行访问权。
如果在 lsb.params 文件中指定日志文件,然后在命令行中指定其他日志文件,那么命令行中的日志文件优先。 日志记录将继续,直到指定的持续时间结束,或者直到您停止动态日志记录为止。 然后切换回静态日志文件位置。
- -d 分钟
- 指定用于跟踪查询信息的持续时间 (以分钟计)。 lsfproxyd 守护程序在持续时间结束后还原为静态设置,或者直到您手动将其停止,重新启动 (使用 lsfproxyd 命令) 或重新配置 (使用 badmin reconfig 命令)。 此持续时间的缺省值为无限。 缺省情况下,将始终记录查询信息。
- -o
- 关闭动态诊断 (停止日志记录)。 如果配置了 ENABLE_DIAGNOSE=lsfproxyd 参数,那么它将返回到静态配置。
- 诊断 -c 查询 [-f logfile_name] [-d minutes] | [-o]]
- 如果意外的 mbatchd 查询装入导致集群缓慢或无法响应请求,那么此功能很有用。 例如,许多 bjobs 命令查询可能会导致高网络负载并阻止 mbatchd 守护程序响应。 运行此命令及其选项使 mbatchd 守护程序能够将查询源信息转储到日志文件中。
日志文件显示有关查询源的信息,以便于进行故障诊断。 日志文件显示发出这些请求的人员,请求来自的位置以及查询的数据大小。
您还可以通过在 lsb.params 文件中启用 DIAGNOSE_LOGDIR 和 ENABLE_DIAGNOSE 参数来配置此功能,以便在集群启动时立即记录整个查询信息。 但是,命令中的动态设置将覆盖静态参数设置。 另外,在您指定的跟踪查询信息的持续时间到期后,静态诊断设置将生效。
您可以使用以下选项来动态设置时间,指定日志文件,并允许 mbatchd 守护程序收集信息:
- -c 查询
- 必需。
- -f
- 指定要在其中保存信息的日志文件。 它是位于 DIAGNOSE_LOGDIR 目录中的文件名或完整路径文件名。
日志文件的缺省名称为 query_info.querylog.<host_name>。
日志文件的所有者是在 LSF_ADMIN 参数中指定的用户。 日志文件许可权与 mbatchd 守护程序日志许可权相同。 每个人都具有读和执行访问权,但 LSF_ADMIN 用户具有写,读和执行访问权。
如果在 lsb.params 文件中指定日志文件,然后在命令行中指定其他日志文件,那么命令行中的日志文件优先。 日志记录将继续,直到指定的持续时间结束,或者直到您停止动态日志记录为止。 然后切换回静态日志文件位置。
- -d 分钟
- 指定用于跟踪查询信息的持续时间 (以分钟计)。 mbatchd 守护程序在持续时间结束后还原为静态设置,或者直到您手动将其停止,重新启动 (使用 badmin mbdrestart 命令) 或重新配置 (使用 badmin reconfig 命令)。 此持续时间的缺省值为无限。 缺省情况下,将始终记录查询信息。
- -o
- 关闭动态诊断 (停止日志记录)。 如果配置了 ENABLE_DIAGNOSE=query 参数,那么它将返回到静态配置。
- gpdckconfig [-v]
- 检查位于 LSB_CONFDIR/cluster_name/configdir 目录中的全局策略配置文件 lsb.globalpolicies 。
LSB_CONFDIR 变量在 lsf.conf 文件中的 LSF_ENVDIR 或 /etc 中定义 (如果未定义 LSF_ENVDIR )。
缺省情况下, badmin gpdckconfig 命令仅显示配置文件检查的结果。 如果发现警告错误,那么 badmin 命令会提示您显示详细消息。
只能在全局策略守护程序集群 (GPD 集群) 中的 管理 主机或 管理 候选主机上运行 badmin gpdckconfig 命令。
- -v
详细方式。 向 stderr显示有关配置文件检查的详细消息。
- gpddebug [[-c class_name...] [[-l debug_level ] [[-f logfile_name ] [-o]
- 设置 gpolicyd 守护程序的消息日志级别,以在日志文件中包含其他信息。 你一定是root或 LSF 管理员使用此命令。如果在不使用任何选项的情况下使用该命令,那么将使用以下缺省值:
- class_name
- 未定义 (未记录其他类)。
- debug_level=0
- 指定但LOG_DEBUGLSF_LOG_MASK 参数中的级别。
- logfile_name
- 未定义 (LSF 系统日志文件位于 LSF 系统日志文件目录中,格式为gpolicyd.log.host_name).
- -c 类名...
- 指定要为其记录调试消息的软件类。
缺省情况下,未定义 class_name ,并且未记录任何其他类。
class_name 的格式是类的名称,或者是用空格分隔并括在引号中的类名列表。 类也列在lsf.h头文件。
支持以下日志类:- LC_AUTH
- 日志认证消息。
- LC_COMM
- 记录通信消息。
- LC_SYS
- 记录系统调用消息。
- LC_TRACE
- 记录重要的程序执行步骤。
- LC_XDR
- 记录 XDR 传输的所有内容。
- LC_XDRVERSION
- XDR 版本的日志消息。
- LC2_G_FAIR
- 记录全局公平共享消息。
- -l 调试级别
- 指定调试消息中的详细信息级别。 数字越高,记录的详细信息越多。 较高级别包括所有较低级别。debug_level 具有以下值:
- 默认值:0
- 参数 LSF_LOG_MASK中的 LOG_DEBUG 级别。
- 0
- lsf.conf 文件中参数 LSF_LOG_MASK 的 LOG_DEBUG 级别。
- 1
- LOG_DEBUG1 级别,用于扩展日志记录。 更高的级别包括更低的日志记录级别。 例如, LOG_DEBUG1 级别包含 LOG_DEBUG 级别。
- 2
- LOG_DEBUG2 级别,用于扩展日志记录。 更高的级别包括更低的日志记录级别。 例如, LOG_DEBUG2 级别包括 LOG_DEBUG1 和 LOG_DEBUG 级别。
- 3
- LOG_DEBUG3 级别,用于扩展日志记录。 更高的级别包括更低的日志记录级别。 例如, LOG_DEBUG3 级别包括 LOG_DEBUG2, LOG_DEBUG1和 LOG_DEBUG 级别。
- -f 日志文件名
- 指定要将调试消息记录到其中的文件的名称。 可以指定具有或不具有完整路径的文件名。
如果指定了没有路径的文件名,那么该文件将保存在 LSF 系统日志目录中。
创建的文件的名称具有以下格式:
logfile_name.gpolicyd.log.host_name
在 UNIX 上,如果指定的路径无效,那么将在 /tmp 目录中创建日志文件。
在 Windows 上,如果指定的路径无效,那么不会创建日志文件。
缺省情况下, logfile_name 是 LSF 系统日志文件目录中的当前 LSF 系统日志文件。
- -o
- 关闭临时调试设置并将其重置为守护程序启动状态。 消息日志级别将重置回 LSF_LOG_MASK 的值,而类将重置为 LSB_DEBUG_GPD的值。
日志文件也会重置回缺省日志文件。
- gpdrestart [-v] [-f]
- 动态重新配置 LSF 全局策略并重新启动 gpolicyd 守护程序。
将检查全局策略配置文件 lsb.globalpolicies 是否存在错误,并将结果打印到 stderr。 如果找不到错误,那么将重新装入 lsb.globalpolicies 文件并重新启动 gpolicyd 守护程序。
如果发现警告错误,那么 badmin 命令会提示您显示详细消息。 如果发现不可恢复的错误,那么不会重新启动 gpolicyd 守护程序,并且 badmin 命令将退出。
只能在全局策略守护程序集群 (GPD 集群) 中的 管理 主机或 管理 候选主机上运行 badmin gpdrestart 命令。
- -v
- 详细方式。 显示有关配置文件状态的详细消息。 来自配置检查的所有消息都将打印到 stderr。
- -f
- 如果配置文件不包含不可恢复的错误,那么禁用交互并继续执行 gpolicyd 守护程序重新启动。
- gpdtime [[-l timing_level ] [[-f logfile_name ] [-o]
- 设置 gpolicyd 守护程序的计时级别,以在日志文件中包含额外的计时信息。 你一定是root或 LSF 管理员使用此命令。如果在不使用任何选项的情况下使用该命令,那么将使用以下缺省值:
- timing_level
- 未定义 (记录计时信息)。
- logfile_name
- 未定义 ( LSF 系统日志文件目录中的当前 LSF 系统日志文件,格式为gpolicyd.log.host_name).
- -l 时序级别
- 指定日志文件中包含的计时信息的详细信息。 计时消息指示软件中功能的执行时间,并以毫秒为单位记录。
支持以下值: 1|2|3|4|5
数字越高,软件中已计时且其执行时间记录的功能就越多。 较低的数字包括更常见的软件功能。 较高级别包括所有较低级别。
缺省情况下,不会记录计时信息。
- -f 日志文件名
- 指定要将计时消息记录到其中的文件的名称。 可以指定具有或不具有完整路径的文件名。
如果指定了没有路径的文件名,那么该文件将保存在 LSF 系统日志文件目录中。
创建的文件的名称具有以下格式:logfile_name.gpolicyd.log.host_name在 UNIX 上,如果指定的路径无效,那么将在 /tmp 目录中创建日志文件。
在 Windows 上,如果指定的路径无效,那么不会创建日志文件。
注: 计时和调试消息都记录在相同的文件中。缺省值是 LSF 系统日志文件目录中的当前 LSF 系统日志文件,格式为 gpolicyd.log.host_name。
- -o
- 可选。 关闭临时计时设置并将其重置为守护程序启动状态。 计时级别将重置为相应守护程序 (LSB_TIME_GPD) 的参数值。
日志文件也会重置回缺省日志文件。
- hclose [-C comment] [-i "lock_id"] [host_name ...| host_group ...| comput_unit ...| 全部]
- 关闭批处理服务器主机。 指定任何服务器主机,主机组或计算单元的名称。 如果指定了保留字 all ,那么将关闭所有批处理服务器主机。 如果未指定任何参数,那么将采用本地主机。 已关闭的主机不接受任何新作业,但已分派给该主机的作业不受影响。 此行为与窗口关闭的主机不同; 当主机上的时间窗口关闭时,将暂挂该主机上的所有作业。
如果主机已关闭,那么除非指定 -i 选项以将锁定标识连接到主机,否则此命令选项无效。
- -C 评论
- 将文本作为管理员注释记录记录记录到 lsb.events 文件中。 注释字符串的最大长度为 512 个字符。
如果关闭主机组或计算单元,那么将显示具有相同注释字符串的每个成员。
无法使用 badmin hopen 命令打开通过 LSF 资源连接器 (位于closed_RC状态。
- -i 锁标识符
- 关闭主机并将指定的锁定标识连接到已关闭的主机。 每个锁定标识都是一个字符串,最多可包含 128 个字母数字和下划线 (_) 字符。 关键字 all 是保留的,不能用作锁定标识。 已关闭的主机可以具有多个锁定标识,并且该主机将保持关闭状态,直到没有更多锁定标识连接到该主机为止。
将 -i 与 -C 选项一起使用以将管理员消息附加到锁定标识。
如果尝试连接已连接到主机的锁定标识 (即使有其他注释) ,那么该主机的命令将失败。
使用 badmin hopen -i 命令选项从主机中除去一个或多个锁定标识。
这允许多个用户由于不同原因使一个主机保持关闭状态。 例如,当 userB 配置操作系统时, userA 可能正在更新应用程序。 主机将保持关闭状态,直到两个用户都完成其更新并使用其特定锁定标识打开主机为止。
- help [命令 ...] |? [命令 ...]
- 显示指定命令的语法和函数。
- hghostadd [-C comment] host_group | compute_unit |host_name [host_name ...]..
- 如果启用了动态主机配置,那么会将主机动态添加到主机组或计算单元。 在 mbatchd 守护程序从 管理 主机上的 LIM 接收主机信息后,它会动态添加主机,而不会触发重新配置。
将主机添加到主机组或计算单元后,会将其视为该组的一部分,以便为新提交的作业和现有暂挂作业调度决策。
如果任何指定的主机组,计算单元或主机名无效,那么此命令将失败。
限制: 如果通过 lsb.params 文件中的 ENABLE_DEFAULT_EGO_SLA 参数配置了启用了 EGO的 SLA 调度,那么无法使用 hghostadd 子命令,因为所有主机分配都由 企业网格编排器 (EGO) 控制。- -C 评论
- 将文本作为管理员注释记录记录记录到 lsb.events 文件中。 注释字符串的最大长度为 512 个字符。
- hghostdel [-f] [[-C comment ] host_group | compute_unit |host_name [ host_name...]
- 通过触发 mbatchd 守护程序的重新配置,动态地从主机组或计算单元中删除主机。
如果任何指定的主机组,计算单元或主机名无效,那么此命令将失败。
警告:要将动态主机更改为静态主机,请首先使用命令 badmin hghostdel 从其所属的任何主机组或计算单元中除去该动态主机。 然后,将主机配置为 lsf.cluster.cluster_name 文件中的静态主机。
限制: 如果通过 lsb.params 文件中的 ENABLE_DEFAULT_EGO_SLA 参数配置了启用了 EGO的 SLA 调度,那么无法使用 hghostdel 子命令,因为所有主机分配都由 企业网格编排器 (EGO) 控制。- -f
- 禁用交互,并且在重新配置 mbatchd时不要求确认。
- -C 评论
- 将文本作为管理员注释记录记录记录到 lsb.events 文件中。 注释字符串的最大长度为 512 个字符。
- hhist [-t time0,time1] [-f logfile_name] [host_name ...] ..
- 显示指定主机的历史事件,如果未指定主机,那么显示所有主机的历史事件。 主机事件是主机打开和关闭。 此外,还会显示 badmin 命令和策略或作业触发的电源相关事件 (暂挂,恢复和重置)。
- -t 时间0, 时间1
仅显示从 time0 到 time1期间发生的事件。 请参阅 bhist 命令以获取时间格式。 缺省值是显示事件日志文件中的所有主机事件。
- -f 日志文件名
- 指定事件日志文件的文件名。 可以指定绝对路径名或相对路径名。 缺省值是使用 LSF 系统中的当前事件日志文件: LSB_SHAREDIR/cluster_name/logdir/lsb.events。 选项 -f 对于脱机分析很有用。
如果使用主机控制命令 hclose 或 hopen的 -C 选项指定了管理员注释,那么 hhist 将显示注释文本。
- 历史 [-t time0,time1] [-f logfile_name]
- 显示所有队列,主机和 mbatchd的历史事件。 将显示 badmin 命令和策略或作业触发的电源相关事件 (暂挂,恢复和重置)。
- -t 时间0, 时间1
- 仅显示从 time0 到 time1期间发生的事件。 请参阅 bhist 以获取时间格式。 缺省值是显示事件日志文件中的所有队列事件。
- -f 日志文件名
- 指定事件日志文件的文件名。 可以指定绝对路径名或相对路径名。 缺省值是使用 LSF 系统中的当前事件日志文件: LSB_SHAREDIR/cluster_name/logdir/lsb.events 文件。 选项 -f 对于脱机分析很有用。
如果使用队列,主机和 mbatchd 守护程序命令的 -C 选项指定了管理员注释,那么 hist 选项将显示注释文本。
- hopen [-C comment] [-i "lock_id ...| all"] [host_name ... | host_group] [host_name ...| host_group ...| comput_unit ...| 全部]
- 打开批处理服务器主机。 指定任何服务器主机,主机组或计算单元的名称。 如果指定了保留字 all ,那么将打开所有批处理服务器主机。 如果未指定主机,主机组或计算单元,那么将采用本地主机。 如果主机处于打开状态,那么该主机接受批处理作业。要点: 如果通过 lsb.params文件中的 ENABLE_DEFAULT_EGO_SLA 参数配置了启用了 EGO的 SLA 调度,并且 EGO关闭了主机,那么 badmin hopen 命令无法将其重新打开。 EGO 关闭的主机具有状态closed_EGO在 bhosts -l 命令输出中。
- -C 评论
- 将文本作为管理员注释记录记录记录到 lsb.events 文件中。 注释字符串的最大长度为 512 个字符。
如果打开主机组或计算单元,那么将显示具有相同注释字符串的每个成员。
- -i "lock_id ...| 全部"
- 从已关闭的主机中除去指定的锁定标识。 如果主机上没有更多剩余的锁定标识,那么还会打开主机。
使用空格来分隔多个锁定标识。 使用 all 关键字除去所有锁定标识并打开主机。
这允许多个用户由于不同原因使一个主机保持关闭状态。 例如,当 userB 配置操作系统时, userA 可能正在更新应用程序。 主机将保持关闭状态,直到两个用户都完成其任务并使用其特定锁定标识打开主机为止。
- hpower [suspend | resume] [-C comment] [hostname...] [主机名..
- 在省电状态或工作状态之间手动切换主机。
- 暂挂 | 恢复
- 要将主机切换到的状态。
- -C 评论
- 将文本作为管理员注释记录记录记录到 lsb.events 文件中。 注释字符串的最大长度为 512 个字符。
- 重新启动
- 此子命令在 LSF V 10.1 FP11 中已过时。 请改为使用 bctrld restart sbd 命令来重新启动 sbatchd 守护程序。
- 关闭
- 此子命令在 LSF V 10.1 FP11 中已过时。 请改为使用 bctrld stop sbd 命令来关闭 sbatchd 守护程序。
- 启动
- 此子命令在 LSF V 10.1 FP11 中已过时。 请改为使用 bctrld start sbd 命令来启动 sbatchd 守护程序。
- lsfproxyd [[enable | disable] all | query | sub | other]] | 状态
- 从 FP14 开始,在
lsfproxyd守护程序运行时启用或禁用 LSF 速率限制器 。 FP14 引入了 速率限制器。 速率限制器 由lsfproxyd守护程序管理,该守护程序监视并控制可以访问mbatchd守护程序的请求数和连接数,从而保护它免受过量请求的影响。 对于要联系mbatchd的请求,必须首先从lsfproxyd获取请求令牌。 完成请求后,令牌将返回到lsfproxyd。lsfproxyd守护程序以循环方式分发令牌,确保每个用户连接都有公平的机会得到服务和处理,即使在负载很重的情况下也是如此。如果禁用了请求类型,那么lsfproxyd守护程序将不会分发该请求类型的令牌,而是会将请求处理到mbatchd守护程序。 如果禁用了 速率限制器 (或者如果所有lsfproxyd守护程序都已关闭) ,那么mbatchd守护程序将接受具有令牌的请求; 例如:$ badmin lsfproxyd disable query lsfproxyd service status: QUERY:DISABLED SUBMISSION:ENABLED OTHER:ENABLED运行badmin lsfproxyd status会直接与lsfproxyd守护程序通信,并显示其状态信息,包括以下数据:- 是否启用不同的请求类型
- 其令牌限制的份额,以及正在使用的令牌数
- 在采样周期内收集的简单度量:
- 请求数
- 按类别细分的拒绝数
- 阻塞请求数
- 错误数
- 当前采样周期的计数
- 上次完成的采样周期的计数
- 在所有已完成的采样周期中看到的最大计数
- 在所有已完成的采样周期内计算的平均计数
- (修复包15) 所有已完成采样周期的总计数。 该值是当前
lsfproxyd进程生命周期内的总和。
以下是在启用请求类型的情况下运行badmin lsfproxyd status的示例输出:$ badmin lsfproxyd status lsfproxyd service status: QUERY:ENABLED SUBMISSION:ENABLED OTHER:ENABLED lsfproxyd host status: HOSTNAME: host1 STATUS: CONNECTED PID: 1592462 TOKEN_LIMIT TOKENS_IN_USE_TOTAL TOKENS_IN_USE_PRIVILEGED QUERY 1 242 242 SUBMISSION 1 263 263 OTHER 1 0 0 lsfproxyd started: Thu Feb 16 14:03:15 End time of last sample period: Fri Feb 17 06:41:15 Sample period: 60 Seconds ------------------------------------------------------------------------------ Metrics Current Last Max Avg Total ------------------------------------------------------------------------------ Requests Query 0 300 300 300 7 Submission 0 900 900 900 1 Other 0 0 0 0 0 Rejected Query 0 0 0 0 0 Submission 0 0 0 0 0 Other 0 0 0 0 0 Blocked 0 0 0 0 0 Error 0 0 0 0 0以下是在请求类型处于禁用状态时运行badmin lsfproxyd status的示例输出:lsfproxyd service status: QUERY: DISABLED SUBMISSION: DISABLED OTHER: DISABLED lsfproxyd host status: HOSTNAME: host1 STATUS: DISCONNECTED PID: - TOKEN_LIMIT TOKENS_IN_USE_TOTAL TOKENS_IN_USE_PRIVILEGED QUERY - - - SUBMISSION - - - OTHER - - - No metric data available.
- lsfproxyd [[block | unblock] [all | [-u "user1 user2 ..."] [-m "host1 主机 ..."]]]]]]]| blocklist
- 从 FP14 开始,允许管理员在使用 速率限制器时临时阻止非管理员用户和/或非 root 用户和/或主机执行
mbatch守护程序操作。 使用 unblock 选项手动取消阻止这些用户和主机,或者在lsfproxyd守护程序针对 速率限制器重新启动时自动取消阻止这些用户和主机。请注意,如果
lsfproxyd守护程序在管理员发送块更新并重新启动守护程序时关闭,或者在管理员阻止用户后重新启动,那么被阻止的用户可以联系mbatchd守护程序。 在此情况下,管理员应再次运行 block 命令以刷新受影响的守护程序上的块列表。badmin lsfproxyd block 的预期用途是允许管理员临时停止用户与 LSF 集群进行交互。 它用于减轻管理员认为滥用用户或主机会影响 LSF 性能并降低其他用户的服务质量的情况。
要阻止用户或主机,请运行 badmin lsfproxyd block。 要将其取消阻塞,请运行 badmin lsfproxyd unblock。 要显示所有当前被阻止的用户和主机,请运行 badmin lsfproxyd blocklist。 请参阅以下详细信息以获取命令用法示例。
阻止所有用户和主机的示例用法和输出消息:$ badmin lsfproxyd block all <all> added to the the blocklist on lsfproxyd host <lsfproxydhost1>取消阻止所有用户和主机的示例用法和输出消息:$ badmin lsfproxyd unblock all <all> removed from the the blocklist on lsfproxyd host <lsfproxydhost1>阻止user1和user2的示例用法和输出消息:$ badmin lsfproxyd block -u "user1 user2" Users <user1 user2> added to the blocklist on lsfproxyd host <lsfproxydhost1>阻止hostA和hostB的示例用法和输出消息:$ badmin lsfproxyd block -m "hostA hostB" Hosts <hostA hostB> added to the blocklist on lsfproxyd host <lsfproxydhost1>在hostA上阻止user1的示例用法和输出消息:$ badmin lsfproxyd block -u "user1" -m "hostA" <user1@hostA> added to the blocklist on lsfproxyd host <lsfproxydhost1> <user1@hostA> added to the blocklist on lsfproxyd host <lsfproxydhost2>在hostA和hostB上阻止user1和user2的示例用法和输出消息:$ badmin lsfproxyd block -u "user1 user2" -m "hostA hostB" <user1@hostA user1@hostB user2@hostA user2@hostB> added to the blocklist on lsfproxyd host <lsfproxydhost1> <user1@hostA user1@hostB user2@hostA user2@hostB> added to the blocklist on lsfproxyd host <lsfproxydhost2>取消分块user1的示例用法和输出消息:$ badmin lsfproxyd unblock -u user1 Users <user1> removed from the blocklist on lsfproxyd host <lsfproxydhost1> Users <user1> removed from the blocklist on lsfproxyd host <lsfproxydhost2>在hostA和hostB取消阻止user1的示例用法和输出消息:$ badmin lsfproxyd unblock -u "user1" -m "hostA hostB" <user1@hostA user1@hostB> removed from the blocklist on lsfproxyd host <lsfproxydhost1> <user1@hostA user1@hostB> removed from the blocklist on lsfproxyd host <lsfproxydhost2>用于查看当前阻止哪些用户和主机的摘要的示例用法:$ badmin lsfproxyd blocklist lsfproxyd host - host1 All blocked: No Blocked users: user1 user2 Blocked hosts: - Blocked users@hosts: user4@exechost1 user3@exechost2 lsfproxyd host - host2 Unable to contact <host2> lsfproxyd host - host3 All blocked all: No Blocked users: user1 user2 Blocked hosts: - Blocked users@hosts: user4@exechost1 user3@exechost2 - mbddebug [-c class_name ...] [-l debug_level] [-f logfile_name] [-o] [-s log_queue_size]
- 设置 mbatchd 守护程序的消息日志级别,以在日志文件中包含其他信息。 您必须是 root 或 LSF 管理员才能使用此命令。
- -s 日志队列大小
- 指定 mbatchd 日志记录线程使用的日志记录队列中的最大条目数。 指定 100 到 500000 之间的整数。 此值将临时覆盖 lsf.conf 文件中 LSF_LOG_QUEUE_SIZE 参数的值。 日志记录队列包含要写入日志文件的消息。
如果在 lsf.conf 文件中定义了 LSF_LOG_THREAD=N 参数,那么将忽略 -s 选项。
请参阅 sbddebug 子命令以获取其他选项的说明。
对于 -c 选项,除了 sbddebug 子命令的有效日志类外, mdbdebug 子命令还具有以下有效日志类:- LC2_EST
- 基于模拟的估计量的日志消息。 不能使用 mbddebug 子命令来更改此日志类。
- LC2_G_FAIR
- 全局公平共享的日志消息。
- mbdhist [[-t time0, time1 ] [[-f 日志文件名 ]
- 显示 mbatchd 守护程序的历史事件。 事件描述 mbatchd 守护程序的启动和退出。
- -t 时间0, 时间1
仅显示从 time0 到 time1期间发生的事件。 请参阅 bhist 命令以获取时间格式。 缺省值是显示事件日志文件中的所有队列事件。
- -f 日志文件名
- 指定事件日志文件的文件名。 指定绝对路径名或相对路径名。 缺省值是使用 LSF 系统中的当前事件日志文件: LSB_SHAREDIR/cluster_name/logdir/lsb.events。 选项 -f 对于脱机分析很有用。
如果使用 mbdrestart 子命令的 -C 选项指定了管理员注释,那么 mbdhist 子命令将显示注释文本。
- mbdrestart [-C comment] [-v] [-f] [-p| -s]
- 动态重新配置 LSF 并重新启动 mbatchd 和 mbschd 守护程序。 启用 bconf 命令的实时配置 (在 lsf.conf文件中定义了 LSF_LIVE_CONFDIR 参数) 时, badmin mbdrestart 命令将使用 bconf 命令生成的配置文件。
将检查配置文件中是否存在错误,并将结果打印到 stderr。 如果找不到错误,那么将重新装入配置文件,重新启动 mbatchd 和 mbschd 守护程序,并重放 lsb.events 文件中的事件以恢复最后一个 mbatchd 守护程序的运行状态。 当 mbatchd 守护程序重新启动时,它不可用于服务请求。
如果发现警告错误,那么 badmin 命令会提示您显示详细消息。 如果发现不可恢复错误,那么 mbatchd 和 mbschd 守护程序不会重新启动,并且 badmin 命令将退出。
重要信息: 如果 lsb.events 文件较大,或者许多作业正在运行,那么重新启动 mbatchd 守护程序可能需要几分钟时间。 如果仅需要重新装入配置文件,请使用 badmin reconfig 命令。- -C 注释
- 将注释文本作为管理员注释记录记录到 lsb.events 文件中。 注释字符串的最大长度为 512 个字符。
- -v
- 详细方式。 显示有关配置文件状态的详细消息。 来自配置检查的所有消息都将打印到 stderr。
- -f
- 如果配置文件不包含不可恢复的错误,那么禁用交互并强制重新配置和 mbatchd 守护程序重新启动以继续。
- -p
- 允许并行 mbatchd 守护程序重新启动。 重新启动派生子 mbatchd 守护进程以帮助最大限度减少 LSF的停机时间。 LSF 启动新的或子的 mbatchd 守护进程以读取配置文件并重放事件文件。 旧的 mbatchd 守护程序可以响应客户机命令,处理作业调度和状态更新,分派新事件以及将新事件更新到事件文件。 重新启动完成后,子代将接管为 mbatchd 守护程序,而旧的 mbatchd 守护程序将终止。
此选项是 mbatchd 守护程序重新启动的缺省行为。 使用 -s 选项来使用串行 mbatchd 守护程序重新启动。
- -s
- 允许串行 mbatchd 守护程序重新启动。 使用此选项可更改缺省 mbatchd deamon 行为,即并行重新启动。
- mbdtime [[-l timing_level ] [[-f logfile_name ] [-o]
- 设置 mbatchd 守护程序的计时级别,以在日志文件中包含额外的计时信息。 您必须是 root 或 LSF 管理员才能使用此命令。
- perflog [[-t sample_period] [[-f logfile_name] [[-d duration] | [-o]]
- 此功能对于对集群可能由于 mbatchd 守护程序性能问题而无法响应的大型集群进行故障诊断很有用。 在此类情况下, mbatchd 守护程序在处理大量请求 (例如,作业提交,作业状态请求和作业) 方面的性能可能较慢rusage请求。
- -t
- 指定性能指标收集的采样周期 (以分钟计)。 缺省值为 5 分钟。
- -f
- 指定要在其中保存信息的日志文件。 它是文件名或完整路径文件名。 如果未指定日志文件的路径,那么将使用其缺省路径。 日志文件的缺省名称为 mbatchd.perflog.<host_name>。
日志文件的所有者是在 LSF_ADMIN 参数中指定的用户。 日志文件许可权与 mbatchd 守护程序日志许可权相同。 每个人都具有读和执行访问权,但 LSF_ADMIN 用户具有写,读和执行访问权。
- -d
- 保留日志记录性能指标数据的持续时间 (以分钟为单位)。 mbatchd 守护程序不会在持续时间到期后记录消息,或者直到您手动将其停止,重新启动 mbatchd 守护程序或使用 reconfig mbatchd 命令重新配置。 持续时间的缺省值为无限。 缺省情况下,将始终记录性能度量数据)。
- -o
- 关闭动态性能指标日志记录 (停止日志记录)。 如果启用了 LSB_ENABLE_PERF_METRICS_LOG 参数,那么日志记录将返回到静态配置。
- perfmon 启动 [sample_period] | setperiod sample_period | stop | view [-json]
- 动态启用和控制调度程序性能指标收集。
收集和记录性能指标数据可能会影响 LSF的性能。 较小的采样周期可能会导致 lsb.streams 文件增长更快。
将在每个采样周期中收集并记录以下度量值:- mbatchd 处理的查询数
- 每个作业,队列和主机的查询数。 (bjobs, bqueues和 bhosts 命令以及其他守护程序请求)
- 已提交的作业数 (分为作业提交请求和已提交的作业)
- 分派的作业数
- 重新排序的作业数; 即复用已完成作业的资源分配的作业数 ( lsb.params 或 lsb.queues 文件中的 RELAX_JOB_DISPATCH_ORDER 参数)
- 已完成的作业数
- 发送到远程集群的作业数
- 集群中接受的作业数
- mbatchd 守护程序使用的文件描述符
- 将收集以下调度程序性能指标:
- 较短的调度时间间隔意味着作业处理速度更快
- 正在使用的作业的不同资源需求模式数,这可能导致不同的候选主机组。 需要的匹配主机越多,查找这些主机所需的时间越长,这意味着调度会话的时间越长。
- 根据资源需求和不同的调度策略将作业放入其中的存储区 (组) 数。 更多存储区意味着更长的调度会话。
- 开始 [sample_period]
- 动态启动性能指标收集,并为性能指标收集指定可选采样周期 (以秒计)。
如果未指定采样周期,那么将使用 lsb.params 文件的 SCHED_METRIC_SAMPLE_PERIOD 参数中设置的缺省周期。
- 停止
- 动态停止性能指标收集。
- 视图
- 显示当前采样周期的性能指标信息。
- setperiod 采样周期
- 设置新的采样周期 (以秒为单位)。
- qact [-C comment] [queue_name ... | 全部]
- 激活已取消激活的队列,以便从队列分派已提交的作业。 如果指定了保留字 all ,那么 qact 子命令将激活所有队列。 如果未指定队列名称,那么系统default队列已激活。 仅当队列处于激活状态时,才能分派队列中的作业。此命令无法重新激活由其运行窗口取消激活的队列。
- -C 评论
- 将注释的文本作为管理员注释记录记录到 lsb.events 文件中。 注释字符串的最大长度为 512 个字符。
- qclose [-C comment] [queue_name ... | 全部]
- 关闭队列以防止将作业提交到队列。 如果指定了保留字 all ,那么 qclose 子命令将关闭所有队列。 如果未指定队列名称,那么系统default队列已关闭。 如果队列已关闭,那么该队列不接受已提交的 LSF 作业。
- -C 评论
- 将文本作为管理员注释记录记录记录到 lsb.events。 注释字符串的最大长度为 512 个字符。
- qhist [-t time0,time1] [-f logfile_name] [queue_name ...] ..
- 显示指定队列的历史事件,如果未指定队列,那么显示所有队列的历史事件。 队列事件包括队列打开,关闭,激活和停用。
- -t 时间0, 时间1
仅显示从 time0 到 time1期间发生的事件。 请参阅 bhist 命令以获取时间格式。 缺省值是显示事件日志文件中的所有队列事件。
- -f 日志文件名
指定事件日志文件的文件名。 可以指定绝对路径名或相对路径名。 缺省值是使用 LSF 系统中的当前事件日志文件: LSB_SHAREDIR/cluster_name/logdir/lsb.events。 选项 -f 对于脱机分析很有用。
如果使用队列控制子命令 qclose, qopen, qact和 qinact的 -C 选项指定了管理员注释,那么 qhist 子命令将显示注释文本。
- qinact [-C comment] [queue_name ... | 全部]
- 取消激活队列以阻止从队列分派已提交的作业。 如果指定了保留字 all ,那么将取消激活所有队列。 如果未指定队列名称,那么系统default队列已取消激活。 如果队列已取消激活,那么无法分派该队列中的作业。
- -C 评论
- 将文本作为管理员注释记录记录记录到 lsb.events 文件中。 注释字符串的最大长度为 512 个字符。
- qopen [-C comment] [queue_name ... | 全部]
- 打开已关闭的队列,以便用户可以向其提交作业。 如果指定了保留字 all ,那么 qopen 子命令将打开所有队列。 如果未指定队列名称,那么系统default队列已打开。 仅当队列处于打开状态时,它才接受已提交的 LSF 作业。
- -C 评论
- 将注释文本作为管理员注释记录记录记录到 lsb.events。 注释字符串的最大长度为 512 个字符。
- 退出
- 退出 badmin 命令会话。
- rc error [-t 天数d | 小时h | <minutes>m] [-p "供应商 ..."]
- 显示来自主机提供程序的 LSF 资源连接器错误消息。 这些错误由必须在主机上运行的第三方 mosquitto 消息队列应用程序提供。
- -t <天数> 天 | <小时数> 小时 | <分钟数> 分钟
- 指定检索错误消息的最早时间。注: 指定天数时, badmin 会在午夜从此时检索消息。 例如,运行 badmin rc error -t 1d时, badmin 从今天午夜检索消息,而运行 badmin rc error -t 2d时, badmin 从昨天午夜检索消息。
- -p 提供商……
- 指定要从中检索错误消息的主机提供程序。 使用空格来分隔多个主机提供程序。
- rc view [-json] [-c "实例 | 策略 | 模板..."] [[-p " 提供商..."]
- 显示来自主机提供程序的 LSF 资源连接器信息。
- -json
- 从修复包 15 开始,当使用 [-json] 选项时,将以 JSON 格式显示输出结果。
- -c "实例 | 策略 | 模板..."
- 指定是否查看有关实例,策略或模板的信息。 使用空格来分隔多种类型的信息。 缺省情况下,此命令仅显示有关实例的信息。 如果选择了带有 -c 选项的 policies ,那么将忽略 -p 选项,因为将显示所有策略,而不仅仅是针对指定的提供程序。
- -p 提供商……
- 指定要从中查看信息的主机提供程序。 使用空格来分隔多个主机提供程序。 如果选择了带有 -c 选项的 policies ,那么将忽略 -p 选项,因为将显示所有策略,而不仅仅是针对指定的提供程序。
- 重新配置 [-v] [-f]
- 动态重新配置 LSF。
将检查配置文件中是否存在错误,并向 stderr显示结果。 如果在配置文件中找不到错误,那么将向 mbatchd 守护程序发送重新配置请求,并重新装入配置文件。 启用 bconf 命令的实时配置 (在 lsf.conf文件中定义了 LSF_LIVE_CONFDIR 参数) 时, badmin reconfig 命令将使用 bconf 命令生成的配置文件。
重要信息: reconfig 子命令不会重新启动 mbatchd 守护程序,也不会重放 lsb.events 文件。 要重新启动 mbatchd 守护程序并重放 lsb.events 文件,请使用 badmin mbdrestart 命令。使用此命令时,当重新配置文件被重新装入时, mbatchd 守护程序可用于服务请求。 自系统引导或上次重新配置生效以来进行的配置更改。
如果发现警告错误,那么 badmin 命令会提示您显示详细消息。 如果发现不可恢复的错误,那么重新配置将失败,并且 badmin 命令将退出。
如果将主机添加到队列或主机组或计算单元,那么在重新配置之前提交的作业无法识别新主机。 如果要识别新主机,必须使用命令 badmin mbdrestart。
在使用 badmin reconfig 命令之后,由队列确定的资源需求不再适用于正在运行的作业。 例如,如果在队列中更改 RES_REQ 参数并重新配置集群,那么运行作业的先前队列级别资源需求将丢失。
- -v
- 详细方式。 显示有关配置文件状态的详细消息。 如果没有此选项,那么缺省情况是显示配置文件检查的结果。 配置文件检查中的所有消息都将打印到 stderr。
- -f
- 如果配置文件不包含不可恢复的错误,那么将禁用交互并继续进行重新配置。
- sbddebug [-c 类名 ...] [-l debug_level] [-f 日志文件名] [-o] [主机名 ...]
- 设置 sbatchd 守护程序的消息日志级别,以在日志文件中包含其他信息。 你一定是root或 LSF 管理员使用此命令。
在 LSF 多集群功能中,只能为同一集群中的主机设置调试级别。 例如,对于 clusterB中的主机,无法从 clusterA 中的主机设置调试或计时级别。 您需要位于 clusterB 中的主机上,以便为 clusterB 主机设置调试或计时级别。
如果在不使用任何选项的情况下使用该命令,那么将使用以下缺省值:- class_name=0
- 不记录其他类。
- debug_level=0
- LOG_DEBUG参数 LSF_LOG_MASK中的级别。
- logfile_namedaemon_name.log.host_name
- LSF 系统日志文件目录中的 LSF 系统日志文件,格式为daemon_name.log.host_name.
- host_name=local_host
- 从中提交命令的主机。
- -c 类名...
- 指定要记录其调试消息的软件类。注: 类也列示在 lsf.h 头文件中。
缺省情况下,不会记录其他类 (类名 0)。
支持以下日志类:- LC_ADVRSV 和 LC2_ADVRSV
- 记录预先预留修改。
- LC2_AFFINITY
- 与亲缘关系相关的日志消息。
- LC_AFS 和 LC2_AFS
- 记录 AFS 消息。
- LC_AUTH 和 LC2_AUTH
- 日志认证消息。
- LC_CHKPNT 和 LC2_CHKPNT
- 记录检查点消息。
- LC_COMM 和 LC2_COMM
- 记录通信消息。
- LC_DCE 和 LC2_DCE
- 与 DCE 支持相关的日志消息。
- LC_EEVENTD 和 LC2_EEVENTD
- 记录 eeventd 守护程序消息。
- LC_ELIM 和 LC2_ELIM
- 记录 ELIM 消息。
- LC_EXEC 和 LC2_EXEC
- 记录作业执行的重要步骤。
- LC_FAIR
- 记录公平共享策略消息。
- LC_FILE 和 LC2_FILE
- 日志文件传输消息。
- LC2_GUARANTEE
- 与保证 SLA 相关的日志消息。
- LC_HANG 和 LC2_HANG
- 标记程序可能挂起的位置。
- LC_JARRAY 和 LC2_JARRAY
- 记录作业数组消息。
- LC_JLIMIT 和 LC2_JLIMIT
- 记录作业槽限制消息。
- LC_LOADINDX 和 LC2_LOADINDX
- 日志装入索引消息。
- LC_M_LOG 和 LC2_M_LOG
- 记录多事件日志消息。
- LC_MEMORY 和 LC2_MEMORY
- 与 MEMORY 分配相关的日志消息。
- LC_MPI 和 LC2_MPI
- 记录 MPI 消息。
- LC_MULTI 和 LC2_MULTI
- 与 LSF 多集群功能相关的日志消息。
- LC_PEND 和 LC2_PEND
- 与作业暂挂原因相关的日志消息。
- LC_PERFM 和 LC2_PERFM
- 记录性能消息。
- LC_PIM 和 LC2_PIM
- 记录 PIM 消息。
- LC_PREEMPT 和 LC2_PREEMPT
- 记录抢占策略消息。
- LC2_RC
- 记录资源连接器消息。
- LC_resource 和 LC2_RESOURCE
- 与资源代理程序相关的日志消息。
- LC_RESREQ 和 LC2_RESREQ
- 记录资源需求消息。
- LC_SCHED 和 LC2_SCHED
- 与批处理调度程序相关的日志消息。
- LC_SIGNAL 和 LC2_SIGNAL
- 记录与信号相关的消息。
- LC_SYS 和 LC2_SYS
- 记录系统调用消息。
- LC_TRACE 和 LC2_TRACE
- 记录重要的程序执行步骤。
- LC_XDR 和 LC2_XDR
- 记录 XDR 传输的所有内容。
- LC_XDRVERSION 和 LC2_XDRVERSION
- XDR 版本的日志消息。
- -l 调试级别
- 指定调试消息中的详细信息级别。 数字越高,记录的详细信息越多。 较高级别包括所有较低级别。
缺省设置为“0(参数 LSF_LOG_MASK中的LOG_DEBUG 级别)
支持以下值:- 0
- lsf.conf 文件中参数 LSF_LOG_MASK 的 LOG_DEBUG 级别。0是缺省值。
- 1
- LOG_DEBUG1 级别,用于扩展日志记录。 更高的级别包括更低的日志记录级别。 例如, LOG_DEBUG1 包含 LOG_DEBUG 级别。
- 2
- LOG_DEBUG2 级别,用于扩展日志记录。 更高的级别包括更低的日志记录级别。 例如, LOG_DEBUG2 包含 LOG_DEBUG1 和 LOG_DEBUG 级别。
- 3
- LOG_DEBUG3 级别,用于扩展日志记录。 更高的级别包括更低的日志记录级别。 例如, LOG_DEBUG3 包含 LOG_DEBUG2, LOG_DEBUG1和 LOG_DEBUG 级别。
- -f 日志文件名
- 指定要将调试消息记录到其中的文件的名称。 可以指定具有或不具有完整路径的文件名。
如果指定了没有路径的文件名,那么该文件将保存在 LSF 系统日志目录中。
创建的文件的名称具有以下格式:logfile_name.daemon_name.log.host_name在 UNIX 和 Linux上,如果指定的路径无效,那么将在 /tmp 目录中创建日志文件。
在 Windows 上,如果指定的路径无效,那么不会创建日志文件。
缺省情况下,将使用 LSF 系统日志文件目录中的当前 LSF 系统日志文件。
- -o
- 关闭临时调试设置并将其重置为守护程序启动状态。 消息日志级别将重置回 LSF_LOG_MASK 的值,而类将重置为 LSB_DEBUG_MBD的值 LSB_DEBUG_SBD。
日志文件也会重置回缺省日志文件。
- 主机名...
- 可选。 在指定的一个或多个主机上设置调试设置。
缺省值为本地主机 (从中提交命令的主机)。
- sbdtime [-l timing_level] [-f logfile_name] [-o] [host_name ...] ..
- 设置 sbatchd 守护程序的计时级别,以在日志文件中包含额外的计时信息。 你一定是root或 LSF 管理员使用此命令。
在 LSF 多集群功能中,只能为同一集群中的主机设置计时级别。 例如,对于 clusterB中的主机,无法从 clusterA 中的主机设置调试或计时级别。 您需要位于 clusterB 中的主机上,以便为 clusterB 主机设置调试或计时级别。
如果在不使用任何选项的情况下使用该命令,那么将使用以下缺省值:- timing_level=no
- 记录计时信息。
- logfile_name=current
- LSF 系统日志文件目录中的 LSF 系统日志文件,格式为daemon_name.log.host_name.
- host_name=local
- 从中提交命令的主机。
- -l 时序级别
- 指定日志文件中包含的计时信息的详细信息。 计时消息指示软件中功能的执行时间,并以毫秒为单位记录。
支持以下值: 1|2|3|4|5
数字越高,软件中已计时且其执行时间记录的功能就越多。 较低的数字包括更常见的软件功能。 较高级别包括所有较低级别。
缺省情况下,不会记录任何计时信息。
- -f 日志文件名
- 指定要将计时消息记录到其中的文件的名称。 可以指定具有或不具有完整路径的文件名。
如果指定了没有路径的文件名,那么该文件将保存在 LSF 系统日志文件目录中。
创建的文件的名称具有以下格式:logfile_name.daemon_name.log.host_name在 UNIX 和 Linux上,如果指定的路径无效,那么将在 /tmp 目录中创建日志文件。
在 Windows 上,如果指定的路径无效,那么不会创建日志文件。
注: 计时和调试消息都记录在相同的文件中。缺省值是 LSF 系统日志文件目录中的当前 LSF 系统日志文件,格式为 daemon_name.log.host_name。
- -o
- 可选。 关闭临时计时设置并将其重置为守护程序启动状态。 计时级别将重置为相应守护程序 (LSB_TIME_MBD, LSB_TIME_SBD) 的参数值。
日志文件也会重置回缺省日志文件。
- 主机名...
- 在指定的一个或多个主机上设置计时级别。
缺省值是从中提交命令的本地主机)。
- schddebug [[-c class_name...] [[-l debug_level ] [[-f logfile_name ] [-o] [-s log_queue_size ]
- 设置 mbschd 演示的消息日志级别,以在日志文件中包含其他信息。 你一定是root或 LSF 管理员使用此命令。
- -s 日志队列大小
- 指定 mbschd 守护程序日志记录线程所使用的日志记录队列中的最大条目数。 指定 100 到 500000 之间的整数。 日志记录队列包含要写入日志文件的消息。
如果在 lsf.conf 文件中定义了 LSF_LOG_THREAD=N 参数,那么将忽略此选项。
请参阅 sbddebug 子命令以获取其他选项的说明。
- schdtime [[-l timing_level ] [-f][-o]
- 设置 mbschd 守护程序的计时级别,以在日志文件中包含额外的计时信息。 您必须是 root 或 LSF 管理员才能使用此命令。
请参阅 sbdtime 子命令的描述以获取选项的说明。
- 安全视图 [-v]
- 显示 LSF 安全性机制的组件配置。
- -v
- 详细方式。 显示 LSF 安全组件的当前配置的详细描述。 如果当前设置不安全,那么还会显示最佳配置。
- showconf mbd | [sbd [ 主机名... | 全部] | gpd ]
- 显示影响
mbatchd,sbatchd和gpolicyd守护程序的所有已配置参数及其在 lsf.conf 或 ego.conf 文件中设置的值。在 LSF 多集群功能中, badmin showconf 命令仅显示本地集群上的守护程序的参数。
从 管理 候选主机运行 badmin showconf 命令将到达集群中的所有服务器主机。 从仅 服务器主机运行 badmin showconf 命令可能无法访问其他仅 服务器主机。
badmin showconf 命令仅显示 LSF使用的值。
badmin showconf 命令从定义 EGO_MASTER_LIST 参数的任何位置显示该参数的值。 您可以在 lsf.conf 文件中定义 LSF_MASTER_LIST 参数或 EGO_MASTER_LIST 参数。 如果在 LSF 集群中启用了 EGO ,那么 LIM 首先读取 lsf.conf 文件,然后读取 ego.conf 文件。 仅当未在 ego.conf 文件中定义 EGO_MASTER_LIST 参数时,才会显示 LSF_MASTER_LIST 参数的值。
例如,如果在 lsf.conf文件中定义 LSF_MASTER_LIST 参数,在 ego.conf 文件中定义 EGO_MASTER_LIST 参数,那么 badmin showconf 命令将显示 EGO_MASTER_LIST 参数的值。
如果在 LSF 集群中启用了 EGO ,并且您在 lsf.conf 文件中定义了 LSF_MASTER_LIST 参数,在 ego.conf 文件中定义了 EGO_MASTER_LIST 参数,那么 badmin showconf 命令将在 ego.conf 文件中显示 EGO_MASTER_LIST 参数的值。
如果 EGO 处于禁用状态,那么不会装入 ego.conf 文件,因此将显示 lsf.conf 文件中定义的参数。
- 展示状态
- 显示有关整个集群的当前 LSF 运行时信息,包括有关主机,作业,用户,用户组, 基于模拟的估计, 和 mbatchd 守护程序启动和重新配置的信息。
另请参阅
bhosts, bqueues, lsb.hosts, lsb.params, lsb.queues, lsf.cluster, lsf.conf, sbatchd, mbatchd, mbschd