BAdmin

badmin コマンドは、 LSFの管理ツールです。

概要

badmin サブコマンド オプション
badmin [-h | -V]

説明

badmin コマンドは、 LSFを制御およびモニターするための一連のサブコマンドを提供します。 サブコマンドを含めない場合は、badminコマンドは、標準入力からのサブコマンドのプロンプトを出します。

各サブコマンドに関する情報は、 -h オプションを介して入手できます。

badmin サブコマンドには、特権サブコマンドと非特権サブコマンドが含まれます。 特権サブコマンドを実行できるのは、root 管理者または LSF 管理者のみです。 以下のサブコマンドが特権を持っています。

  • diagnose
  • gpddebug
  • gpdrestart
  • gpdtime
  • hclose
  • hghostadd
  • hghostdel
  • hopen
  • hpower
  • lsfproxyd
  • mbddebug
  • mbdrestart
  • perflog
  • perfmon
  • qact
  • qclose
  • qinact
  • qopen
  • rc
  • reconfig
  • security

非 root ユーザーが特権コマンド hstartup を使用するように構成ファイル lsf.sudoers を設定する必要があります。

他のすべてのコマンドは非特権コマンドであり、どの LSF ユーザーでも使用できます。 lsf.conf ファイルに LSF_AUTH パラメーターが定義されていない場合は、特権ポートが使用されます。特権ポートを介して要求を送信する必要があるため、 badmin コマンドをインストールする必要があります。 のbadmin実行ファイルはsetuidフラグをオンにしてインストールされますの上

複数のホスト名を指定できるサブコマンドを使用する場合は、ホスト名を引用符で囲まないでください。

サブコマンドの概要

ckconfig [-v]
diagnose pending_jobID ...
diagnose -c jobreq [-f logfile_name] [-t xml | -t json]
diagnose -c lsfproxyd [[-f logfile_name] [-d 期間] | [-o]]
diagnose -c query [[-f logfile_name] [-d 期間] | [-o]]
gpdckconfig [-v]
gpddebug [-c class_name] [-l debug_level] [-f logfile_name] [-o]
gpdrestart [-v] [-f]
gpdtime [-l timing_level] [-f logfile_name] [-o]
hclose [-C comment] [-i "lock_id"] [host_name ... | host_group ... | compute_unit ... | all]
help [コマンド ...] | ? [command ...]
hghostadd [-C コメント] host_group | compute_unit | host_name [host_name ...]
hghostdel [-f] [-C コメント] host_group | compute_unit | host_name [host_name ...]
hhist [-t time0,time1] [-f logfile_name] [host_name ...]
hist [-t time0,time1] [-f logfile_name]
hopen [-C comment] [-i "lock_id ... | all"] [host_name ... | host_group ... | compute_unit ... | all]
hpower [suspend | resume] [-C コメント] [host_name ...]
lsfproxyd [[enable | disable] all | query | sub | other]] | status
lsfproxyd [[block | unblock] [all | -u " user1 user2 …"] [ -m "host1 host2 …"]]] | blocklist
mbddebug [-c class_name ...] [-l debug_level] [-f logfile_name] [-o] [-s log_queue_size]
mbdhist [-t time0,time1] [-f logfile_name]
mbdrestart [-C コメント] [-v] [-f] [-p | -s]
mbdtime [-l timing_level] [-f logfile_name] [-o]
perflog [-t sample_period] [-d 期間] [-f logfile_name] [-o]
perfmon start [sample_period] | stop | view | setperiod sample_period
qact [-C コメント] [queue_name ... | all]
qclose [-C コメント] [queue_name ... | all]
qhist [-t time0,time1] [-f logfile_name] [queue_name ...]
qinact [-C コメント] [queue_name ... | all]
qopen [-C コメント] [queue_name ... | all]
quit
rc error [-t d | 時間h | m] [-p " プロバイダー ..."]
rc view [ | | ... ] [ -c "instances policies templates"-p " provider... ] "
reconfig [-v] [-f]
sbddebug [-c class_name ...] [-l debug_level] [-f logfile_name] [-o] [host_name ...]
sbdtime [-l timing_level] [-f logfile_name] [-o] [host_name ...]
schddebug [-c class_name ...] [-l debug_level] [-f logfile_name] [-o] [-s log_queue_size]
schdtime [-l timing_level] [-f logfile_name] [-o]
security view [-v]
showconf mbd | [sbd [host_name ... | all] | gpd]
showstatus
-h
-V

オプション

サブコマンド
指定されたサブコマンドを実行します。 「使用法」セクションを参照してください。
-h
コマンドの使用法を stderr に出力して終了します。
-V
LSF リリース・バージョンを stderr に出力して終了します。

使用法

ckconfig [-v]
LSB_CONFDIR/cluster_name/configdir ディレクトリーにある LSF 構成ファイルを検査し、 LSF_ENVDIR/lsf.licensescheduler ファイルを検査します。

LSB_CONFDIR 変数は、 lsf.conf ファイル、 LSF_ENVDIR または /etc ( LSF_ENVDIR が定義されていない場合) で定義されます。

デフォルトでは、 badmin ckconfig コマンドは構成ファイル検査の結果のみを表示します。 警告エラーが検出されると、 badmin コマンドは詳細メッセージを表示するようにプロンプトを出します。
-v
Verbose モード。 構成ファイル検査に関する詳細なメッセージを stderrに表示します。
保留ジョブ ID の診断 ...
lsb.params ファイルに CONDENSE_PENDING_REASONS=Y が設定されている場合は、完全な保留理由リストを表示します。
badmin diagnose 1057
診断する-c求人要件[-fスナップショットファイル名] [-t xml | -t[json]
UNIX のみ。 スケジューラー・ジョブ・バケット情報の現在の内容を、生データとして XML または JSON スナップショット・ファイルに保存します。

ジョブは、リソース要件およびさまざまなスケジューリング・ポリシーに基づいて、スケジューリング・バケットに入れられます。 内容をスナップショット・ファイルに保存すると、ファイルを解析したり、その内容に対して単純なテキスト検索を実行したりすることで、データ分析に役立ちます。

この機能は、スケジューラーのパフォーマンスへの突然の大きな影響を調べる場合に役立ちます。 スナップショット・ファイルを使用して、多数のバケットまたは大きな属性値を持つユーザーを識別します。

以下のオプションを使用できます。

-c求人要件
必須。
-fファイル名
情報を保存するスナップショット・ファイルを指定します。 これは、 DIAGNOSE_LOGDIR ディレクトリーにあるファイル名か、絶対パス・ファイル名のいずれかです。 指定されたスナップショット・ファイルが存在する場合は、現行情報で上書きされます。

スナップショット・ファイルのデフォルト名は jobreq_<hostname>_<dateandtime>.<format>です。ここで、 <format> は、指定されたスナップショット・ファイルのフォーマットに応じて、 xml または jsonです。

ログ・ファイルの所有者は、 LSF_ADMIN パラメーターで指定されたユーザーです。 ログ・ファイル・アクセス権は、 mbatchd デーモン・ログ・アクセス権と同じです。 すべてのユーザーには読み取り権限と実行権限がありますが、 LSF_ADMIN 所有者には書き込み権限、読み取り権限、および実行権限があります。

-t xml | -t json
スナップショット・ファイルのフォーマットを指定します。 スナップショット・ファイルを XML 形式にするには -t xml を指定し、スナップショット・ファイルを JSON 形式にするには -t json を指定します。

スナップショット・ファイルのデフォルト・フォーマットは XML で、スナップショット・ファイルの拡張子は .xmlです。 スナップショット・ファイルが JSON 形式の場合、スナップショット・ファイルの拡張子は .jsonです。

診断する-c lsfプロキシ[-fログファイル名] [-d] | [-o]]
この機能は、予期しない lsfproxyd 負荷 (フィックスパック 14 以降の LSF レート・リミッター の場合) が原因で、クラスターが要求に応答する速度が低下したり失敗したりする場合に役立ちます。 例えば、多くの bjobs コマンド照会は、高いネットワーク負荷を引き起こし、 lsfproxyd デーモンの応答を妨げる可能性があります。 オプションを指定してこのコマンドを実行すると、 lsfproxyd デーモンは照会ソース情報をログ・ファイルにダンプできます。

ログ・ファイルには、トラブルシューティングを容易にするために、照会のソースに関する情報が表示されます。 ログ・ファイルには、これらの要求を行ったユーザー、要求の送信元、および照会のデータ・サイズが示されます。

また、 lsb.params ファイルの ENABLE_DIAGNOSE パラメーターを有効にして、クラスターの始動直後に照会情報全体をログに記録することにより、この機能を構成することもできます。 ただし、コマンドからの動的設定は、静的パラメーター設定をオーバーライドします。 また、照会情報を追跡するために指定した期間が経過すると、静的診断設定が有効になります。

以下のオプションを使用して、動的に時刻を設定したり、ログ・ファイルを指定したり、 lsfproxyd デーモンが情報を収集できるようにしたりすることができます。

-c lsfプロキシ
必須。
-f
情報を保存するログ・ファイルを指定します。 これは、ファイル名または絶対パス・ファイル名のいずれかです。

ログ・ファイルのデフォルト名は query_info.queryproxylog.hostnameです。

ログ・ファイルの所有者は、 LSF_ADMIN パラメーターで指定されたユーザーです。 ログ・ファイル許可は、 lsfproxyd デーモン・ログ許可と同じです。 すべてのユーザーには読み取り権限と実行権限がありますが、 LSF_ADMIN ユーザーには書き込み権限、読み取り権限、および実行権限があります。

lsb.params ファイルにログ・ファイルを指定し、後でコマンド行に別のログ・ファイルを指定すると、コマンド行のログ・ファイルが優先されます。 ロギングは、指定された期間が経過するまで、または動的ロギングを停止するまで継続します。 その後、静的ログ・ファイルの場所に切り替えます。

-d
照会情報を追跡するために指定する期間 (分単位)。 lsfproxyd デーモンは、所要時間が経過した後、または手動で停止、再始動 ( lsfproxyd コマンドを使用)、または再構成 ( badmin reconfig コマンドを使用) するまで、静的設定に戻ります。 この期間のデフォルト値は無限です。 デフォルトでは、照会情報は常にログに記録されます。
-o
動的診断をオフにします (ロギングを停止します)。 ENABLE_DIAGNOSE=lsfproxyd パラメーターが構成されている場合は、静的構成に戻ります。
診断する-cクエリ[-fログファイル名] [-d] | [-o]]
この機能は、予期しない mbatchd 照会ロードが原因でクラスターの要求への応答が遅くなったり、失敗したりする場合に役立ちます。 例えば、多くの bjobs コマンド照会は、高いネットワーク負荷を引き起こし、 mbatchd デーモンの応答を妨げる可能性があります。 オプションを指定してこのコマンドを実行すると、 mbatchd デーモンは照会ソース情報をログ・ファイルにダンプできます。

ログ・ファイルには、トラブルシューティングを容易にするために、照会のソースに関する情報が表示されます。 ログ・ファイルには、これらの要求を行ったユーザー、要求の送信元、および照会のデータ・サイズが示されます。

また、 lsb.params ファイル内の DIAGNOSE_LOGDIR パラメーターと ENABLE_DIAGNOSE パラメーターを有効にして、クラスターの始動直後に照会情報全体をログに記録することにより、この機能を構成することもできます。 ただし、コマンドからの動的設定は、静的パラメーター設定をオーバーライドします。 また、照会情報を追跡するために指定した期間が経過すると、静的診断設定が有効になります。

以下のオプションを使用して、動的に時刻を設定したり、ログ・ファイルを指定したり、 mbatchd デーモンが情報を収集できるようにしたりすることができます。

-cクエリ
必須。
-f
情報を保存するログ・ファイルを指定します。 これは、 DIAGNOSE_LOGDIR ディレクトリーにあるファイル名か、絶対パス・ファイル名のいずれかです。

ログ・ファイルのデフォルト名は query_info.querylog.<host_name>です。

ログ・ファイルの所有者は、 LSF_ADMIN パラメーターで指定されたユーザーです。 ログ・ファイル許可は、 mbatchd デーモン・ログ許可と同じです。 すべてのユーザーには読み取り権限と実行権限がありますが、 LSF_ADMIN ユーザーには書き込み権限、読み取り権限、および実行権限があります。

lsb.params ファイルにログ・ファイルを指定し、後でコマンド行に別のログ・ファイルを指定すると、コマンド行のログ・ファイルが優先されます。 ロギングは、指定された期間が経過するまで、または動的ロギングを停止するまで継続します。 その後、静的ログ・ファイルの場所に切り替えます。

-d
照会情報を追跡するために指定する期間 (分単位)。 mbatchd デーモンは、所要時間が経過した後、または手動で停止、再始動 ( badmin mbdrestart コマンドを使用)、または再構成 ( badmin reconfig コマンドを使用) するまで、静的設定に戻ります。 この期間のデフォルト値は無限です。 デフォルトでは、照会情報は常にログに記録されます。
-o
動的診断をオフにします (ロギングを停止します)。 ENABLE_DIAGNOSE=query パラメーターが構成されている場合は、静的構成に戻ります。
gpdckconfig [-v]
LSB_CONFDIR/cluster_name/configdir ディレクトリーにあるグローバル・ポリシー構成ファイル lsb.globalpolicies を検査します。

LSB_CONFDIR 変数は、 lsf.conf ファイル、 LSF_ENVDIR または /etc ( LSF_ENVDIR が定義されていない場合) で定義されます。

デフォルトでは、 badmin gpdckconfig コマンドは構成ファイル検査の結果のみを表示します。 警告エラーが検出されると、 badmin コマンドは詳細メッセージを表示するようにプロンプトを出します。

badmin gpdckconfig コマンドは、グローバル・ポリシー・デーモン・クラスター (GPD クラスター) 内の マネジメント ・ホストまたは マネジメント 候補ホストでのみ実行できます。

-v

Verbose モード。 構成ファイル検査に関する詳細なメッセージを stderrに表示します。

gpdd バグ[-cクラス名...] [-lデバッグレベル] [-fログファイル名] [-o]
gpolicyd デーモンのメッセージ・ログ・レベルを設定して、ログ・ファイルに追加情報を組み込みます。 その必要があります。rootまたは LSF 管理者がこのコマンドを使用します。
オプションを指定せずにコマンドを使用すると、以下のデフォルト値が使用されます。
class_name
未定義 (追加のクラスはログに記録されません)。
debug_level=0
指定されたとおりですが、LOG_DEBUGLSF_LOG_MASK パラメーターのレベル。
logfile_name
未定義 ( LSF システム・ログ・ファイル・ディレクトリー内の LSF システム・ログ・ファイル。以下の形式)gpolicyd.log.host_name).
-cクラス名...
デバッグ・メッセージをログに記録するソフトウェア・クラスを指定します。

デフォルトでは、 class_name は定義されず、追加のクラスはログに記録されません。

class_name の形式は、クラスの名前、またはスペースで区切られ、引用符で囲まれたクラス名のリストです。 クラスは、以下にもリストされています。lsf.hヘッダー・ファイル。

以下のログ・クラスがサポートされています。
LC_AUTH
認証メッセージをログに記録します。
LC_COMM
通信メッセージをログに記録します。
LC_SYS
システム呼び出しメッセージをログに記録します。
LC_TRACE
重要なプログラム・ウォーク・ステップを記録します。
LC_XDR
XDR によって転送されたすべてをログに記録します。
LC_XDRVERSION
XDR バージョンのログ・メッセージ。
LC2_G_FAIR
グローバルフェア・シェア・メッセージをログに記録します。
-lデバッグレベル
デバッグ・メッセージの詳細レベルを指定します。 数値が大きいほど、ログに記録される詳細度が高くなります。 上位レベルには、すべての下位レベルが含まれます。
debug_level には、以下の値があります。
デフォルト:0
パラメーター LSF_LOG_MASKLOG_DEBUG レベル。
0
lsf.conf ファイル内のパラメーター LSF_LOG_MASKLOG_DEBUG レベル。
1
拡張ロギングの LOG_DEBUG1 レベル。 より高いレベルには、より低いロギング・レベルが含まれます。 例えば、 LOG_DEBUG1 レベルには LOG_DEBUG レベルが含まれます。
2
拡張ロギングの LOG_DEBUG2 レベル。 より高いレベルには、より低いロギング・レベルが含まれます。 例えば、 LOG_DEBUG2 レベルには、 LOG_DEBUG1 レベルと LOG_DEBUG レベルが含まれます。
3
拡張ロギングの LOG_DEBUG3 レベル。 より高いレベルには、より低いロギング・レベルが含まれます。 例えば、 LOG_DEBUG3 レベルには、 LOG_DEBUG2LOG_DEBUG1、および LOG_DEBUG の各レベルが含まれます。
-fログファイル名
デバッグ・メッセージが記録されるファイルの名前を指定します。 絶対パスの有無にかかわらず、ファイル名を指定できます。

パスなしでファイル名を指定すると、ファイルは LSF システム・ログ・ディレクトリーに保存されます。

作成されるファイルの名前は、以下の形式になります。

logfile_name.gpolicyd.log.host_name

UNIX では、指定されたパスが有効でない場合、ログ・ファイルは /tmp ディレクトリーに作成されます。

Windows では、指定されたパスが無効な場合、ログ・ファイルは作成されません。

デフォルトでは、 logfile_name は、 LSF システム・ログ・ファイル・ディレクトリー内の現行 LSF システム・ログ・ファイルです。

-o
一時デバッグ設定をオフにして、デーモンの開始状態にリセットします。 メッセージ・ログ・レベルは LSF_LOG_MASK の値にリセットされ、クラスは LSB_DEBUG_GPDの値にリセットされます。

ログ・ファイルもデフォルトのログ・ファイルにリセットされます。

gpd再起動[-v] [-f]
LSF グローバル・ポリシーを動的に再構成し、 gpolicyd デーモンを再始動します。

グローバル・ポリシー構成ファイル lsb.globalpolicies にエラーがないか検査され、結果が stderrに出力されます。 エラーが見つからない場合は、 lsb.globalpolicies ファイルが再ロードされ、 gpolicyd デーモンが再始動されます。

警告エラーが検出されると、 badmin コマンドは詳細メッセージを表示するようにプロンプトを出します。 リカバリー不能エラーが検出されると、 gpolicyd デーモンは再始動されず、 badmin コマンドは終了します。

badmin gpdrestart コマンドは、グローバル・ポリシー・デーモン・クラスター (GPD クラスター) 内の マネジメント ・ホストまたは マネジメント 候補ホストでのみ実行できます。

-v
Verbose モード。 構成ファイルの状況に関する詳細なメッセージを表示します。 構成検査からのすべてのメッセージは、 stderrに出力されます。
-f
構成ファイルにリカバリー不能エラーが含まれていない場合は、対話を使用不可にして、 gpolicyd デーモンの再始動を続行します。
gpdtime [-lタイミングレベル] [-fログファイル名] [-o]
gpolicyd デーモンのタイミング・レベルを設定して、追加のタイミング情報をログ・ファイルに含めます。 その必要があります。rootまたは LSF 管理者がこのコマンドを使用します。
オプションを指定せずにコマンドを使用すると、以下のデフォルト値が使用されます。
timing_level
未定義 (タイミング情報が記録されます)。
logfile_name
未定義 ( LSF システム・ログ・ファイル・ディレクトリー内の現行の LSF システム・ログ・ファイル。形式は次のとおりです。gpolicyd.log.host_name).
-lタイミングレベル
ログ・ファイルに含まれるタイミング情報の詳細を指定します。 タイミング・メッセージは、ソフトウェアの機能の実行時間を示し、ミリ秒単位でログに記録されます。

サポートされる値は次のとおりです。 1|2|3|4|5

この数が大きいほど、時刻が設定され、実行時間がログに記録されるソフトウェアの機能が多くなります。 数値が小さいほど、より一般的なソフトウェア機能が含まれます。 上位レベルには、すべての下位レベルが含まれます。

デフォルトでは、タイミング情報はログに記録されません。

-fログファイル名
タイミング・メッセージが記録されるファイルの名前を指定します。 絶対パスの有無にかかわらず、ファイル名を指定できます。

パスなしのファイル名を指定すると、ファイルは LSF システム・ログ・ファイル・ディレクトリーに保存されます。

作成されるファイルの名前は、以下の形式になります。
logfile_name.gpolicyd.log.host_name

UNIX では、指定されたパスが有効でない場合、ログ・ファイルは /tmp ディレクトリーに作成されます。

Windows では、指定されたパスが無効な場合、ログ・ファイルは作成されません。

注: タイミング・メッセージとデバッグ・メッセージの両方が同じファイルに記録されます。

デフォルトは、 LSF システム・ログ・ファイル・ディレクトリー内の現行の LSF システム・ログ・ファイルで、 gpolicyd.log.host_nameという形式です。

-o
オプション。 一時的なタイミング設定をオフにして、デーモンの開始状態にリセットします。 タイミング・レベルは、対応するデーモン (LSB_TIME_GPD) のパラメーターの値にリセットされます。

ログ・ファイルもデフォルトのログ・ファイルにリセットされます。

h閉じる[-Cコメント] [-私 "ロックID 「」 [ホスト名... |ホストグループ... |計算ユニット... | すべて]
バッチ・サーバー・ホストを閉じます。 サーバー・ホスト、ホスト・グループ、または計算単位の名前を指定します。 予約語 all を指定すると、すべてのバッチ・サーバー・ホストがクローズされます。 引数を指定しない場合は、ローカル・ホストが想定されます。 クローズされたホストは新しいジョブを受け入れませんが、既にホストにディスパッチされているジョブは影響を受けません。 この動作は、ウィンドウによって閉じられたホストとは異なります。ホスト上のすべてのジョブは、ホスト上で時間ウィンドウが閉じられると中断されます。

ホストが既にクローズされている場合、 -i オプションを指定してロック ID をホストに接続しない限り、このコマンド・オプションは無効です。

-Cコメント
テキストを管理者コメント・レコードとして lsb.events ファイルに記録します。 コメント・ストリングの最大長は 512 文字です。

ホスト・グループまたは計算ユニットを閉じると、各メンバーは同じコメント・ストリングで表示されます。

badmin hopen コマンドを使用して、以下の場所にある LSF リソース・コネクターを介して借用したホストを開くことはできません。closed_RCstatus.

-i「ロックID
ホストをクローズし、指定されたロック ID をクローズされたホストに接続します。 各ロック ID は、最大 128 文字の英数字と下線 (_) 文字を含むことができるストリングです。 キーワード all は予約されており、ロック ID として使用することはできません。 クローズされたホストは複数のロック ID を持つことができ、ホストに接続されているロック ID がなくなるまで、ホストはクローズされたままになります。

ロック ID に管理者メッセージを付加するには、 -i-C オプションと一緒に使用します。

既にホストに接続されているロック ID を接続しようとすると (別のコメントが付いている場合でも)、そのホストに対するコマンドは失敗します。

ホストから 1 つ以上のロック ID を除去するには、 badmin hopen -i コマンド・オプションを使用します。

これにより、複数のユーザーがさまざまな理由でホストを閉じたままにすることができます。 例えば、 userB がオペレーティング・システムを構成している間に、 userA がアプリケーションを更新する場合があります。 両方のユーザーが更新を完了し、特定のロック ID を使用してホストを開くまで、ホストはクローズされたままになります。

help [コマンド ...] |? [コマンド ...]
指定されたコマンドの構文と機能を表示します。
hghostadd [-Cコメント]ホストグループ|計算ユニット|ホスト名[ホスト名...]
動的ホスト構成が有効になっている場合、ホスト・グループまたは計算単位にホストを動的に追加します。 mbatchd デーモンは、 management ホスト上の LIM からホスト情報を受け取ると、再構成を起動せずに動的にホストを追加します。

ホストがホスト・グループまたは計算ユニットに追加されると、そのホストは、新たに実行依頼されたジョブおよび既存の保留中のジョブの決定をスケジューリングするために、そのグループの一部と見なされます。

指定されたホスト・グループ、計算単位、またはホスト名のいずれかが無効である場合、このコマンドは失敗します。

制約事項: EGO対応の SLA スケジューリングが lsb.params ファイルの ENABLE_DEFAULT_EGO_SLA パラメーターを使用して構成されている場合、すべてのホスト割り振りが エンタープライズ・グリッド・オーケストレーター (EGO) の制御下にあるため、 hghostadd サブコマンドは使用できません。
-Cコメント
テキストを管理者コメント・レコードとして lsb.events ファイルに記録します。 コメント・ストリングの最大長は 512 文字です。
ゴーストデル[-f] [-Cコメント]ホストグループ|計算ユニット|ホスト名[ホスト名...]
mbatchd デーモンの再構成をトリガーすることにより、ホスト・グループまたは計算単位からホストを動的に削除します。

指定されたホスト・グループ、計算単位、またはホスト名のいずれかが無効である場合、このコマンドは失敗します。

注意:

動的ホストを静的ホストに変更するには、まずコマンド badmin hghostdel を使用して、動的ホストが属するホスト・グループまたは計算単位から動的ホストを削除します。 次に、 lsf.cluster.cluster_name ファイルでホストを静的ホストとして構成します。

制約事項: EGO対応の SLA スケジューリングが lsb.params ファイルの ENABLE_DEFAULT_EGO_SLA パラメーターを使用して構成されている場合、すべてのホスト割り振りが エンタープライズ・グリッド・オーケストレーター (EGO) の制御下にあるため、 hghostdel サブコマンドは使用できません。
-f
対話を無効にし、 mbatchdの再構成時に確認を求めません。
-Cコメント
テキストを管理者コメント・レコードとして lsb.events ファイルに記録します。 コメント・ストリングの最大長は 512 文字です。
ヒスト[-t時間0時間1 ] [-fログファイル名] [ホスト名...]
指定されたホスト、またはホストが指定されていない場合はすべてのホストのヒストリカル・イベントを表示します。 ホスト・イベントは、ホストのオープンとクローズです。 また、 badmin コマンドと、ポリシーまたはジョブによって起動される電源関連イベント (中断、再開、リセット) の両方が表示されます。
-t時間0時間1

time0 から time1までの期間中に発生したイベントのみを表示します。 時刻形式については、 bhist コマンドを参照してください。 デフォルトでは、イベント・ログ・ファイル内のすべてのホスト・イベントが表示されます。

-fログファイル名
イベント・ログ・ファイルのファイル名を指定します。 絶対パス名または相対パス名のいずれかを指定できます。 デフォルトでは、 LSF システム内の現行イベント・ログ・ファイル LSB_SHAREDIR/cluster_name/logdir/lsb.eventsを使用します。 オプション -f は、オフライン分析に役立ちます。

ホスト制御コマンド hclose または hopen-C オプションで管理者コメントを指定した場合、 hhist はコメント・テキストを表示します。

ヒスト[-t時間0時間1] [-fログファイル名]
すべてのキュー、ホスト、および mbatchdのヒストリカル・イベントを表示します。 badmin コマンドと、ポリシーまたはジョブによって起動される電源関連イベント (中断、再開、リセット) の両方が表示されます。
-t時間0時間1
time0 から time1までの期間中に発生したイベントのみを表示します。 時刻形式については、 bhist を参照してください。 デフォルトでは、イベント・ログ・ファイル内のすべてのキュー・イベントが表示されます。
-fログファイル名
イベント・ログ・ファイルのファイル名を指定します。 絶対パス名または相対パス名のいずれかを指定できます。 デフォルトでは、 LSF システム内の現在のイベント・ログ・ファイル ( LSB_SHAREDIR/cluster_name/logdir/lsb.events ファイル) が使用されます。 オプション -f は、オフライン分析に役立ちます。

キュー・コマンド、ホスト・コマンド、および mbatchd デーモン・コマンドの -C オプションで管理者コメントを指定した場合、 hist オプションはコメント・テキストを表示します。

希望する[-Cコメント] [-私 "ロックID ... | すべて"] [ホスト名... |ホストグループ] [ホスト名... |ホストグループ... |計算ユニット... | すべて]
バッチ・サーバー・ホストを開きます。 サーバー・ホスト、ホスト・グループ、または計算単位の名前を指定します。 予約語 all を指定すると、すべてのバッチ・サーバー・ホストが開きます。 ホスト、ホスト・グループ、または計算装置が指定されていない場合は、ローカル・ホストが想定されます。 ホストは、オープンしている場合はバッチ・ジョブを受け入れます。
重要: EGO対応の SLA スケジューリングが lsb.paramsファイル内の ENABLE_DEFAULT_EGO_SLA パラメーターを使用して構成されていて、ホストが EGOによってクローズされている場合、 badmin hopen コマンドでそのホストを再オープンすることはできません。 EGO によってクローズされたホストの状況closed_EGObhosts -l コマンド出力に表示されます。
-Cコメント
テキストを管理者コメント・レコードとして lsb.events ファイルに記録します。 コメント・ストリングの最大長は 512 文字です。

ホスト・グループまたは計算ユニットを開くと、各メンバーが同じコメント・ストリングで表示されます。

-i「ロックID ... | すべて"
クローズされたホストから、指定されたロック ID を除去します。 また、ホスト上にロック ID が残っていない場合は、ホストを開きます。

複数のロック ID を区切るにはスペースを使用します。 すべてのロック ID を削除し、ホストを開くには、 all キーワードを使用します。

これにより、複数のユーザーがさまざまな理由でホストを閉じたままにすることができます。 例えば、 userB がオペレーティング・システムを構成している間に、 userA がアプリケーションを更新する場合があります。 両方のユーザーがそれぞれのタスクを完了し、特定のロック ID を使用してホストを開くまで、ホストはクローズされたままになります。

hpower [一時停止 | 再開] [-Cコメント] [ホスト名...]
ホストを省電力状態または作動状態に手動で切り替えます。
中断 | 再開
ホストの切り替え先となる状態。
-Cコメント
テキストを管理者コメント・レコードとして lsb.events ファイルに記録します。 コメント・ストリングの最大長は 512 文字です。
hrestart
このサブコマンドは、 LSF バージョン 10.1 フィックスパック 11 で廃止されました。 代わりに bctrld restart sbd コマンドを使用して、 sbatchd デーモンを再始動してください。
Hシャットダウン
このサブコマンドは、 LSF バージョン 10.1 フィックスパック 11 で廃止されました。 代わりに bctrld stop sbd コマンドを使用して、 sbatchd デーモンをシャットダウンしてください。
HStartup
このサブコマンドは、 LSF バージョン 10.1 フィックスパック 11 で廃止されました。 代わりに bctrld start sbd コマンドを使用して、 sbatchd デーモンを開始してください。
lsfproxyd [[enable | disable] all | query | sub | other]] | 状況
フィックスパック 14 以降では、 lsfproxyd デーモンの実行中に LSF レート・リミッター を有効または無効にします。 フィックスパック 14 では、 レート・リミッターが導入されました。 レート・リミッター は、 lsfproxyd デーモンによって管理されます。このデーモンは、 mbatchd デーモンに到達できる要求および接続の数をモニターおよび制御し、過剰な要求から保護します。 mbatchdに連絡する要求の場合、まず lsfproxydから要求トークンを取得する必要があります。 要求が完了すると、トークンは lsfproxydに戻ります。 lsfproxyd デーモンは、ラウンドロビン方式でトークンを配布します。これにより、負荷が高い場合でも、各ユーザー接続がサービスを受け、処理される可能性が高くなります。
要求タイプが使用不可の場合、 lsfproxyd デーモンはその要求タイプのトークンを配布せず、要求は代わりに mbatchd デーモンに処理されます。 レート・リミッター が使用不可になっている場合 (またはすべての lsfproxyd デーモンがダウンしている場合)、 mbatchd デーモンはトークン付きの要求を受け入れます。以下に例を示します。
$ badmin lsfproxyd disable query
lsfproxyd service status:
  QUERY:DISABLED
  SUBMISSION:ENABLED
  OTHER:ENABLED
badmin lsfproxyd status を実行すると、 lsfproxyd デーモンと直接通信し、その状況情報 (以下のデータを含む) を表示します。
  • 異なる要求タイプが使用可能かどうか
  • トークン制限のその部分、および使用中のトークンの数
  • サンプリング期間中に収集される単純なメトリック:
    • 要求の数
    • カテゴリー別の失敗した拒否の数
    • ブロックされた要求の数
    • エラーの数
    出力には、各要求、拒否、ブロックされた要求、およびエラー・メトリックのカウントも表示されます。
    • 現在のサンプリング期間のカウント
    • 最後に完了したサンプリング期間のカウント
    • 完了したすべてのサンプリング期間における最大カウント
    • 完了したすべてのサンプリング期間にわたって計算された平均カウント
以下に、要求タイプが有効になっている場合の badmin lsfproxyd status の実行の出力例を示します。
$ badmin lsfproxyd status

lsfproxyd service status:
  QUERY:ENABLED
  SUBMISSION:ENABLED
  OTHER:ENABLED

lsfproxyd host status:
  HOSTNAME: host1
  STATUS: CONNECTED
  PID: 1592462
             TOKEN_LIMIT  TOKENS_IN_USE_TOTAL  TOKENS_IN_USE_PRIVILEGED
  QUERY      1            242                  242
  SUBMISSION 1            263                  263
  OTHER      1            0                    0

lsfproxyd started:              Thu Feb 16 14:03:15 
End time of last sample period: Fri Feb 17 06:41:15 
Sample period:                  60 Seconds
------------------------------------------------------------------------------
Metrics                      Current   Last      Max       Avg      Total
------------------------------------------------------------------------------
Requests
     Query                   0         300       300       300      7
     Submission              0         900       900       900      1
     Other                   0         0         0         0        0
Rejected
     Query                   0         0         0         0        0
     Submission              0         0         0         0        0
     Other                   0         0         0         0        0
Blocked                      0         0         0         0        0
Error                        0         0         0         0        0
要求タイプが無効になっている場合の badmin lsfproxyd status の実行の出力例を以下に示します。
lsfproxyd service status:
  QUERY: DISABLED
  SUBMISSION: DISABLED
  OTHER: DISABLED

lsfproxyd host status:
  HOSTNAME: host1
  STATUS: DISCONNECTED
  PID: -
             TOKEN_LIMIT  TOKENS_IN_USE_TOTAL  TOKENS_IN_USE_PRIVILEGED
  QUERY      -            -                    -
  SUBMISSION -            -                    -
  OTHER      -            -                    -

No metric data available.
lsfproxyd [[ブロック | ブロック解除] [すべて | [-u 「user1user2 ..."] [-m 「host1ホスト..."]]] | ブロックリスト
フィックスパック 14 以降、管理者は、 レート・リミッターの使用時に、非管理者ユーザーと非 root ユーザー、ホスト、またはその両方が mbatch デーモン操作を実行するのを一時的にブロックできるようになりました。 unblock オプションを使用して、または レート・リミッターのために lsfproxyd デーモンが再始動したときに自動的に、これらのユーザーおよびホストを手動でブロック解除します。

管理者がブロック更新を送信してデーモンを再始動した時点で lsfproxyd デーモンがダウンしている場合、または管理者がユーザーをブロックした後で再始動した場合は、ブロックされたユーザーが mbatchd デーモンに連絡する可能性があることに注意してください。 この場合、管理者はブロック・コマンドを再度実行して、影響を受けるデーモン上のブロック・リストをリフレッシュする必要があります。

badmin lsfproxyd block の用途は、管理者がユーザーによる LSF クラスターとの対話を一時的に停止できるようにすることです。 これは、管理者がユーザーまたはホストの虐待が LSF のパフォーマンスに影響していると判断し、他のユーザーのサービスの品質を低下させていると判断した場合に使用されます。

ユーザーまたはホストをブロックするには、 badmin lsfproxyd blockを実行します。 ブロックを解除するには、 badmin lsfproxyd unblockを実行します。 現在ブロックされているすべてのユーザーとホストを表示するには、 badmin lsfproxyd blocklistを実行します。 コマンドの使用例については、以下の詳細を参照してください。

すべてのユーザーおよびホストをブロックする使用法および出力メッセージの例:
$ badmin lsfproxyd block all
<all> added to the the blocklist on lsfproxyd host <lsfproxydhost1>
すべてのユーザーとホストをブロック解除する使用法と出力メッセージの例:
$ badmin lsfproxyd unblock all
<all> removed from the the blocklist on lsfproxyd host <lsfproxydhost1>
ブロッキング user1 および user2の使用および出力メッセージの例:
$ badmin lsfproxyd block -u "user1 user2"
Users <user1 user2> added to the blocklist on lsfproxyd host <lsfproxydhost1>
ブロッキング hostA および hostBの使用および出力メッセージの例:
$ badmin lsfproxyd block -m "hostA hostB"
Hosts <hostA hostB> added to the blocklist on lsfproxyd host <lsfproxydhost1>
hostAでのブロッキング user1 の使用および出力メッセージの例:
$ badmin lsfproxyd block -u "user1" -m "hostA"
<user1@hostA> added to the blocklist on lsfproxyd host <lsfproxydhost1>
<user1@hostA> added to the blocklist on lsfproxyd host <lsfproxydhost2>
hostA および hostBでのブロッキング user1 および user2 の使用および出力メッセージの例:
$ badmin lsfproxyd block -u "user1 user2" -m "hostA hostB"
<user1@hostA user1@hostB user2@hostA user2@hostB> added to the blocklist on lsfproxyd host <lsfproxydhost1>
<user1@hostA user1@hostB user2@hostA user2@hostB> added to the blocklist on lsfproxyd host <lsfproxydhost2>
user1の非ブロック化の使用法と出力メッセージの例:
$ badmin lsfproxyd unblock -u user1
Users <user1> removed from the blocklist on lsfproxyd host <lsfproxydhost1>
Users <user1> removed from the blocklist on lsfproxyd host <lsfproxydhost2>
hostA および hostBでの user1 の非ブロック化の使用法および出力メッセージの例:
$ badmin lsfproxyd unblock -u "user1" -m "hostA hostB"
<user1@hostA user1@hostB> removed from the blocklist on lsfproxyd host <lsfproxydhost1>
<user1@hostA user1@hostB> removed from the blocklist on lsfproxyd host <lsfproxydhost2>
現在ブロックされているユーザーとホストの要約を表示する使用例:
$ badmin lsfproxyd blocklist
lsfproxyd host - host1
  All blocked:           No
  Blocked users:         user1 user2
  Blocked hosts:         -
  Blocked users@hosts:   user4@exechost1 user3@exechost2

lsfproxyd host - host2
  Unable to contact <host2>

lsfproxyd host - host3
  All blocked all:       No
  Blocked users:         user1 user2
  Blocked hosts:         -
  Blocked users@hosts:   user4@exechost1 user3@exechost2
バグ[-cクラス名...] [-lデバッグレベル] [-fログファイル名] [-o] [-sログキューサイズ]
mbatchd デーモンのメッセージ・ログ・レベルを設定して、ログ・ファイルに追加情報を組み込みます。 このコマンドを使用するには、 root または LSF 管理者でなければなりません。
-sログキューサイズ
mbatchd ロギング・スレッドが使用するロギング・キュー内のエントリーの最大数を指定します。 100 から 500000 までの整数を指定します。 この値は、 lsf.conf ファイル内の LSF_LOG_QUEUE_SIZE パラメーターの値を一時的にオーバーライドします。 ロギング・キューには、ログ・ファイルに書き込まれるメッセージが含まれます。

lsf.conf ファイルに LSF_LOG_THREAD=N パラメーターが定義されている場合、 -s オプションは無視されます。

その他のオプションの説明については、 sbddebug サブコマンドを参照してください。

-c オプションの場合、 mdbdebug サブコマンドには、 sbddebug サブコマンドの有効なログ・クラスに加えて、以下の有効なログ・クラスがあります。
LC2_EST
シミュレーション・ベースの推定量のログ・メッセージ。 mbddebug サブコマンドを使用して、このログ・クラスを変更することはできません。
LC2_G_FAIR
グローバル・フェア・シェアのログ・メッセージ。
mbdhist [-t時間0時間1] [-fログファイル名]
mbatchd デーモンの履歴上のイベントを表示します。 イベントは、 mbatchd デーモンの開始と終了を記述します。
-t時間0時間1

time0 から time1までの期間中に発生したイベントのみを表示します。 時刻形式については、 bhist コマンドを参照してください。 デフォルトでは、イベント・ログ・ファイル内のすべてのキュー・イベントが表示されます。

-fログファイル名
イベント・ログ・ファイルのファイル名を指定します。 絶対パス名または相対パス名のいずれかを指定してください。 デフォルトでは、 LSF システム内にある現行のイベント・ログ・ファイル LSB_SHAREDIR/cluster_name/logdir/lsb.eventsを使用します。 オプション -f は、オフライン分析に役立ちます。

mbdrestart サブコマンドの -C オプションで管理者コメントを指定した場合、 mbdhist サブコマンドはコメント・テキストを表示します。

mbd再起動[-Cコメント][-v][-f][-p |-s ]
LSF を動的に再構成し、 mbatchd および mbschd デーモンを再始動します。 bconf コマンドを使用したライブ構成が有効になっている ( LSF_LIVE_CONFDIR パラメーターが lsf.confファイルで定義されている) 場合、 badmin mbdrestart コマンドは、 bconf コマンドによって生成された構成ファイルを使用します。

構成ファイルにエラーがあるかどうかが検査され、結果が stderrに出力されます。 エラーが見つからない場合は、構成ファイルが再ロードされ、 mbatchd デーモンと mbschd デーモンが再始動され、 lsb.events ファイル内のイベントが再生されて、最後の mbatchd デーモンの実行状態がリカバリーされます。 mbatchd デーモンの再始動中は、要求にサービスを提供することはできません。

警告エラーが検出されると、 badmin コマンドは詳細メッセージを表示するようにプロンプトを出します。 リカバリー不能エラーが検出されると、 mbatchd および mbschd デーモンは再始動せず、 badmin コマンドは終了します。

重要: lsb.events ファイルが大きい場合、または多数のジョブが実行されている場合は、 mbatchd デーモンの再始動に数分かかることがあります。 構成ファイルのみを再ロードする必要がある場合は、 badmin reconfig コマンドを使用します。
-Cコメント
コメントのテキストを管理者コメント・レコードとして lsb.events ファイルに記録します。 コメント・ストリングの最大長は 512 文字です。
-v
Verbose モード。 構成ファイルの状況に関する詳細なメッセージを表示します。 構成検査からのすべてのメッセージは、 stderrに出力されます。
-f
対話を使用不可にし、構成ファイルにリカバリー不能エラーが含まれていない場合は、再構成および mbatchd デーモンの再始動を強制的に続行します。
-p
並列 mbatchd デーモンの再始動を許可します。 再始動は、 LSFのダウン時間を最小化するために、子 mbatchd デーモン・プロセスを fork します。 LSF は、新規または子の mbatchd デーモン・プロセスを開始して、構成ファイルを読み取り、イベント・ファイルを再生します。 古い mbatchd デーモンは、クライアント・コマンドへの応答、ジョブ・スケジューリングと状況更新の処理、イベント・ファイルへの新規イベントのディスパッチと更新を行うことができます。 再始動が完了すると、子は mbatchd デーモンとして引き継がれ、古い mbatchd デーモンは終了します。

このオプションは、 mbatchd デーモンの再始動のデフォルトの動作です。 シリアル mbatchd デーモンの再始動を使用するには、 -s オプションを使用します。

-s
シリアル mbatchd デーモンの再始動を許可します。 このオプションを使用して、並行して再始動するデフォルトの mbatchd デーモンの動作を変更します。
時間[-lタイミングレベル] [-fログファイル名] [-o]
mbatchd デーモンのタイミング・レベルを設定して、追加のタイミング情報をログ・ファイルに組み込みます。 このコマンドを使用するには、 root または LSF 管理者でなければなりません。
パーフロッグ[-tサンプル期間] [-fログファイル名] [-d所要時間] | [-o]]
この機能は、 mbatchd デーモンのパフォーマンス上の問題が原因でクラスターが応答しない可能性がある大規模クラスターのトラブルシューティングに役立ちます。 このような場合、 mbatchd デーモンのパフォーマンスは、ジョブ実行依頼、ジョブ状況要求、およびジョブなどの大量要求の処理が遅くなる可能性があります。rusageリクエスト。
-t
パフォーマンス・メトリック収集のサンプリング期間を分単位で指定します。 デフォルト値は 5 分です。
-f
情報を保存するログ・ファイルを指定します。 これは、ファイル名または絶対パス・ファイル名のいずれかです。 ログ・ファイルのパスを指定しない場合は、そのデフォルト・パスが使用されます。 ログ・ファイルのデフォルト名は mbatchd.perflog.<host_name>です。

ログ・ファイルの所有者は、 LSF_ADMIN パラメーターで指定されたユーザーです。 ログ・ファイル許可は、 mbatchd デーモン・ログ許可と同じです。 すべてのユーザーには読み取り権限と実行権限がありますが、 LSF_ADMIN ユーザーには書き込み権限、読み取り権限、および実行権限があります。

-d
パフォーマンス・メトリック・データをログに記録する期間 (分)。 mbatchd デーモンは、有効期限が切れた後、手動で停止するまで、 mbatchd デーモンを再始動するまで、または reconfig mbatchd コマンドを使用して再構成するまで、メッセージをログに記録しません。 期間のデフォルト値は無限です。 デフォルトでは、パフォーマンス・メトリック・データは常にログに記録されます。)
-o
動的パフォーマンス・メトリック・ロギングをオフにします (ロギングを停止します)。 LSB_ENABLE_PERF_METRICS_LOG パラメーターが有効になっている場合、ロギングは静的構成に戻ります。
perfmon start [sample_period] | setperiod sample_period | stop | view [-json]
スケジューラーのパフォーマンス・メトリック収集を動的に有効化および制御します。

パフォーマンス・メトリック・データの収集と記録は、 LSFのパフォーマンスに影響を与える可能性があります。 サンプリング期間を短くすると、 lsb.streams ファイルのサイズが大きくなる可能性があります。

以下のメトリックが収集され、各サンプル期間に記録されます。
  • mbatchd によって処理される照会の数
  • ジョブ、キュー、およびホストのそれぞれに対する照会の数。 (bjobsbqueues、および bhosts コマンド、およびその他のデーモン要求)
  • 実行依頼されたジョブの数 (ジョブ実行依頼要求と実行依頼されたジョブに分割)
  • ディスパッチされたジョブの数
  • 再配列されたジョブの数。つまり、終了したジョブのリソース割り振りを再利用したジョブの数 ( lsb.params ファイルまたは lsb.queues ファイル内の RELAX_JOB_DISPATCH_ORDER パラメーター)。
  • 完了したジョブの数
  • リモート・クラスターに送信されたジョブの数
  • クラスターから受信されたジョブの数
  • mbatchd デーモンによって使用されるファイル記述子
  • 以下のスケジューラー・パフォーマンス・メトリックが収集されます。
    • スケジューリング間隔が短いということは、ジョブがより迅速に処理されることを意味します。
    • 使用中のジョブの異なるリソース要件パターンの数。これにより、異なる候補ホスト・グループになる可能性があります。 一致する必要があるホストの数が多いほど、それらの検出にかかる時間が長くなります。これは、スケジューリング・セッションが長くなることを意味します。
    • リソース要件およびさまざまなスケジューリング・ポリシーに基づいてジョブが配置されるバケット (グループ) の数。 バケットが多いほど、スケジューリング・セッションが長くなります。
開始 [sample_period]
パフォーマンス・メトリック収集を動的に開始し、パフォーマンス・メトリック収集のオプションのサンプリング期間を秒単位で指定します。

サンプリング期間が指定されていない場合は、 lsb.params ファイルの SCHED_METRIC_SAMPLE_PERIOD パラメーターに設定されているデフォルト期間が使用されます。

停止
パフォーマンス・メトリック収集を動的に停止します。
ビュー
現在のサンプリング期間のパフォーマンス・メトリック情報を表示します。
[-json]オプションと一緒に使うと、出力をJSON形式で表示する。 これにより、構文解析が向上し、グラフ形式に変換することができます。
期間 sample_period の設定
新しいサンプリング期間を秒単位で設定します。
事実[-Cコメント] [キュー名... | すべて]
非活動化されたキューを活動化して、実行依頼されたジョブがキューからディスパッチされるようにします。 予約語 all を指定すると、 qact サブコマンドはすべてのキューを活動化します。 キュー名が指定されていない場合、システムは、defaultキューがアクティブになります。 キュー内のジョブは、キューが活動化されている場合にのみディスパッチできます。
実行ウィンドウによって非活動化されたキューは、このコマンドでは再活動化できません。
-Cコメント
コメントのテキストを管理者コメント・レコードとして lsb.events ファイルに記録します。 コメント・ストリングの最大長は 512 文字です。
q閉じる[-Cコメント] [キュー名... | すべて]
キューをクローズして、ジョブがキューに実行依頼されないようにします。 予約語 all を指定すると、 qclose サブコマンドはすべてのキューをクローズします。 キュー名が指定されていない場合、システムは、defaultキューがクローズされます。 キューは、クローズされている場合、実行依頼された LSF ジョブを受け入れません。
-Cコメント
テキストを管理者コメント・レコードとして lsb.eventsに記録します。 コメント・ストリングの最大長は 512 文字です。
歴史[-t時間0時間1 ] [-fログファイル名] [キュー名...]
指定されたキュー、またはキューが指定されていない場合はすべてのキューのヒストリカル・イベントを表示します。 キュー・イベントは、キューのオープン、クローズ、活動化、および非活動化です。
-t時間0時間1

time0 から time1までの期間中に発生したイベントのみを表示します。 時刻形式については、 bhist コマンドを参照してください。 デフォルトでは、イベント・ログ・ファイル内のすべてのキュー・イベントが表示されます。

-fログファイル名

イベント・ログ・ファイルのファイル名を指定します。 絶対パス名または相対パス名のいずれかを指定できます。 デフォルトでは、 LSF システム内の現行イベント・ログ・ファイル LSB_SHAREDIR/cluster_name/logdir/lsb.eventsを使用します。 オプション -f は、オフライン分析に役立ちます。

キュー制御サブコマンド qcloseqopenqact、および qinact-C オプションで管理者コメントを指定した場合、 qhist サブコマンドはコメント・テキストを表示します。

キナクト[-Cコメント] [キュー名... | すべて]
キューを非活動化して、サブミットされたジョブがキューからディスパッチされないようにします。 予約語 all を指定すると、すべてのキューが非活動化されます。 キュー名が指定されていない場合、システムは、defaultキューが非活動化される キューが非活動化されている場合、キュー内のジョブをディスパッチすることはできません。
-Cコメント
テキストを管理者コメント・レコードとして lsb.events ファイルに記録します。 コメント・ストリングの最大長は 512 文字です。
qopen [-Cコメント] [キュー名... | すべて]
クローズされたキューをオープンして、ユーザーがそのキューにジョブを実行依頼できるようにします。 予約語 all を指定すると、 qopen サブコマンドはすべてのキューをオープンします。 キュー名が指定されていない場合、システムは、defaultキューがオープンされます。 キューは、オープンされている場合にのみ、実行依頼された LSF ジョブを受け入れます。
-Cコメント
コメントのテキストを管理者コメント・レコードとして lsb.eventsに記録します。 コメント・ストリングの最大長は 512 文字です。
止める
badmin コマンド・セッションを終了します。
rcエラー[-t <日数> d | <時間>時間<分>メートル] [-p 「プロバイダー..."]
ホスト・プロバイダーからの LSF リソース・コネクターのエラー・メッセージを表示します。 これらのエラーは、ホスト上で実行されている必要があるサード・パーティーの mosquitto メッセージ・キュー・アプリケーションによって提供されます。
-t <日数> d | <時間>時間<分>メートル
エラー・メッセージを取得する最も早い時刻を指定します。
注: 日数を指定すると、badmin はこの時刻の午前 0 時にメッセージを取得します。 例えば、 badmin rc error -t 1dを実行すると、 badmin は今日の午前 0 時からメッセージを取得し、 badmin rc error -t 2dを実行すると、 badmin は昨日の午前 0 時からメッセージを取得します。
-p 「プロバイダー...
エラー・メッセージの取得元のホスト・プロバイダーを指定します。 複数のホスト・プロバイダーを区切るにはスペースを使用します。
rc view [-c "インスタンス、ポリシー、テンプレート ..."] [-p"プロバイダ..."]
ホスト・プロバイダーからの LSF リソース・コネクター情報を表示します。
-c 「インスタンス | ポリシー | テンプレート ...」
インスタンス、ポリシー、またはテンプレートに関する情報を表示するかどうかを指定します。 複数のタイプの情報を区切るには、スペースを使用します。 デフォルトでは、このコマンドはインスタンスに関する情報のみを表示します。 -c オプションを指定して policies を選択すると、 -p オプションは無視されます。これは、指定されたプロバイダーについてだけではなく、すべてのポリシーが表示されるためです。
-p 「プロバイダー..."
情報を表示するホスト・プロバイダーを指定します。 複数のホスト・プロバイダーを区切るにはスペースを使用します。 -c オプションを指定して policies を選択すると、 -p オプションは無視されます。これは、指定されたプロバイダーについてだけではなく、すべてのポリシーが表示されるためです。
再構成[-v] [-f]
LSFを動的に再構成します。

構成ファイルにエラーがあるかどうかが検査され、結果が stderrに表示されます。 構成ファイルでエラーが検出されない場合、再構成要求が mbatchd デーモンに送信され、構成ファイルが再ロードされます。 bconf コマンドを使用したライブ構成が有効になっている ( LSF_LIVE_CONFDIR パラメーターが lsf.confファイルで定義されている) 場合、 badmin reconfig コマンドは、 bconf コマンドによって生成された構成ファイルを使用します。

重要: reconfig サブコマンドは、 mbatchd デーモンを再始動せず、 lsb.events ファイルを再生しません。 mbatchd デーモンを再始動し、 lsb.events ファイルを再生するには、 badmin mbdrestart コマンドを使用します。

このコマンドを使用すると、再構成ファイルが再ロードされている間、 mbatchd デーモンを使用して要求にサービスを提供することができます。 システム・ブートまたは最後の再構成以降に行われた構成変更は有効になります。

警告エラーが検出されると、 badmin コマンドは詳細メッセージを表示するようにプロンプトを出します。 リカバリー不能エラーが検出されると、再構成は失敗し、 badmin コマンドは終了します。

ホストをキュー、ホスト・グループ、または計算単位に追加すると、再構成前に実行依頼されたジョブは新しいホストを認識しません。 新規ホストを認識させるには、コマンド badmin mbdrestartを使用する必要があります。

キューによって決定されるリソース要件は、 badmin reconfig コマンドを使用した後は実行中のジョブに適用されなくなります。 例えば、キュー内の RES_REQ パラメーターを変更してクラスターを再構成すると、ジョブを実行するための以前のキュー・レベルのリソース要件は失われます。

-v
Verbose モード。 構成ファイルの状況に関する詳細なメッセージを表示します。 このオプションを指定しない場合、デフォルトで構成ファイル検査の結果が表示されます。 構成ファイル・チェックからのすべてのメッセージは、 stderrに出力されます。
-f
構成ファイルにリカバリー不能エラーがない場合、対話を使用不可にし、再構成を続行します。
バグ[-cクラス名...] [-lデバッグレベル] [-fログファイル名] [-o] [ホスト名...]
sbatchd デーモンのメッセージ・ログ・レベルを設定して、ログ・ファイルに追加情報を組み込みます。 その必要があります。rootまたは LSF 管理者がこのコマンドを使用します。

LSF マルチクラスター機能では、同じクラスター内のホストに対してのみデバッグ・レベルを設定できます。 例えば、 clusterBのホストに対して、 clusterA のホストからデバッグ・レベルやタイミング・レベルを設定することはできません。 clusterB ホストのデバッグ・レベルまたはタイミング・レベルをセットアップするには、 clusterB のホスト上で作業する必要があります。

オプションを指定せずにコマンドを使用すると、以下のデフォルト値が使用されます。
class_name=0
追加のクラスはログに記録されません。
debug_level=0
LOG_DEBUGパラメーター LSF_LOG_MASKのレベル。
logfile_namedaemon_name.log.host_name
LSF システム・ログ・ファイル・ディレクトリー内の LSF システム・ログ・ファイル (以下の形式)daemon_name.log.host_name.
host_name=local_host
コマンドの実行依頼元のホスト。
-cクラス名...
デバッグ・メッセージをログに記録するソフトウェア・クラスを指定します。
注: クラスは、 lsf.h ヘッダー・ファイルにもリストされます。

デフォルトでは、追加のクラスはログに記録されません (クラス名 0)。

以下のログ・クラスがサポートされています。
LC_ADVRSV および LC2_ADVRSV
事前予約の変更をログに記録します。
LC2_AFFINITY
アフィニティーに関連するメッセージをログに記録します。
LC_AFS および LC2_AFS
AFS メッセージをログに記録します。
LC_AUTH および LC2_AUTH
認証メッセージをログに記録します。
LC_CHKPNT および LC2_CHKPNT
チェックポイント・メッセージをログに記録します。
LC_COMM および LC2_COMM
通信メッセージをログに記録します。
LC_DCE および LC2_DCE
DCE サポートに関連するログ・メッセージ。
LC_EEVENTD および LC2_EEVENTD
eeventd デーモン・メッセージをログに記録します。
LC_ELIM および LC2_ELIM
ELIM メッセージをログに記録します。
LC_EXEC および LC2_EXEC
ジョブ実行の重要なステップをログに記録します。
LC_FAIR (LC_FAIR)
フェア・シェア・ポリシー・メッセージをログに記録する。
LC_FILE および LC2_FILE
ログ・ファイル転送メッセージ。
LC2_GUARANTEE
保証された SLA に関連するメッセージをログに記録します。
LC_HANG および LC2_HANG
プログラムがハングする可能性がある箇所にマークを付けます。
LC_JARRAY および LC2_JARRAY
ジョブ配列メッセージをログに記録します。
LC_JLIMIT および LC2_JLIMIT
ジョブ・スロット制限メッセージをログに記録します。
LC_LOADINDX および LC2_LOADINDX
ロード索引メッセージをログに記録します。
LC_M_LOG および LC2_M_LOG
複数イベント・ログ・メッセージをログに記録します。
LC_MEMORY および LC2_MEMORY
MEMORY 割り振りに関連するログ・メッセージ。
LC_MPI および LC2_MPI
MPI メッセージをログに記録します。
LC_MULTI および LC2_MULTI
LSF マルチクラスター機能に関連するログ・メッセージ。
LC_PEND および LC2_PEND
ジョブ保留理由に関連するメッセージをログに記録します。
LC_PERFM および LC2_PERFM
パフォーマンス・メッセージを記録します。
LC_PIM および LC2_PIM
PIM メッセージをログに記録します。
LC_PREEMPT および LC2_PREEMPT
優先使用ポリシー・メッセージをログに記録します。
LC2_RC
リソース・コネクター・メッセージを記録します。
LC_RESOURCE および LC2_RESOURCE
リソース・ブローカーに関連するログ・メッセージ。
LC_RESREQ および LC2_RESREQ
リソース要件メッセージをログに記録します。
LC_SCHED および LC2_SCHED
バッチ・スケジューラーに関連するログ・メッセージ。
LC_SIGNAL および LC2_SIGNAL
シグナルに関連するメッセージをログに記録します。
LC_SYS および LC2_SYS
システム呼び出しメッセージをログに記録します。
LC_TRACE および LC2_TRACE
重要なプログラム・ウォーク・ステップを記録します。
LC_XDR および LC2_XDR
XDR によって転送されたすべてをログに記録します。
LC_XDRVERSION および LC2_XDRVERSION
XDR バージョンのログ・メッセージ。
-lデバッグレベル
デバッグ・メッセージの詳細レベルを指定します。 数値が大きいほど、ログに記録される詳細度が高くなります。 上位レベルには、すべての下位レベルが含まれます。

デフォルトは以下のとおりです。0(パラメーター LSF_LOG_MASKLOG_DEBUG レベル)

サポートされる値は次のとおりです。
0
lsf.conf ファイル内のパラメーター LSF_LOG_MASKLOG_DEBUG レベル。0がデフォルトです。
1
拡張ロギング用の LOG_DEBUG1 レベル。 より高いレベルには、より低いロギング・レベルが含まれます。 例えば、 LOG_DEBUG1 には LOG_DEBUG レベルが含まれています。
2
拡張ロギングの LOG_DEBUG2 レベル。 より高いレベルには、より低いロギング・レベルが含まれます。 例えば、 LOG_DEBUG2 には LOG_DEBUG1 および LOG_DEBUG レベルが含まれます。
3
拡張ロギング用の LOG_DEBUG3 レベル。 より高いレベルには、より低いロギング・レベルが含まれます。 例えば、 LOG_DEBUG3 には、 LOG_DEBUG2LOG_DEBUG1、および LOG_DEBUG レベルが含まれます。
-fログファイル名
デバッグ・メッセージを記録するファイルの名前を指定してください。 絶対パスの有無にかかわらず、ファイル名を指定できます。

パスなしでファイル名を指定すると、ファイルは LSF システム・ログ・ディレクトリーに保存されます。

作成されるファイルの名前は、以下の形式になります。
logfile_name.daemon_name.log.host_name

UNIX および Linuxでは、指定されたパスが有効でない場合、ログ・ファイルは /tmp ディレクトリーに作成されます。

Windows では、指定されたパスが無効な場合、ログ・ファイルは作成されません。

デフォルトでは、 LSF システム・ログ・ファイル・ディレクトリー内の現行の LSF システム・ログ・ファイルが使用されます。

-o
一時デバッグ設定をオフにして、デーモンの開始状態にリセットします。 メッセージ・ログ・レベルは LSF_LOG_MASK の値にリセットされ、クラスは LSB_DEBUG_MBDの値 LSB_DEBUG_SBDにリセットされます。

ログ・ファイルもデフォルトのログ・ファイルにリセットされます。

ホスト名 ...
オプション。 指定された 1 つ以上のホストにデバッグ設定を設定します。

デフォルトは、ローカル・ホスト (コマンドの実行依頼元のホスト) です。

sbdtime [-lタイミングレベル] [-fログファイル名] [-o] [ホスト名...]
sbatchd デーモンのタイミング・レベルを設定して、追加のタイミング情報をログ・ファイルに含めます。 その必要があります。rootまたは LSF 管理者がこのコマンドを使用します。

LSF マルチクラスター機能では、同じクラスター内のホストに対してのみタイミング・レベルを設定できます。 例えば、 clusterBのホストに対して、 clusterA のホストからデバッグ・レベルやタイミング・レベルを設定することはできません。 clusterB ホストのデバッグ・レベルまたはタイミング・レベルをセットアップするには、 clusterB のホスト上で作業する必要があります。

オプションを指定せずにコマンドを使用すると、以下のデフォルト値が使用されます。
timing_level=no
タイミング情報が記録されます。
logfile_name=current
LSF システム・ログ・ファイル・ディレクトリー内の LSF システム・ログ・ファイル (以下の形式)daemon_name.log.host_name.
host_name=local
コマンドの実行依頼元のホスト。
-lタイミングレベル
ログ・ファイルに含まれるタイミング情報の詳細を指定します。 タイミング・メッセージは、ソフトウェアの機能の実行時間を示し、ミリ秒単位でログに記録されます。

サポートされる値は次のとおりです。 1|2|3|4|5

この数が大きいほど、時刻が設定され、実行時間がログに記録されるソフトウェアの機能が多くなります。 数値が小さいほど、より一般的なソフトウェア機能が含まれます。 上位レベルには、すべての下位レベルが含まれます。

デフォルトでは、タイミング情報はログに記録されません。

-fログファイル名
タイミング・メッセージが記録されるファイルの名前を指定します。 絶対パスの有無にかかわらず、ファイル名を指定できます。

パスなしのファイル名を指定すると、ファイルは LSF システム・ログ・ファイル・ディレクトリーに保存されます。

作成されるファイルの名前は、以下の形式になります。
logfile_name.daemon_name.log.host_name

UNIX および Linuxでは、指定されたパスが有効でない場合、ログ・ファイルは /tmp ディレクトリーに作成されます。

Windows では、指定されたパスが無効な場合、ログ・ファイルは作成されません。

注: タイミング・メッセージとデバッグ・メッセージの両方が同じファイルに記録されます。

デフォルトは、 LSF システム・ログ・ファイル・ディレクトリー内の現行の LSF システム・ログ・ファイルで、 daemon_name.log.host_nameという形式です。

-o
オプション。 一時的なタイミング設定をオフにして、デーモンの開始状態にリセットします。 タイミング・レベルは、対応するデーモン (LSB_TIME_MBDLSB_TIME_SBD) のパラメーターの値にリセットされます。

ログ・ファイルもデフォルトのログ・ファイルにリセットされます。

ホスト名 ...
指定された 1 つ以上のホストでタイミング・レベルを設定します。

デフォルトは、コマンドの実行依頼元のローカル・ホストです。

バグ[-cクラス名...] [-lデバッグレベル] [-fログファイル名] [-o] [-sログキューサイズ]
mbschd デーモンのメッセージ・ログ・レベルを設定して、ログ・ファイルに追加情報を組み込みます。 その必要があります。rootまたは LSF 管理者がこのコマンドを使用します。
-sログキューサイズ
mbschd デーモン・ロギング・スレッドによって使用されるロギング・キュー内のエントリーの最大数を指定します。 100 から 500000 までの整数を指定します。 ロギング・キューには、ログ・ファイルに書き込まれるメッセージが含まれます。

lsf.conf ファイルに LSF_LOG_THREAD=N パラメーターが定義されている場合、このオプションは無視されます。

その他のオプションの説明については、 sbddebug サブコマンドを参照してください。

スケジュール[-lタイミングレベル] [-f] [-o]
mbschd デーモンのタイミング・レベルを設定して、追加のタイミング情報をログ・ファイルに組み込みます。 このコマンドを使用するには、 root または LSF 管理者でなければなりません。

オプションの説明については、 sbdtime サブコマンドの説明を参照してください。

セキュリティビュー[-v]
LSF セキュリティー・メカニズムのコンポーネントの構成を示します。
-v
Verbose モード。 LSF セキュリティー・コンポーネントの現在の構成の詳細説明を表示します。 また、現在の設定がセキュアでない場合は、最適な構成を表示します。
showconf mbd | [sbd [host_name ... | all] | gpd]
mbatchdsbatchd、および gpolicyd デーモンに影響を与える、 lsf.conf または ego.conf ファイルに設定されているすべての構成済みパラメーターとその値を表示します。

LSF マルチクラスター機能では、 badmin showconf コマンドはローカル・クラスター上のデーモンのパラメーターのみを表示します。

management 候補ホストから badmin showconf コマンドを実行すると、クラスター内のすべてのサーバー・ホストに到達します。 サーバーのみのホストから badmin showconf コマンドを実行すると、他の サーバーのみのホストに到達できない場合があります。

badmin showconf コマンドは、 LSFによって使用される値のみを表示します。

badmin showconf コマンドは、定義されている場所から EGO_MASTER_LIST パラメーターの値を表示します。 lsf.conf ファイルでは、 LSF_MASTER_LIST パラメーターまたは EGO_MASTER_LIST パラメーターのいずれかを定義できます。 LSF クラスターで EGO が有効になっている場合、LIM はまず lsf.conf ファイルを読み取り、次に ego.conf ファイルを読み取ります。 LSF_MASTER_LIST パラメーターの値は、 EGO_MASTER_LIST パラメーターが ego.conf ファイルでまったく定義されていない場合にのみ表示されます。

例えば、 lsf.confファイルで LSF_MASTER_LIST パラメーターを定義し、 ego.conf ファイルで EGO_MASTER_LIST パラメーターを定義した場合、 badmin showconf コマンドは EGO_MASTER_LIST パラメーターの値を表示します。

LSF クラスターで EGO が有効になっていて、 lsf.conf ファイルで LSF_MASTER_LIST パラメーターを定義し、 ego.conf ファイルで EGO_MASTER_LIST パラメーターを定義した場合、 badmin showconf コマンドは ego.conf ファイル内の EGO_MASTER_LIST パラメーターの値を表示します。

EGO が無効になっている場合、 ego.conf ファイルはロードされないため、 lsf.conf ファイルで定義されているパラメーターが表示されます。

表示状況
ホスト、ジョブ、ユーザー、ユーザー・グループ、 シミュレーション・ベースの見積もり、 および mbatchd デーモンの始動と再構成に関する情報を含む、クラスター全体に関する現在の LSF ランタイム情報を表示します。

関連資料

bhosts, bqueues, lsb.hosts, lsb.params, lsb.queues, lsf.cluster, lsf.conf, sbatchd, mbatchd, mbschd