BHIST
ジョブに関する履歴情報を表示します
概要
bhist [-l [-aff] [-gpu] [-hostfile]] [-a] [-b] [-d] [-data] [-e] [-p] [-r] [-s] [-w] [-UF] [-cname] [-app アプリケーション・プロファイル名] [-C 開始時刻,終了時刻] [-D 開始時刻,終了時刻] [-f ログ・ファイル名 | -f - | -n ログ・ファイルの数 | -n ブロック数 | -n 最小ログ・ファイル, 最大ログ・ファイル | -n 0] [-S 開始時刻,終了時刻] [-J ジョブ名] [-Jd "ジョブの説明"] [-Lp Ls_ プロジェクト名] [-m "ホスト名 ..."] [-N ホスト名 | -N ホスト・モデル | -N CPU 係数 (CPU_factor)] [-P プロジェクト名] [-q キュー名] [-u ユーザー名 | -u all | -G ユーザー・グループ] [ジョブ ID ... | "ジョブ ID[指標]" ...]説明
デフォルトでは、ユーザー自身の保留中、実行中、および中断状態のジョブに関する情報を表示します。 ジョブごとに情報をグループ化します。 CPU 時間は正規化されません。 bhist コマンドは、 LSF システムが使用するイベント・ログ・ファイル ( $LSB_SHAREDIR/cluster_name/logdir/lsb.events) を検索します。 bhist コマンドは、過去 1 週間に発生したイベントも表示します。 環境変数 LSB_BHIST_HOURS を代替時間数に設定します ( -t オプションでのみ機能します)。
オプション
- -a
- 終了したジョブと終了していないジョブの両方に関する情報を表示します。
このオプションは、 -d、 -p、 -s、および -rをオーバーライドします。
- -アフフ
- ジョブ内の各タスクの CPU およびメモリー・アフィニティー・リソース要件を持つジョブに関するヒストリカル・ジョブ情報を表示します。 ジョブが保留中の場合は、要求された類似性リソースが表示されます。 実行中のジョブについては、有効なアフィニティー・リソース割り振りと結合されたアフィニティー・リソース割り振りも、表の見出しとともに表示されます。AFFINITYこの表には、各タスクの詳細なメモリーおよび CPU バインディング情報が、割り振られた処理装置ごとに 1 行表示されます。 完了したジョブの場合 (EXITまたはDONEstate)、ジョブのアフィニティー要件、および有効なアフィニティー・リソース要件と結合されたアフィニティー・リソース要件の詳細が表示されます。
このオプションは、 -l オプションと一緒にのみ使用してください。
- -b
- 簡潔な形式。
- -cname (名前)
- IBM® Spectrum LSF Advanced Editionには、実行クラスター・ホストおよびホスト・グループのクラスター名を出力に含めます。
- -d
- 終了したジョブに関する情報を表示します。
- -データ
- データ要件を持つジョブ (例えば、 -dataを指定して実行依頼されたジョブ) の履歴情報を表示します。 bhist -data オプションは、データ要件を持つジョブのみを表示するフィルターとして機能します。
bhist -data Summary of time in seconds spent in various states: JOBID USER JOB_NAME PEND PSUSP RUN USUSP SSUSP UNKWN TOTAL 1962 user1 *1000000 410650 0 0 0 0 0 410650 - -e
- 終了したジョブに関する情報を表示します。
- -ホスト・ファイル
- ジョブが bsub -hostfile オプションを指定して実行依頼された場合、またはユーザー指定のホスト・ファイルを指すように bmod -hostfile オプションを指定して変更された場合、 bhist -l -hostfile オプションはユーザー指定のホスト・ファイル・パスを表示します。 -hostfile オプションは、ホスト・ファイルの内容も表示します。
- グプ
bhist -l -gpu は、ジョブ終了後の GPU ジョブ割り振りに関する以下の情報を示しています。
このオプションは、 -l オプションと一緒にのみ使用してください。
- ホスト名
- ホストの名前。
- ホスト上の GPU ID
- 各 GPU は別個の行として表示されます。
- TASK および ID
- GPU を使用するジョブ・タスクおよび ID のリスト (複数のタスクで使用する場合はコンマで区切る)
- モデル
- GPU ブランド名とモデル・タイプ名が含まれます。
- 合計
- GPU メモリー・サイズの合計。
- GPU 計算機能
- MRSV (R)
- ジョブによって予約された GPU メモリー
- SOCKET
- 次の場所にある GPU のソケット ID
- NVLINK (リンク)
- ジョブに割り振られた他の GPU との NVLink 接続が GPU にあるかどうかを示します (GPU ID でランク付けされ、GPU 自体を含みます)。 各 GPU の接続フラグは、次の GPU で「/」で区切られた文字です。
GPU 関連のエラーまたは警告が原因でジョブが異常終了した場合は、エラーまたは警告メッセージが表示されます。 LSF が DCGM から GPU 使用情報を取得できなかった場合は、ハイフン (-) 表示。
- -l
- 長形式。
ジョブが bsub -K オプションを指定して実行依頼された場合、 -l オプションは次のように表示します。Synchronous execution.
代替リソースを指定するために OR (||) 式を使用してジョブを実行依頼した場合、このオプションは成功を表示します。Execution rusageジョブが実行されたストリング。
order、 same、 rusage、および select の各セクションに対して bsub -R オプションを使用して、複数のリソース要件ストリングを含むジョブを実行依頼した場合、 bhist -l コマンドは、単一の -R オプションを使用して実行依頼された場合と同様に、それらのセクションの単一のマージされたリソース要件ストリングを表示します。
bsub -a を使用して esub (または epsub) で実行依頼されたジョブ (または bmod -aを使用して変更されたジョブ) は、実行に使用された最新の esubs を bhist -l 出力に表示します。最初にデフォルトを使用し、次にユーザー esubsを使用します。 ユーザー指定の esub スクリプトがデフォルトの esub スクリプトと同じ場合、重複する esubs は 1 つのエントリーとして表示されます。 パラメーターを含む esub を指定してジョブを実行依頼すると、 esub とそのパラメーターも bhist -l に表示されます。 esub の形式は、ジョブの実行依頼で指定された形式と同じです。
長形式には、以下の情報が含まれます。- ジョブ終了コード。
- 終了したジョブの終了理由。
- ジョブ例外 (例えば、ジョブ・ランタイムがランタイム見積もりを超えた場合、ジョブ例外は以下のようになります。runtime_est_exceededが表示されます)。
- ジョブ情報をサイズ変更できます。
- SSH X11 転送情報 (-XF)。
- 指定され、現行作業ディレクトリー (CWD) を実行します。 ディレクトリー・パターン値を含む絶対パスが表示されます。
- データ要件のあるジョブに関する詳細情報 見出しDATA REQUIREMENTSジョブによって要求されたファイルまたはタグのリスト、およびデータ要件に対して行われた変更のリストが表示されます。
- ジョブを強制終了、停止、または再開するユーザー指定の理由。
- ジョブを強制終了、停止、または再開する要求を発行したホスト。
- ジョブ・レベルの保留時間制限および適格保留時間制限。
- メモリーおよび CPU 使用量の情報 (CPU 効率、CPU ピーク使用量、メモリー効率の値など)。
- lsb.params ファイル内の TRACK_ELIGIBLE_PENDINFO パラメーターが Y または yに設定されている場合に、ジョブの開始後にジョブが適格かつ不適格な保留状態で費やした時間。
- 適用可能なローニング情報。 この情報は、ジョブが GSLA リソース・プールから借用されたリソースを使用するかどうか、およびどのプールからリソースを借用するかを示します。
- LSF リソース・コネクターのアカウント名。
- フィックスパック 14 以降では、各ジョブに割り当てられたリソース名。
- 以下の bmod コマンド・オプションの結果として、保留中のジョブが変更されました。
- 絶対優先順位スケジューリング (-aps | -apsn)
- 自動サイズ変更可能ジョブ属性 (-ar | -arn)
- 現行作業ディレクトリー (-cwd)
- データ要件 (-data | -datan)
- 実行後コマンド (-職 | -Epn)
- ジョブ記述 (-Jd | -Jdn)
- チェックポイント・オプション (-k | -kn)
- マイグレーションしきい値 (-mig | -mign)
- ジョブ・サイズ変更通知コマンド (-rnc | -rncn)
- ユーザー制限 (-ul | -uln)
- ランタイム見積もり (-We |-温)
bhist -l コマンドは、GPU 割り振りの有効な GPU 要件ストリングを表示します。bhist -l Job <204>, User <user1>, Project <default>, Command <blaunch sleep 60> Wed Jul 12 22:40:54: Submitted from host <hosta>, to Queue <normal>, CWD </ scratch/user1>, 8 Task(s),Requested Resources <span[ptile=4] .....................rusage[ngpus_physical=4]>,Specified Hosts <hostb>, <hosta!>, Requested GPU <num=4:mode=shared:j_exclusive=yes>; Wed Jul 12 22:40:55: Dispatched 8 Task(s) on Host(s) <hosta> <hosta> <h hosta> <hosta> <hostb> <hostb> <hostb> <hostb>, Allocated 8 Slot(s) on Host(s) <hosta> <h hosta> <hosta> <hosta> <hostb> <hostb> <hostb> <hostb>, Effective RES_REQ <select[type == any] order[r15s:pg] rusage[ngpus_physical=4.00] span[ptil e=4] >; Wed Jul 12 22:40:56: Starting (Pid 116194); Wed Jul 12 22:40:56: External Message "hostb:gpus=0,3,1,2;hosta:gpus=0,1,2,3; EFFECTIVE GPU REQ: num=4:mode=shared:mps=no:j_exclusive=yes;" was posted from "user1" to message box 0; - -p
- 保留中のジョブに関する情報を表示します。
- -r
- 実行中のジョブに関する情報を表示します。
- -s
- 延期されたジョブに関する情報を表示します。
- -t
- エネルギー認識スケジューリング・イベントを含む、ジョブ・イベントを発生順に表示します。JOB_PROV_HOSTおよびHOST_POWER_STATUS.
デフォルトでは、先週のレコードのみが表示されます。 異なる期間については、 -t オプションを -T オプションと一緒に使用してください。
LSB_BHIST_HOURS を -t とともに使用すると、デフォルトの 1 週間より長い期間または短い期間について、現在時刻より前のジョブ・イベントが表示されます。
- -w
- ワイド・フォーマット。 情報をワイド・フォーマットで表示します。
- ウフ
- 不定形式のジョブ詳細情報を表示します。
このオプションを使用すると、 bhistでキーワードを構文解析するためのスクリプトを簡単に作成できます。 このオプションの結果には、出力に対する広範な制御はありません。 各行は、行の先頭から始まります。 区切り文字なしで終了するリソース使用量メッセージ行には、それぞれの部分を区切るためにセミコロンが追加されます。 最初の行と、タイム・スタンプで始まるすべての行は、フォーマット設定されていない状態で単一行に表示されます。 出力には行の長さと形式制御はありません。
- -app アプリケーション・プロファイル名 (application_profile_name)
- 指定されたアプリケーション・プロファイルに実行依頼されたジョブに関する情報を表示します。
- --C 開始時刻,終了時刻
- 指定された時間間隔中に完了または終了したジョブを表示します。 時刻を次の形式で指定します。yyyy/mm/dd/HH:MM. 時間間隔ストリングにはスペースを指定しないでください。 このオプションは、 -r、 -s、 -p、および -a オプションをオーバーライドします。
時刻の構文について詳しくは、 時間間隔の形式を参照してください。
- --D 開始時刻,終了時刻
- 指定された時間間隔中にディスパッチされたジョブを表示します。 時刻を次の形式で指定します。yyyy/mm/dd/HH:MM. 時間間隔ストリングにはスペースを指定しないでください。
-a オプションと一緒に使用する必要があります。これは、実行中のジョブでのみ結果が検出されるためです。
時刻の構文について詳しくは、 時間間隔の形式を参照してください。
- --f ログファイル名 |-f
- 指定されたイベント・ログを検索します。これはオフライン分析に役立ちます。 絶対パスまたは相対パスのいずれかを指定してください。
指定するファイル・パスには、UNIX の場合は最大 4094 文字、Windows の場合は最大 255 文字を含めることができます。
-f- オプションを指定して、 bhist コマンドが lsb.events ログ・ファイルを使用するように強制します。 IBM Spectrum LSF Explorer (LSF Explorer) を使用してイベント・ログ・レコードをロードする場合、 -f- オプション (またはログ・ファイルを指定する任意の -f 引数) を使用すると、 bhist コマンドは強制的に LSF Explorerをバイパスします。
注: bhist -cname、 -t、および -T オプションは、常に LSF Explorer をバイパスし、代わりに lsb.events ファイルから情報を取得します。LSF Explorer を使用してイベント・ログ・レコードをロードする方法について詳しくは、 lsf.conf ファイルの LSF_QUERY_ES_SERVERS パラメーターおよび LSF_QUERY_ES_FUNCTIONS パラメーターを参照してください。
- -ユーザーグループ
- 指定されたユーザー・グループに対して bsub
-G コマンドを使用して実行依頼されたユーザー・グループに関連付けられているジョブを表示します。 -G オプションは、指定されたユーザー・グループ内のサブグループからのジョブを表示しません。
-G オプションを -u オプションと一緒に使用することはできません。 ユーザー・グループ名のみを指定できます。 キーワード all は、 -G オプションではサポートされません。
- -ジョブ名
- 指定されたジョブ名を持つジョブを表示します。
ジョブ名の最大長は 4094 文字です。 ジョブ名が固有ではありません。
ワイルドカード文字 (*) は、ジョブ名内の任意の場所で使用できますが、配列指標内で使用することはできません。 例えば、パターン job* は以下を返します。jobAおよびjobarray[1]. *AAA*[1] パターンは、以下を含む名前を持つジョブ配列内の最初のエレメントを返します。AAAただし、ワイルドカードが配列指標内にあるため、パターン job1[*] は何も返しません。
- -Jd "job_description"
- 指定されたジョブ記述を持つジョブを表示します。
ジョブ記述の最大長は 4094 文字です。 ジョブ記述は固有ではありません。
ワイルドカード文字 (*) は、ジョブ記述内の任意の場所で使用できます。
- -Lp ls_project_name
- 指定された LSF License Scheduler プロジェクトに属するジョブに関する情報を表示します。
- --m"ホスト名..."
- 指定されたホストにディスパッチされているジョブを表示します。
- --n number_logfiles|-n min_logfile,max_logfile|-n0
- 指定された数のイベント・ログを検索します。現在のイベント・ログから始めて、最新のログを連続した順序で処理します。 $(LSB_SHAREDIR)/cluster_name/logdir内のすべてのイベント・ログ・ファイル (最大 100 ファイル) を指定するには、0 を指定します。
ファイルを削除すると、連続した番号付けが中断され、古いファイルは bhist コマンドにアクセスできなくなります。 例えば、3 を指定すると、 LSF は lsb.events、 lsb.events.1、および lsb.events.2 ファイルを検索します。 4 を指定すると、 LSF は lsb.events、 lsb.events.1、 lsb.events.2、および lsb.events.3 ファイルを検索します。 ただし、 lsb.events.2ファイルが欠落している場合は、両方の検索に lsb.events ファイルと lsb.events.1 ファイルのみが含まれます。
- --n number_blocks(LSF Explorerのみ)
- LSF Explorer を使用してイベント・ログ・レコードをロードする場合は、 -n オプションを使用して、 LSF Explorer が返すジョブ・レコードの数 (ブロック・レコードの数) を制御します。 ブロック・サイズは LSF Explorerで構成されます。 LSF Explorer を使用してイベント・ログ・レコードをロードする方法について詳しくは、 lsf.conf ファイルの LSF_QUERY_ES_SERVERS パラメーターおよび LSF_QUERY_ES_FUNCTIONS パラメーターを参照してください。
- --N host_name|-N host_model|-N cpu_factor
- 指定された CPU 係数、または指定されたホストまたはホスト・モデルの CPU 係数によって CPU 時間を正規化します。
bhist コマンドをイベント・ログに対して直接使用する場合は、CPU 係数を指定する必要があります。
lsinfo コマンドを使用して、ホスト・モデルと CPU ファクターの情報を取得します。
- --P プロジェクト名
- 指定されたプロジェクトに属するジョブに関する情報を表示します。
- -キュー名
- 指定されたキューに実行依頼されたジョブに関する情報を表示します。
- --S 開始時刻,終了時刻
- 指定された時間間隔中に実行依頼されたジョブに関する情報を表示します。 時刻を次の形式で指定します。yyyy/mm/dd/HH:MM. 時間間隔ストリングにはスペースを指定しないでください。
-a オプションと一緒に使用する必要があります。これは、実行中のジョブでのみ結果が検出されるためです。
時刻の構文について詳しくは、 時間間隔の形式を参照してください。
- --T 開始時刻,終了時刻
- -t オプションと一緒に使用します。
指定された時間間隔内のジョブ・イベントに関する情報を表示します。 時刻を次の形式で指定します。yyyy/mm/dd/HH:MM. 時間間隔ストリングにはスペースを指定しないでください。
時刻の構文について詳しくは、 時間間隔の形式を参照してください。
- --u ユーザー名|-uすべて
- 指定されたユーザーによって実行依頼されたジョブに関する情報、またはキーワード all が指定されている場合はすべてのユーザーによって実行依頼されたジョブに関する情報を表示します。 Windows ユーザー・アカウントを指定するには、ドメイン名を大文字で組み込み、Windows コマンドで単一の円記号 (DOMAIN_NAME\user_name) を使用するか、UNIX コマンドで二重の円記号 (DOMAIN_NAME\\user_name) を使用します。
- job_ID | "job_ID[index]" ...
- すべてのイベント・ログ・ファイルを検索し、指定されたジョブに関する情報のみを表示します。 ジョブ配列を指定すると、すべてのエレメントが発生順に表示されます。
ジョブIDを指定するのは、どのジョブが欲しいかがはっきりわかっている場合なので、ジョブの選択を制御する他のオプション(-a、-d、-e、-p、-r、-s、-D、-S、-T、-app、-G、-J、-Jd、-Lp、-M、-q、-u)は指定しないでください。 選択基準の非論理的な組み合わせを指定すると、システムは一致するジョブを戻しません。
LSF マルチクラスター機能 ジョブ転送モードでは、ローカル・ジョブ ID とクラスター名を使用して、リモート・クラスターからジョブの詳細を取得できます。 以下の照会構文を使用します。bhist submission_job_id@submission_cluster_nameジョブ配列の場合は、以下の照会構文を使用します。bhist "submission_job_id[index]"@submission_cluster_namebhist -l job_id の代わりに src_job_id@src_cluster_name を使用する利点は、実行クラスター内のローカル・ジョブ ID を知らなくても、実行クラスター内のローカル・ジョブを照会するための別名として src_job_id@src_cluster_name を使用できることです。 bhist コマンドの出力は、使用するジョブ ID (ローカル・ジョブ ID または src_job_id@src_cluster_name) に関係なく同じです。
bhist 0 オプションを使用して、ローカル・クラスター内のすべてのヒストリカル・ジョブを検索できますが、 bhist 0@submission_cluster_name オプションはサポートされていません。
- -h
- コマンドの使用法を stderr に出力して終了します。
- -V
- リリース・バージョンを stderr に出力して終了します。
出力: デフォルト・フォーマット
- メモリー使用量
- ピーク・メモリー使用量および平均メモリー使用量を表示します。
MEMORY USAGE: MAX MEM: 11 Mbytes; AVG MEM:6 Mbytes; MEM Efficiency: 100%消費メモリーが現在の
rusage量より大きいか小さい場合は、次回同じジョブ実行依頼を行うときに、それに応じてrusage値を調整することができます。 - CPU 使用量
- CPU 効率と CPU ピーク使用量を表示します。
CPU USAGE: CPU EFFICIENCY: 98%; CPU PEAK USAGE: 2フィックスパック 14 以降、 は、ジョブの実行中に使用される CPU の最大数 (CPU ピーク)、CPU のピークまでの期間 (秒単位)、CPU 平均効率、および CPU ピーク効率を表示します。 以下に例を示します。
ここで、CPU USAGE: CPU PEAK: 4.24; CPU PEAK DURATION: 54 second(s) CPU AVERAGEG EFFICIENCY: 99.55%; CPU PEAK EFFICIENCY: 106.02%CPU PEAKは、ジョブの実行に使用される CPU の最大数です。CPU PEAK DURATIONは、ジョブの CPU ピークに達するまでの時間 (秒) です。CPU AVERAGE EFFICIENCYは、以下の式を使用して計算されます。CPU AVERAGE EFFICIENCY = (CPU_TIME / (JOB_RUN_TIME * CPU_REQUESTED)) * 100%CPU AVERAGE EFFICIENCYは、ジョブの実行中にCPU_PEAK_SAMPLE_DURATIONジョブの実行中に( lsb.params ファイルで定義された)値に達するたびにCPU_TIME値とJOB_RUN_TIME値は、最後の計算以降にのみ使用されます。ジョブのCPU AVERAGE EFFICIENCY値は、各サイクルで計算されたすべてのCPU AVERAGE EFFICIENCY値の平均です。CPU PEAK EFFICIENCYは、以下の式を使用して計算されます。CPU PEAK Efficiency = (CPU PEAK / CPU_REQUESTED) * 100%
- 時間の要約
- ジョブが様々な状態で費やした時間の統計。
- PEND
- 合計待ち時間 (ジョブがディスパッチされる前のユーザー中断時間を除く)。
- PSUSP (P)
- 保留中のジョブの合計ユーザー中断時間。
- 実行
- ジョブの合計実行時間。
- USUSP (米国)
- ジョブがディスパッチされた後のユーザー中断時間の合計。
- SSUSP (P)
- ジョブがディスパッチされた後のシステムの合計中断時間。
- 不明 (UNKWN)
- ジョブの合計不明時間 (実行ホスト上の sbatchd デーモンが一時的に到達不能の場合、ジョブ状況は不明となります)。
- 合計
- ジョブがすべての状態で費やした合計時間。 終了したジョブの場合、これはターンアラウンド・タイムです。これは、ジョブの実行依頼からジョブの完了までの時間間隔です。
出力:ロングフォーマット(-l)
この-lオプションは、以下の追加フィールドを含む長形式リストを表示します。
- プロジェクト
- ジョブの実行依頼元のプロジェクト。
- アプリケーション・プロファイル (Application Profile )
- ジョブの実行依頼先のアプリケーション・プロファイル。
- コマンド
- ジョブ・コマンド。
詳細ヒストリーには、ジョブ・グループの変更、ジョブが転送された日時、およびジョブが転送されたクラスターの名前が含まれます。
表示されるジョブ・コマンドには、UNIX の場合は最大 4094 文字、Windows の場合は最大 255 文字を含めることができます。
- 初期チェックポイント期間
- bsub -k オプションを使用してジョブ・レベルで指定された初期チェックポイント期間、または lsb.applications ファイル内の CHKPNT_INITPERIOD パラメーターを使用してアプリケーション・プロファイルで指定された初期チェックポイント期間。
- チェックポイント期間
- bsub -k オプションを使用してジョブ・レベルで指定されたチェックポイント期間、 lsb.queues ファイル内の CHKPNT パラメーターを使用してキューで指定されたチェックポイント期間、または lsb.applications ファイル内の CHKPNT_PERIOD パラメーターを使用してアプリケーション・プロファイルで指定されたチェックポイント期間。
- チェックポイント・ディレクトリー
- bsub -k オプションを使用してジョブ・レベルで指定されたチェックポイント・ディレクトリー、 lsb.queues ファイル内の CHKPNT パラメーターを使用してキューに指定されたチェックポイント・ディレクトリー、または lsb.applications ファイル内の CHKPNT_DIR パラメーターを使用してアプリケーション・プロファイルに指定されたチェックポイント・ディレクトリー。
- 移行のしきい値
- bsub -mig オプションを使用して、ジョブ・レベルで指定されたマイグレーションしきい値。
- 要求されたリソース
- bsub コマンドで指定したすべてのリソース要件ストリングを表示します。
- 実行 CWD
- ジョブの実行時に使用される実際の現行作業ディレクトリー (CWD)。
- ホスト・ファイル
- ジョブの実行依頼または変更時に使用されるユーザー指定のホスト・ファイルへのパス。
- 処刑ルッケージ
- 結合された RES_REQ に以下がある場合に表示されます。rusageOR | | 構文。 選択された代替がここに表示されます。
- 有効な RES_REQ
- 任意の OR 構成体を解決した後にスケジューラーによって認識されるジョブのリソース要件を表示します。
- ジョブ情報のサイズ変更
- 対象ユーザー向けJOB_NEWbhist コマンドは、サブミット行に自動化可能属性およびサイズ変更通知コマンドを表示します。
- 対象ユーザー向けJOB_MODIFY2bmod コマンドからのイベントの場合、 bhist コマンドは、サブミット行に自動サイズ変更可能属性およびサイズ変更通知コマンドを表示します。
- bmod -arn
jobID
Parameters of Job are changed: Autoresizable attribute is removed; - bmod -ar
jobID
Parameters of Job are changed: Job changes to autoresizable; - bmod -rnc
resize_notification_cmd
jobID
Parameters of Job are changed: Resize notification command changes to: <resize_notification_cmd>;h - bmod -rncn
jobID
Parameters of Job are changed: Resize notification command is removed;
- bmod -arn
jobID
- 対象:JOB_RESIZE_NOTIFY_STARTevent の場合、 bhist コマンドは以下のメッセージを表示します。
Added <num_tasks> tasks on host <host_list>, <num_slots> additional slots allocated on <host_list> - 対象:JOB_RESIZE_NOTIFY_ACCEPTevent の場合、 bhist コマンドは以下のメッセージを表示します。
- 通知コマンドが構成され、 sbatchd デーモンが正常に通知コマンドを初期化すると、 bhist コマンドは次のメッセージを表示します。
Resize notification accepted. Notification command initialized (Command PID: 123456) - 通知コマンドが定義されていない場合、 bhist は以下のメッセージを表示します。
Resize notification accepted - sbatchd デーモンが何らかの理由で障害を報告した場合、 bhist は以下のメッセージを表示します。
Resize notification failed
- 通知コマンドが構成され、 sbatchd デーモンが正常に通知コマンドを初期化すると、 bhist コマンドは次のメッセージを表示します。
- 対象:JOB_RESIZE_NOTIFY_DONEevent の場合、 bhist コマンドは以下のメッセージを表示します。
- 状況が 0 の場合、Resize notification command completed
- 状況が 1 の場合、Resize notification command failed
- 対象ユーザー向けJOB_RESIZE_RELEASEevent の場合、 bhist コマンドは以下の情報を表示します。
Release allocation on <num_hosts> Hosts/Processors <host_list> by user or administrator <user_name> Resize notification accepted;bmod -rncn オプションの場合、 bhist コマンドは以下のメッセージを表示します。Resize notification command disabled - 対象ユーザー向けJOB_RESIZE_CANCELevent の場合、 bhist コマンドは以下のメッセージを表示します。
Cancel pending allocation request
- 同期実行
- -K オプションを指定してジョブが実行依頼されました。 LSF はジョブを実行依頼し、ジョブが完了するのを待ちます。
- 終了したジョブ: 終了理由
- 終了したジョブについて、終了理由を表示します。
- 対話式ジョブ
- 対話式ジョブの場合、 bhist -l コマンドは、ジョブの実行ホーム・ディレクトリー、現行作業ディレクトリー、または実行中の PID に関する情報を表示しません。
- ホスト上で < number> 個のタスクがディスパッチされました
- ジョブ内のタスクの数、およびそれらのタスクが処理のために送信されたホストの数。 lsf.conf ファイルで LSB_ENABLE_HPC_ALLOCATION=Y パラメーターが設定されている場合に表示されます。
- 割り当てられたリソース <resource___hostname> 名前 <names>
- フィックスパック 14 以降、リソースに割り当てられる 名は、ジョブでディスパッチされます。 情報はこの形式でジョブのヘッダーに入れられます。 例:Assigned resource <fpga___hostname> with names <card1 card2 card3>
- 割り振り済み < number> 個のホスト上のスロット
- タスクの数、およびスロットが割り振られているホストに基づいて、ジョブに割り振られたスロットの数。 lsf.conf ファイルで LSB_ENABLE_HPC_ALLOCATION=Y パラメーターが設定されている場合に表示されます。
- 要求されたネットワークおよび PE ネットワーク ID
- bsub-network オプションを指定してサブミットされた IBM Parallel Edition (PE) ジョブのネットワーク・リソース要件、または NETWORK_REQ パラメーターがキュー ( lsb.queues ファイルで定義されている) またはアプリケーション・プロファイル ( lsb.applications ファイルで定義されている) で指定されている場合。
bhist -l 749 Job <749>, User <user1>;, Project <default>, Command <my_pe_job> Mon Jun 4 04:36:12: Submitted from host <hostB>, to Queue < priority>, CWD <$HOME>, 2 Tasks, Requested Network <type=sn_all:protocol=mpi:mode=US:usage= shared:instance=1>; Mon Jun 4 04:36:15: Dispatched 2 Task(s) on Host(s) <hostB>, Allocated <1> Slot(s) on Host(s) <hostB>; Effective RES_REQ <select[type == local] rusage [nt1=1.00] >, PE Network ID <1111111> <2222222> used <1> window(s)per network per task; Mon Jun 4 04:36:17: Starting (Pid 21006); - データ要件
- -l -data オプションは、データ要件およびデータ要件に対する変更を含むジョブについて、要求されたファイルまたはタグのリストを表示します。
出力:親和性リソース要求情報(-l-aff)
- HOST
- タスクが実行されているホスト。
- タイプ
- CPU バインディングのために要求された処理装置タイプ。 次のうち 1 つnuma,socket,core、またはthread.
- 地位
- CPU バインディングの要求された処理装置バインディング・レベル。 次のうち 1 つnuma,socket,core、またはthread. CPU バインディング・レベルが要求されていない場合は、ダッシュ (-) 表示されます。
- EXCL
- 排他的 CPU バインディングのために要求された処理装置バインディング・レベル。 次のうち 1 つnuma,socket、またはcore. 排他的バインド・レベルが要求されていない場合には, ダッシュ (-) 表示されます。
- IDS
- タスクの CPU 割り振りの物理 ID または論理 ID のリスト。
リストは、スラッシュ文字 (() で区切られた整数のシーケンスとして表されるパスのセットで構成されます。/)。ホストのトポロジー・ツリーを使用します。 各パスは、タスクに割り振られる固有の処理装置を識別します。 例えば、次の形式のストリングがあるとします。3/0/5/12NUMA ノード 3 のソケット 0 のコア 5 のスレッド 12 への割り振りを表します。 次の形式のストリング2/1/4NUMA ノード 2 のソケット 1 のコア 4 への割り振りを表します。 整数は、 bhosts -aff コマンドからトポロジー・ツリーに表示されるノード ID 番号に対応します。
- POL
- 要求されたメモリー・バインディング・ポリシー。 以下のいずれかlocalまたはpref. メモリー・バインディングが要求されていない場合は、ダッシュ (-) 表示されます。
- NUMA
- タスク・メモリーがバインドされる NUMA ノードの ID。 メモリー・バインディングが要求されない場合は、ダッシュ (-) 表示されます。
- サイズ
- NUMA ノード上のタスクに割り振られているメモリーの量。
bsub -n 6 -R"span[hosts=1] rusage[mem=100]affinity[core(1,same=socket,
exclusive=(socket,injob)):cpubind=socket:membind=localonly:distribute=pack]" myjob
Job <6> is submitted to default queue <normal>.
bhist -l -aff 6
Job <6>, User <user1>, Project <default>, Command <myjob>
Thu Feb 14 14:13:46: Submitted from host <hostA>, to Queue <normal>, CWD <$HO
ME>, 6 Task(s), Requested Resources <span[hos
ts=1] rusage[mem=100]affinity[core(1,same=socket,exclusive
=(socket,injob)):cpubind=socket:membind=localonly:distribu
te=pack]>;
Thu Feb 14 14:15:07: Dispatched 6 Task(s) on Host(s) <hostA> <hostA> <hostA>
<hostA> <hostA> <hostA>; Allocated <6> Slot(s) on Host(s)
<hostA> <hostA> <hostA> <hostA> <hostA> <hostA>;
Effective RES_REQ <select[type == local] order[r15s:pg]
rusage[mem=100.00] span[hosts=1] affinity [core(1,same=
socket,exclusive=(socket,injob))*1:cpubind=socket:membind=
localonly:distribute=pack] >;
AFFINITY:
CPU BINDING MEMORY BINDING
------------------------ --------------------
HOST TYPE LEVEL EXCL IDS POL NUMA SIZE
hostA core socket socket /0/0/0 local 0 16.7MB
hostA core socket socket /0/1/0 local 0 16.7MB
hostA core socket socket /0/2/0 local 0 16.7MB
hostA core socket socket /0/3/0 local 0 16.7MB
hostA core socket socket /0/4/0 local 0 16.7MB
hostA core socket socket /0/5/0 local 0 16.7MB
Thu Feb 14 14:15:07: Starting (Pid 3630709);
Thu Feb 14 14:15:07: Running with execution home </home/jsmith>, Execution CWD
</home/jsmith>, Execution Pid <3630709>;
Thu Feb 14 14:16:47: Done successfully. The CPU time used is 0.0 seconds;
Thu Feb 14 14:16:47: Post job process done successfully;
MEMORY USAGE:
MAX MEM: 2 Mbytes; AVG MEM: 2 Mbytes; MEM EFFICIENCY: 100%
CPU USAGE:
CPU PEAK: 4.24 ; CPU PEAK DURATION: 54 second(s)
CPU AVERAGE EFFICIENCY: 99.55%; CPU PEAK EFFICIENCY: 106.02%
Summary of time in seconds spent in various states by Thu Feb 14 14:16:47
PEND PSUSP RUN USUSP SSUSP UNKWN TOTAL
81 0 100 0 0 0 181
出力データ要求情報(-l-data)
bhist -data -l 84046
Job <84046>, User <user1>, Project <default>, Command <bstage out -src /home/
user1/data2; bstage out -src /home/user1/data2 -dst /tmp;
datajob1.sh>
Mon Aug 18 15:06:57: Submitted from host <hostA>, to Queue <normal>, CWD </sc
ratch/user1/workspace/simulation/data/>, Data Require
ment Requested;
DATA REQUIREMENTS:
FILE: hostA:/home/user1/data2
SIZE: 40 MB
MODIFIED: Thu Aug 14 17:01:57
FILE: hostA:/home/user1/data3
SIZE: 45 MB
MODIFIED: Fri Aug 15 16:32:45
Mon Aug 18 15:07:07: Dispatched to <hostB>, Effective RES_REQ <select[type ==
local] order[r15s:pg] >;
Mon Aug 18 15:07:07: Starting (Pid 16128);
Mon Aug 18 15:07:07: Running with execution home </home/user1>, Execution CWD <
/scratch/user1/workspace/simulation/data/>, Execution
Pid <16128>;
Mon Aug 18 15:08:47: Done successfully. The CPU time used is 0.4 seconds;
Mon Aug 18 15:08:47: Post job process done successfully;
MEMORY USAGE:
MAX MEM: 3 Mbytes; AVG MEM: 2 Mbytes; MEM EFFICIENCY: 100%
CPU USAGE:
CPU PEAK: 4.24 ; CPU PEAK DURATION: 54 second(s)
CPU AVERAGE EFFICIENCY: 99.55%; CPU PEAK EFFICIENCY: 106.02%
Summary of time in seconds spent in various states by Mon Aug 18 15:08:47
PEND PSUSP RUN USUSP SSUSP UNKWN TOTAL
10 0 100 0 0 0 110
出力:ユーザ指定のホストファイル(-l-hostfile)
bhist -l -hostfile 1976
Job <1976>, User <user1>, Project <default>, Command <my_data_job>
Fri Sep 20 16:31:17: Submitted from host <hostA>, to
Queue <normal>, CWD <$HOME/source/user1/work>,
Host file </home/user4/myhostfile>;
Summary of time in seconds spent in various states by Wed Sep 25 10:50:37
PEND PSUSP RUN USUSP SSUSP UNKWN TOTAL
21305 0 0 0 0 0 21305
USER-SPECIFIED HOST FILE:
HOST SLOTS
host01 3
host02 1
host01 1
host02 2
host03 1
ファイル
以下を読み取ります。lsb.eventsを適用します。
関連資料
lsb.events ファイル、 bgadd、 bgdel、 bjgroup、 bsub、 bjobs、 lsinfo コマンド
時間間隔の形式
この時間間隔を使用して、取得して表示するデータを収集する開始時刻と終了時刻を定義します。 開始時刻と終了時刻の両方を指定できますが、いずれかの値をデフォルトのままにすることもできます。 時刻のいずれかを絶対時刻として指定するか、日付または時刻を指定するか、または現在時刻を基準にして時刻を指定することができます。
時間間隔を指定します。
start_time,end_time|start_time,|,end_time|start_time
start_time または end_time は、以下の形式で指定します。
[year/][month/][day][/hour:minute|/hour:]|.|.-relative_int
- 年
- 暦年を表す 4 桁の数値。
- 月
- 1 から 12 まで。1 は 1 月、12 は 12 月です。
- 日
- 1 から 31 までの数字で、日を表します。
- 時
- 0 から 23 までの整数で、24 時間クロックの時刻を表します。
- 分
- 0 から 59 までの整数で、時間の分を表します。
- .(ピリオド)
- 現行を表しますmonth/day/hour:minute.
- .-relative_int
- 現在より前の相対開始時刻または相対終了時刻を指定する 1 から 31 までの数値。
- start_time、end_time
- 間隔の開始時刻と終了時刻の両方を指定します。
- start_time、
- 開始時刻を指定し、終了時刻をデフォルトの now にします。
- 、end_time
- 最初にログに記録されたオカレンスから開始し、指定された時刻に終了することを指定します。
- start_time
- 指定された最も具体的な期間の先頭から開始し、指定された期間の最大値で終了します。 例:2/2 月の月を指定します。2 月 1 日の午前 00:00 に開始し、2 月の可能な最後の分 (2 月 28 日の午前 0 時) に終了します。
絶対時間の例
現在時刻が以下のようになっているとします。May 9 17:06 2008:
1,8 =May 1 00:00 2008へMay 8 23:59 2008
,4 = 最初のオカレンスの時刻。May 4 23:59 2008
6 =May 6 00:00 2008へMay 6 23:59 2008
2/ =Feb 1 00:00 2008へFeb 28 23:59 2008
/12: =May 9 12:00 2008へMay 9 12:59 2008
2/1 =Feb 1 00:00 2008へFeb 1 23:59 2008
2/1, =Feb 1 00:00現在時刻まで
,. = 現在時刻までの最初のオカレンスの時刻
,2/10: = 最初のオカレンスの時刻。May 2 10:59 2008
2001/12/31,2008/5/1 = 開始Dec 31 2001 00:00:00へMay 1 2008 23:59:59
相対時間の例
.-9, =April 30 17:06 2008現在時刻まで
,.-2/ = 最初のオカレンスの時刻。Mar 7 17:06 2008
.-9,.-2 = 9 日前から 2 日前 (April 30 17:06 2008へMay 7 17:06 2008)