BApp

アプリケーション・プロファイル構成に関する情報を表示します。

概要

bapp [-alloc] [-l | -w] [ application_profile...].
bapp [-h | -V]

説明

lsb.applications ファイルで構成されているアプリケーション・プロファイルに関する情報を表示します。

すべてのアプリケーション・プロファイルのアプリケーション名、タスク統計、およびジョブ状態統計を返します。

LSF マルチクラスター機能では、ローカル・クラスター内のすべてのアプリケーション・プロファイルに関する情報を返します。

-alloc オプションが使用されている場合、ジョブ・スロット統計を返します。

CPU 時間は正規化されます。

オプション

-割り振り
スロットのカウンターを表示しますRUN,SSUSP,USUSPおよびRSV状態。 スロット割り振りは、ジョブが排他的ジョブであるかどうかによって異なります。
-w

ワイド・フォーマット。 フィールドは切り捨てられずに表示されます。

-l

追加情報付き長形式。

アプリケーション・プロファイルに関する以下の追加情報を表示します。
  • 説明
  • プロファイルの特性と統計
  • パラメーター
  • (フィックスパック16現在) CGROUP_CPU_LIMIT_USAGE
  • (修正パック 15 時点) CGROUP_CPU_SHARES_FACTOR パーセント
  • リソース使用量の制限
  • 関連コマンド
  • バインディング・ポリシー
  • NICE
  • ジョブ制御
  • 保留時間制限
  • 適格保留時間制限
  • (フィックスパック 4 以降) APS 優先度係数
アプリケーション・プロファイル ...
指定されたアプリケーション・プロファイルに関する情報を表示します。
-h
コマンドの使用法を stderr に出力して終了します。
-V
製品リリース・バージョンを stderr に出力して終了します。

デフォルトの出力フォーマット

以下のフィールドを表示します。

APPLICATION_NAME
アプリケーション・プロファイルの名前。 アプリケーション・プロファイルは、通常それらのプロファイル内で実行されるアプリケーションのタイプに対応するように名前が付けられます。
NJOBS (衛星)
アプリケーション・プロファイルに現在保持されているすべてのジョブのタスクの総数。 この合計には、保留中のジョブ、実行中のジョブ、および中断状態のジョブのタスクが含まれます。

-alloc オプションが使用されている場合、total は以下のカウンターの合計です。RUN,SSUSP,USUSPおよびRSV状態。

PEND
アプリケーション・プロファイル内のすべての保留ジョブのタスク数。 -alloc オプションと一緒に使用された場合、出力は次のようになります。0保留中のジョブにはスロット割り振りがないためです。
実行
アプリケーション・プロファイル内のすべての実行中のジョブのタスク数。 -alloc オプションが使用されている場合、アプリケーション・プロファイル内のジョブの合計スロット数が割り振られます。
SUSP
アプリケーション・プロファイル内のすべての中断状態のジョブのタスク数。 -alloc オプションが使用されている場合、アプリケーション・プロファイル内のジョブの合計スロット数が割り振られます。

-l オプションを使った長い出力フォーマット

-l オプションは、デフォルトの出力フィールドに加えて、以下のフィールドを表示します。

説明
アプリケーション・プロファイルの標準的な使用法の説明。
パラメーター/統計
SSUSP (P)
ロード・レベルまたは実行ウィンドウが原因で LSF によって中断された、アプリケーション・プロファイル内のすべてのジョブのタスク数。
USUSP (米国)
ジョブ実行依頼者または LSF 管理者によって中断された、アプリケーション・プロファイル内のすべてのジョブのタスク数。
RSV (R)
アプリケーション・プロファイル内の保留中のジョブのスロットを予約するタスクの数。
ENV_VARS (V)
アプリケーション固有の環境変数によって定義される名前と値のペア。
cgroup_cpu_limit_usage
Fix Pack 16以降、管理者は LSF を構成する CGROUP_CPU_LIMIT_USAGE パラメータを使用して、CPU使用量に制限のないジョブcグループ(v1 または v2 )を作成できるようになりました。 有効にすると、 LSF 、期間とクォータを使用して、cgroupがジョブを実行するときに取得するCPUプロセスの量を制御する。 具体的には、 LSF 、これらの要素を考慮してCPU使用量の上限を設定しようとする:
  • v1 cgroupsの場合: Linux cgroup cpu.cfs_quota_us (合計利用可能時間またはクォータ)値と cpu.cfs_period_us (定義された期間に消費された量)値。
  • v2 cgroupsの場合: Linux cgroup cpu.max 。これは、クォータと期間を考慮した、プロセスグループが消費できる最大CPU時間である。
LSF このように期間とクォータの値を計算する:
period=period_us

quota=(#tasks + task_delta )*(#cores/MXJ) * scaling_factor * period_us
算出されたクォータが1000未満の場合、 LSF 、クォータ値1000が使用されることに注意してください。
CGROUP_CPU_LIMIT_USAGE パラメーターは以下のように設定できる:
  • デフォルト値でキーワードを使用してCPU制限を有効にし、設定するには、以下を設定する:
    CGROUP_CPU_LIMIT_USAGE=Y|y
    キーワードとデフォルトは以下の通り:
    • SCALING_FACTOR スケーリング係数 1.0 の値。
    • TASK_DELTA タスクデルタ 0 の値。
    • SCALING_FACTOR_ONLYに設定されている。 N
    • PERIOD_USperiod_usの値は100000。
  • CPU制限を無効にして、cgroupの作成時にCPU制限がないようにするには、次のように設定する:
    CGROUP_CPU_LIMIT_USAGE=N|n
  • LSF 、クォータと期間によるCPU制限の計算方法に影響を与えるカスタム値によるCPU制限を有効にして設定するには、次のように設定する:
    CGROUP_CPU_LIMIT_USAGE=[SCALING_FACTOR[scaling_factor]][TASK_DELTA[task_delta]][SCALING_FACTOR_ONLY[Y|y|N|n]] [PERIOD_US[period_us]]

    いずれかのキーワードを設定することで、CPU使用量の制限が可能になる。 SCALING_FACTOR_ONLY[Y] を設定することは #cores/MXJ=1 を意味する。

    各キーワードの有効な値は以下の通り:
    • SCALING_FACTORscaling_factor の値を 1.0 から 10.0 の間の正の浮動小数点数で指定する。
    • TASK_DELTAtask_deltaの値は0から10までの整数で指定する。
    • SCALING_FACTOR_ONLY: Y または y に設定すると、 SCALING_FACTOR キーワードで指定した scaling_factor 値のみに基づいて CPU 制限値を計算する。 そうでない場合は、 N または n を指定して、他のキーワードでも計算できるようにする。
    • PERIOD_USperiod_usの値は1000から1000000の間の整数で指定する。
cgroup_cpu_shares_factor

Fix Pack 15以降、管理者は CGROUP_CPU_SHARES_FACTOR パラメータを使用して、 cpu.shares および cpu.weight Linux cgroup (v1 または v2) インターフェイスのデフォルト値のパーセンテージを指定できるようになりました。これにより、CPUへの負荷が低いジョブは、他の実行中のすべてのジョブと同じCPU占有率またはCPU占有量ではなく、他のジョブのCPU占有率またはCPU占有量の一部を使用できるようになります。 cpu.sharescpu.weight の初期値は、設定されていればこの CGROUP_CPU_SHARES_FACTOR の値でスケーリングされる。 CGROUP_CPU_SHARES_FACTOR の値は、アプリケーション・プロファイルとキュー・レベルで指定することができる。 複数のレベルで定義されている場合、 LSF 、最も小さい値が使用される。 CGROUP_CPU_SHARES_FACTOR パラメータを使用するには、 ファイルの LSB_CGROUP_CPU_SHARES_OLD_DEFAULTlsf.conf パラメータを N または n に設定するか、デフォルトの未定義のままにしてください。

この値はパーセンテージを表すので、100未満の正の整数を指定する。 例えば、 CGROUP_CPU_SHARES_FACTOR=25 は、 cpu.sharescpu.weight の値の25%のCPUシェア率を示す。

ジョブごとのリソース使用制限
アプリケーション・プロファイルに関連付けられているジョブに適用されるソフト・リソース使用制限。 これらの制限は、ジョブごとおよびプロセスごとに適用されます。
以下のジョブごとの制限がサポートされています。
CPULIMIT
指定されたホストの CPU 係数に対してジョブが使用できる最大 CPU 時間 (分単位)。 このCPULIMIT実行ホストの CPU 係数によってスケーリングされるため、低速ホストでより多くの時間がジョブに許可されます。
memlimit
プロセスの最大実行セット・サイズ (RSS)。

デフォルトでは、制限は KB 単位で表示されます。 より大きな表示単位 (MB、GB、TB、PB、または EB) を指定するには、 lsf.conf ファイルで LSF_UNIT_FOR_LIMITS パラメーターを使用します。

MEMLIMIT_TYPE (メモリー制限タイプ)
メモリー制限は、1 つのジョブが消費できるメモリーの最大量です。 このレベルを超えるジョブは強制終了されます。 以下に基づいて、適用するさまざまなタイプのメモリー制限を指定できます。PROCESS,TASK、またはJOB(またはこの 3 つの任意の組み合わせ)。
プロセス制限
1 つのジョブに割り振られる並行プロセスの最大数。
SWAPLIMIT (ソフトウェア制限)
ジョブが使用できるスワップ・スペースの限度。

デフォルトでは、制限は KB 単位で表示されます。 より大きな表示単位 (MB、GB、TB、PB、または EB) を指定するには、 lsf.conf ファイルで LSF_UNIT_FOR_LIMITS パラメーターを使用します。

タスク・リスト
1 つのジョブに割り振られるタスクの最大数。
スレッド制限
THREADLIMIT1 つのジョブに割り振られる並行スレッドの最大数。
プロセスごとのリソース使用量制限
以下の UNIX プロセスごとのリソース制限がサポートされています。
CORELIMIT (限界値)
コア・ファイルの最大サイズ。

デフォルトでは、制限は KB 単位で表示されます。 より大きな表示単位 (MB、GB、TB、PB、または EB) を指定するには、 lsf.conf ファイルで LSF_UNIT_FOR_LIMITS パラメーターを使用します。

dataLimit
プロセスのデータ・セグメントの最大サイズ (KB 単位)。 この制限により、プロセスが割り振ることができるメモリーの量が制限されます。
ファイル制限
プロセスが作成できる最大ファイル・サイズ (KB)。
実行制限
プロセスが使用できる壁時計時刻の最大値 (分単位)。 RUNLIMIT は、実行ホストの CPU 係数によってスケーリングされます。
スタック制限
プロセスのスタック・セグメントの最大サイズです。 この制限により、プロセスがローカル変数または再帰的関数呼び出しに使用できるメモリーの量が制限されます。

デフォルトでは、制限は KB 単位で表示されます。 より大きな表示単位 (MB、GB、TB、PB、または EB) を指定するには、 lsf.conf ファイルで LSF_UNIT_FOR_LIMITS パラメーターを使用します。

バインド・ジョブ
アプリケーション・プロファイルで使用可能な順次ジョブ・プロセスおよび並列ジョブ・プロセスのプロセッサー・バインディング・ポリシー。 以下のいずれかの値を表示します。NONE,BALANCE,PACK,ANY,USER、またはUSER_CPU_LIST.
bapp -l app1
APPLICATION NAME: app1
 -- test processor binding options
...
PARAMETERS:
BIND_JOB: ANY

以前のバージョンとの互換性のために、 bapp -l コマンドは以下を表示します。YまたはNアプリケーション・プロファイルでこれらの値を使用して BIND_JOB パラメーターが定義されている場合。

CHKPNT ディレクトリー
アプリケーション・プロファイルに対して自動チェックポイント機能が有効になっている場合は、チェックポイント・ディレクトリー。
CHKPNT_INITPERIOD (CHKPNT 初期化)
初期チェックポイント期間 (分)。 定期的なチェックポイントは、最初の期間が経過するまで発生しません。
CHKPNT_PERIOD
チェックポイント期間 (分)。 実行中のジョブは、チェックポイント期間ごとに自動的にチェックポイントがとられます。
CHKPNT_METHOD (H)
チェックポイント方式。
MIG
マイグレーションのしきい値 (分単位)。 以下の値0(ゼロ) は、中断状態のジョブを即時にマイグレーションすることを指定します。

ホスト・マイグレーションしきい値も指定されていて、ジョブ値より低い場合は、ホスト値が使用されます。

PRE_EXEC
アプリケーション・プロファイルのジョブ・ベースの実行前コマンド。 PRE_EXEC コマンドは、アプリケーション・プロファイルに関連付けられたジョブが実行ホスト (または並列バッチ・ジョブ用に選択された最初のホスト) にディスパッチされる前に、実行ホスト上で実行されます。
ポST_EXEC
アプリケーション・プロファイルのジョブ・ベースの実行後コマンド。 POST_EXEC コマンドは、ジョブの終了後に実行ホスト上で実行されます。
ホスト・プレビュー EXEC
アプリケーション・プロファイルのホスト・ベースの実行前コマンド。 HOST_PRE_EXEC コマンドは、アプリケーション・プロファイルに関連付けられたジョブが実行ホストにディスパッチされる前に、すべての実行ホストで実行されます。 ジョブ・ベースの実行前 PRE_EXEC コマンドがキュー・レベル/アプリケーション・レベル/ジョブ・レベルで定義された場合、 HOST_PRE_EXEC コマンドはどのレベルの PRE_EXEC コマンドよりも前に実行されます。 ホスト・ベースの実行前コマンドは、Windows システムでは実行できません。
ホスト・ポST_EXEC
アプリケーション・プロファイルのホスト・ベースの実行後コマンド。 HOST_POST_EXEC コマンドは、ジョブの終了後に実行ホスト上で実行されます。 ジョブ・ベースの実行後 POST_EXEC コマンドがキュー・レベル/アプリケーション・レベル/ジョブ・レベルで定義された場合、 HOST_POST_EXEC コマンドは任意のレベルの POST_EXEC コマンドの後で実行されます。 ホスト・ベースの実行後コマンドは、Windows システムでは実行できません。
LOCAL_MAX_PREEXEC_RETRY_ACTION (ローカル MAX_PREEXEC_RETRY_ACTION)
ローカル・クラスター上で実行前コマンドを試行する回数 ( LOCAL_MAX_PREEXEC_RETRY パラメーターの値) に達したときに、ジョブに対して実行するアクション。
ジョブ・インクルード・ポストプロック
JOB_INCLUDE_POSTPROC=Y パラメーターが定義されている場合、ジョブの実行後処理はジョブの一部として組み込まれます。
ジョブ・ポスト・プロセス・タイムアウト
ジョブ実行後処理のタイムアウト (分単位)。 実行後処理にかかる時間がタイムアウトより長い場合、 sbatchd デーモンは実行後処理が失敗したことを報告します (POST_ERR状況)。 UNIX では、ジョブの実行後プロセスのプロセス・グループを強制終了します。 Windows では、タイムアウトの期限が切れたときに実行前コマンドの親プロセスのみが強制終了され、実行前コマンドの子プロセスは強制終了されません。
要求の終了値
これらの値で終了するジョブは、自動的に再キューに入れられます。
RES_REQ (要求)
アプリケーション・プロファイルのリソース要件。 アプリケーション・プロファイルで使用できるのは、これらのリソース要件を満たすホストのみです。
ジョブ開始 (JOB_STARTER)
バッチ・ジョブの直前に実行され、バッチ・ジョブ・ファイルを入力引数として使用する実行可能ファイル。 アプリケーション・プロファイルにサブミットされるすべてのジョブは、ジョブ・スターターを介して実行されます。ジョブ・スターターは、 LSF がジョブ自体を処理する前に特定の実行環境を作成するために使用されます。
再実行可能
もしRERUNNABLEフィールド表示yesアプリケーション・プロファイル内のジョブは、実行ホストが使用不可になると、自動的に再始動または再実行されます。 ただし、 bmod を使用してジョブから再実行可能オプションを除去すると、アプリケーション・プロファイル内のジョブは再始動されません。
再利用の制御
ジョブ再開制御用に構成されたアクション。

構成されたアクションは、[action_type, command] の形式で表示されます。ここで、 action_type は以下のとおりです。RESUME.

中断制御
中断ジョブ制御用に構成されたアクション。

構成されたアクションは、[action_type, command] の形式で表示されます。ここで、 action_type は以下のとおりです。SUSPEND.

TERMINATE_CONTROL (端末制御)
ジョブ制御を終了するために構成されたアクション。

構成されたアクションは、[action_type, command] の形式で表示されます。ここで、 action_type は以下のとおりです。TERMINATE.

間隔が指定されていません
プリエンプタブル・ジョブを優先使用できるようになる前に経過する必要がある、構成済みの中断されない実行時間 (分)。
最大総プリエンプト時間
優先使用を実行できなくなるまでの、構成済みの最大合計優先使用時間 (分)。
NICE
アプリケーションからのジョブが実行される相対スケジューリング優先順位。
現行作業ディレクトリー (CWD) 情報
ジョブの CWD
アプリケーション・プロファイル内のジョブの現行作業ディレクトリー。 パスは、絶対パスにすることも、サブミット・ディレクトリーからの相対パスにすることもできます。このパスには動的パターンが含まれます。
ジョブ CWD_TTL
ジョブの現在の作業ディレクトリーの存続時間。 LSF は、TTL 値に基づいてジョブが終了した後、作成された CWD をクリーンアップします。
JOB_SIZE_LIST (ジョブ・サイズ・リスト)
このアプリケーションで許可されるジョブ・サイズ (タスクの数) のリスト。これには、ジョブ・サブミットがジョブ・サイズを要求しない場合に割り当てられるデフォルトのジョブ・サイズが含まれます。 lsb.applications ファイルで構成されます。
PEND_TIME_LIMIT (保留時間制限)
アプリケーション・プロファイル内のジョブの保留時間制限。 ジョブがこの指定された時間制限より長く保留状態のままである場合、 IBM® Spectrum LSF RTM (LSF RTM) はアラームおよびその他のアクションをトリガーします。 lsb.applications ファイルで構成されます。
適格性の保留時間の制限
アプリケーション・プロファイル内のジョブの適格保留時間制限。 ジョブがこの指定された時間制限より長く適格な保留状態のままである場合、 IBM Spectrum LSF RTM (LSF RTM) はアラームおよびその他のアクションをトリガーします。 lsb.applications ファイルで構成されます。
優先順位
アプリケーション・プロファイルの APS 優先順位係数。 PRIORITY は、構成ファイル lsb.applications内の PRIORITY パラメーターによって定義されます。

関連資料

lsb.applications, lsb.queues, bsub, bjobs, badmin, mbatchd