Windows パフォーマンス・モニターを使用したリソースのグラフ作成

注: LSF モニターは非推奨であり、 LSFの将来のバージョンで削除される可能性があります。

LSF は Windows パフォーマンス・モニターと統合されているため、LSF クラスター、ホスト、キュー、およびジョブのパフォーマンス情報をグラフ化できます。 Windows パフォーマンス・モニターを使用して、指定されたしきい値を超えたときに外部コマンドをトリガーすることもできます。

LSF モニターと呼ばれるサービスは、LSF から Windows パフォーマンス・モニターに情報を渡します。 LSF モニターは別個にインストールする必要があります。

LSF モニター統計

LSF モニターは、インストールされると、自動的に情報を Windows パフォーマンス・モニターに送信します。 Windows パフォーマンス・モニターを使用して、LSF パフォーマンス情報をグラフ化します。

ホスト、キュー、およびジョブ・オブジェクトは、複数インスタンスをサポートします。

以下の LSF 情報が使用可能です。

  • クラスター情報
  • ホスト情報
  • キュー情報
  • ジョブ情報
  • 外部情報

クラスター情報

  • 使用可能なサーバーの数
  • 使用不可のサーバーの数
  • LSF デーモン (sbatchd または RES サービス) がダウンしているサーバーの数
  • ライセンス交付を受けていないサーバーの数
  • クラスター内の保留中のジョブの数
  • クラスター内の実行中のジョブの数
  • クラスター内の中断状態のジョブの数
  • 病気のジョブの数 (パスワードなしで実行依頼されたジョブ、ジョブ依存関係が満たされなかったジョブ、および 3 日を超えて保留中のジョブ)
  • LIM の応答時間 (作成する時間によって測定される)ls_load呼び出し)
  • mbatchd の応答時間 (作成に要した時間によって測定される)lsb_queueinfo呼び出し)

ホスト情報

  • 索引のロード: r15sr15mmemswappgut
  • 実行中のジョブの数
  • 延期されたジョブの数
  • 予約済みジョブ・スロットの数
  • 外部ロード・インデックス

キュー情報

  • 保留中のジョブの数
  • 実行中のジョブの数
  • 延期されたジョブの数
  • 予約済みジョブ・スロットの数

ジョブ情報

  • ジョブによって使用された CPU 時間
  • ジョブによって使用されるメモリー (UNIX 上で実行されるジョブの場合のみ)
  • ジョブによって使用されるスワップ・スペース (UNIX 上で実行されるジョブの場合のみ)

外部情報

  • 1 つまたは 2 つの外部ロード索引の値 (LSF 管理者が構成)

LSF モニターのインストール

開始前に

LSF バージョン 4.0 以上を実行するクラスターが必要です。 Windows を実行しているすべての LSF サーバーまたはクライアントホストに LSF モニターをインストールする必要があります。 クラスターには UNIX ホストを含めることができます。 クラスター管理者のアカウントとパスワードを指定する必要があります。

このタスクについて

LSF モニター・セットアップ・プログラムは LSF とともにインストールされます (LSF モニターは 64bit ・マシンではサポートされません)。 lsfmon -install を使用して、LSF モニター・サービスを実際にインストールします。

手順

  1. 既存の LSF クラスタ内の LSF ユーザーとして Windows ホストにログオンします。
  2. コマンド・プロンプトで、次のように入力します。

    lsfmon -install

    LSF モニターがインストールされました。

  3. Windows の「コントロールパネル」で、 「サービス」をクリックします。

    「サービス」ウィンドウが開きます。

  4. 「LSF モニター」 を右クリックし、 「プロパティー」をクリックします。
  5. 「名前を付けてログオン」セクションで、 「システム・アカウント」を選択解除し、 「このアカウント」を選択して、LSF クラスター管理者アカウントを指定します (例:Administrator).
  6. パスワードを 2 回入力し、 「OK」をクリックします。
  7. 「サービス」ウィンドウで、 「LSF モニター」 を選択し、 「開始」 をクリックしてサービスを開始します。

LSF モニターの構成

開始前に

変更を行う前に、レジストリーをバックアップしてください。

このタスクについて

外部ロード索引とともに、ホスト、キュー、およびジョブの情報のサンプル間隔を構成できます。

LSF モニターは、定期的に LSF から情報をサンプリングし、Windows パフォーマンス・モニターを更新します。

デフォルトでは、情報は以下の間隔でサンプリングされます。

  • ホスト情報 = 30 秒
  • キュー情報 = 45 秒
  • ジョブ情報 = 60 秒

手順

  1. Windows レジストリー設定を変更して、LSF ホスト、ジョブ、またはキュー情報のサンプル間隔を変更します。
    1. レジストリー・サブキーを選択します。
      HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\LSFMonitor
      
    2. 適切な値を編集し、新しいサンプル間隔を秒単位で指定します。
      • SampleIntervalHost
      • SampleIntervalJob
      • SampleIntervalQueue
  2. 外部ロード索引をモニターするように LSF モニターを構成します。
    1. レジストリー・サブキーに移動します。HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\LSFMonitor.
    2. 適切な値を指定し、クラスターで構成されている外部ロード索引の名前を入力します。
      • ExternalLoadIndex1
      • ExternalLoadIndex2

LSF モニターの管理

手順

  • LSF モニターを開始または停止します。

    Windows コントロール・パネルを使用して、LSF モニター・サービスを開始または停止します。

  • Windows イベント・ログを表示するには、Windows イベント・ビューアーを使用します。

    LSF API 呼び出しおよび LSF サービスの操作に関連するエラーは、Windows イベント・ログに記録されます。

  • LSF モニターをアンインストールします。 コマンド・プロンプトから、次のように入力します。

    lsfmon -remove

    このコマンドは、LSF モニター・サービスが実行されている場合は停止し、それを削除し、関連情報を Windows レジストリーから削除します。