IBM Z HMC のモニタリング

「 Instana 」エージェントをインストールすると、「 IBM Z 」HMCセンサーが自動的に展開およびインストールされます。

注:Kubernetes または Red Hat OpenShift クラスタ内の IBM Z HMCを監視する場合、クラスタの各ノードに Instana ホストエージェントをインストールしないでください。 ホスト・エージェントを専用ホスト・マシンにインストールします。

これはオプション機能であり、 Instana バックエンドではデフォルトで無効になっています。 このオプション機能を有効にするには、ご利用の Instana の展開環境に応じたページをご覧ください: SaaSセルフホスト型カスタムエディション( Kubernetes または Red Hat OpenShift Container Platform )またはセルフホスト型クラシックエディション( Docker )

サポート情報

IBM Z のHMCセンサーが現在の環境と互換性があるかどうかを確認するには、以下のサポート情報セクションをご確認ください:

対応バージョンとサポート方針

このセンサーは、 IBM Z HMCの以下のバージョンに対応しています:

  • Z/HMC API バージョン 2.x
  • Z/HMC API バージョン 3.x
  • Z/HMC API バージョン 4.x

以下の表は、最新のサポート対象バージョンとサポート方針を示しています:

テクノロジー サポート・ポリシー 最新バージョン サポートされる最新バージョン
IBM Z HMC オンデマンド 2.16.0 2.16.0

サポートポリシーに関する詳細については、 「センサーのサポート戦略」 を参照してください。

構成

必要なアクセス権

のためにIBM zHMC接続するセンサーzHMCメトリックを監視するには、HMC ユーザーに次の権限があることを確認してください。

  • HMC 上の Web サービス API へのアクセス。 アクセスを有効にするには、 「HMC管理」の「 API 設定のカスタマイズ」 に移動してください。
  • 許可監査とログ管理ハードウェアメッセージ、 そしてセキュリティログの表示タスク。 許可を与えるには、ユーザー管理特定のタスクを含むユーザー ロールを作成するか、それらのタスクを含むユーザー ロールを検索します。 次に、そのユーザー ロールをユーザーに割り当てます。
  • HMC Web サービス API を使用する権限。 アクセス権を付与するには、該当ユーザーの「 ユーザー管理 」にある 「ユーザー詳細 」セクションで、 「 API 設定のカスタマイズ 」タスクまたは 「ユーザー管理 」タスク Allow access to Web Services management interfaces のフィールドを選択します。
  • オブジェクトを監視するにはオブジェクト アクセスが必要です。 最低限必要なオブジェクトは「定義済み CPC, LPAR イメージ, and 中央プロセッサ (CP)」です。アダプタを監視するには、 zHMC でロールを作成する際にアダプタ オブジェクトを追加してください。 使用ユーザー管理監視する特定のオブジェクトまたはオブジェクト タイプを含むユーザー ロールを作成するか、適切なオブジェクトを含む既存のユーザー ロールを見つけるタスクです。 次に、そのユーザー ロールをユーザーに割り当てます。

センサー構成

zHMC サーバーに接続するには、エージェント構成 <agent_install_dir>/etc/instana/configuration.yamlで以下のフィールドを構成する必要があります。

注: リモート・モニターのみがサポートされています。 複数の HMC を以下のように構成できます。
com.instana.plugin.zhmc:
  remote:
    - host: ''             # IP address of the HMC
      port: ''             # HMC port
      user: ''             # userid on the HMC to be used for logging on
      password: ''         # password for the userid
      poll_rate: 15        # metrics poll rate in seconds. Poll rate can not be less than 15 seconds.
      eventsPollRate: 60   # event poll rate in seconds (optional). Comment this configuration to stop the events.
      connectionTimeout: 50 # It is the timeout until a connection with the server is established. Default is 50 seconds.
      connectionRequestTimeout: 50 # It is the time to fetch a connection from the connection pool. Default is 50 seconds.
      socketTimeout: 50 # It is socket read time out. Default is 50 seconds.

 

メトリック収集

メトリクスを表示するには、 Instana UIのサイドバーで [Platforms] を選択し、一覧に表示されたプラットフォームの中から[ zHMC ]をクリックします。すると、[ zHMCs ]タブに IBM Z HMCサーバーの一覧が、 [Systems ]タブにCentral Processor Complex (CPC)の一覧が表示されたダッシュボードが表示されます。

現時点では、クラシックと DPM の両方の動作モードで、以下の 11 個のメトリック・グループがサポートされています。

SI 番号 メトリック・グループ名 モード
1 cpc-usage-overview C
2 logical-partition-usage C
3 channel-usage C
4 dpm-system-usage-overview D
5 partition-usage D
6 zcpc-environmentals-and-power C+D
7 zcpc-processor-usage C+D
8 crypto-usage C
9 flash-memory-usage D
10 adapter-usage C
11 network-physical-adapter-port D
注:C - クラシックおよびD - DPMモード。

CPC の概要 (C)

このメトリック・グループは、システムごとの集約されたプロセッサー使用量とチャネル使用量、周囲温度、および合計システム電力使用量を報告します。 cpc-processor-usage は、CPC 内のすべての物理プロセッサーの処理容量のパーセンテージの平均です。 channel-usage は、CPC 内のすべてのチャネルおよびアダプターの入出力容量のパーセンテージの平均です。

このメトリック・グループの各項目では、以下のメトリックが提供されます。

メトリック 説明 粒度
CPC プロセッサーの使用状況 中央演算処理装置複合プロセッサーのプロセッサー使用率。 15 秒
チャネルの使用状況 チャネルの使用率。 15 秒
消費電力(ワット) 合計システム電力使用量 (ワット)。 15 秒
温度 (摂氏) 周囲温度 (摂氏)。 15 秒
CP 共有プロセッサー使用量 共有中央演算処理装置のプロセッサー使用率。 15 秒
CP 専用プロセッサー使用量 専用中央演算処理装置のプロセッサー使用率。 15 秒
IFL 共有プロセッサー使用量 共有 Integrated Facility for Linux プロセッサーのプロセッサー使用率。 15 秒
IFL 専用プロセッサー使用量 専用 Integrated Facility for Linux プロセッサーのプロセッサー使用率。 15 秒
ICF 共有プロセッサー使用量 共有 Internal Coupling Facility プロセッサーのプロセッサー使用率。 15 秒
ICF 専用プロセッサー使用量 専用 Internal Coupling Facility プロセッサーのプロセッサー使用率。 15 秒
IIP 共有プロセッサー使用量 共有 Integrated Information Processor のプロセッサー使用率。 15 秒
IIP 専用プロセッサー使用量 専用 Integrated Information Processor のプロセッサー使用率。 15 秒
AAP 共有プロセッサー使用量 共有 Application Assist Processor のプロセッサー使用率。 15 秒
AAP 専用プロセッサー使用量 専用 Application Assist Processor のプロセッサー使用率。 15 秒
すべての共有プロセッサー使用量 すべての共有プロセッサーのプロセッサー使用率の合計。 15 秒
すべての専用プロセッサー使用量 すべての専用プロセッサーのプロセッサー使用率の合計。 15 秒
すべての CP プロセッサー使用量 すべての中央演算処理装置のプロセッサー使用率の合計。 15 秒
すべての IFL プロセッサー使用量 すべての Integrated Facility for Linux プロセッサーのプロセッサー使用率の合計。 15 秒
すべての ICF プロセッサー使用量 すべての Internal Coupling Facility プロセッサーのプロセッサー使用率の合計。 15 秒
すべての IIP プロセッサー使用量 すべての Integrated Information Processor のプロセッサー使用率の合計。 15 秒
CBP 共有プロセッサー使用量 共有 Container Based Processor のプロセッサー使用率。 15 秒
CBP 専用プロセッサー使用量 専用 Container Based Processor のプロセッサー使用率。 15 秒
すべての CBP プロセッサー使用量 すべての Container Based Processor のプロセッサー使用率。 15 秒

論理区画 (C)

このメトリック・グループは、システム上の各アクティブ論理区画 (イメージ、LPAR イメージ、ゾーン、PR/SM 仮想サーバー) のプロセッサー使用量を報告します。

このメトリック・グループの各項目では、以下のメトリックが提供されます。

メトリック 説明 粒度
プロセッサー使用状況 論理区画のプロセッサー使用率。 15 秒
CP プロセッサー使用量 中央演算処理装置のプロセッサー使用率。 15 秒
IFL プロセッサー使用量 Integrated Facility for Linux プロセッサーのプロセッサー使用率。 15 秒
ICF プロセッサー使用量 Internal Coupling Facility プロセッサーのプロセッサー使用率。 15 秒
IIP プロセッサー使用量 Integrated Information Processor のプロセッサー使用率。 15 秒
CBP プロセッサー使用量 Container Based Processor のプロセッサー使用率。 15 秒
LPARの消費電力 論理パーティションが消費する総電力(ワット)。 15 秒

チャネル使用量 (C)

このメトリック・グループは、システム上の各チャネルのチャネル使用量を報告します。 このメトリック・グループのインスタンスは、CPC のチャネルごとに作成されます。

このメトリック・グループの各項目では、以下のメトリックが提供されます。

メトリック 説明 粒度
チャネル名 チャネル・サブシステム・パス ID 形式のチャネルの名前。 15 秒
共用チャネル チャネルが論理区画間で共用される場合は true、そうでない場合は false。 15 秒
論理区画名 所有する論理区画の名前、またはチャネルが共用されている場合は値「shared」。 15 秒
チャネルの使用状況 チャネル使用率 (0 – 100%)。 15 秒

DPM システムの概要 (D)

このメトリック・グループは、DPM 対応システムごとに、プロセッサー使用量、ネットワーク使用量、ストレージ使用量、アクセラレーター使用量、暗号使用量、電力消費量、および温度の総計を報告します。

このメトリック・グループの各項目では、以下のメトリックが提供されます。

メトリック 説明 粒度
プロセッサー使用量 プロセッサー使用率。 15 秒
ネットワーク使用量 ネットワーク使用率。 15 秒
ストレージ使用量 ストレージ使用率。 15 秒
アクセラレーター使用量 アクセラレーター使用率。 15 秒
暗号使用量 暗号使用率。 15 秒
電力消費量 (ワット) ワット単位の電力消費量。 15 秒
温度 (摂氏) 周囲温度。 15 秒
CP 共有プロセッサー使用量 すべての CP 共有プロセッサーのプロセッサー使用率。 15 秒
すべての CP プロセッサー使用量 すべての CP プロセッサーのプロセッサー使用率。 15 秒
IFL 共有プロセッサー使用量 すべての IFL 共有プロセッサーのプロセッサー使用率。 15 秒
すべてのプロセッサー使用量 すべての IFL プロセッサーのプロセッサー使用率。 15 秒
すべての共有プロセッサー使用量 すべての共有プロセッサーのプロセッサー使用率。 15 秒

パーティション (D)

このメトリック・グループは、DPM 対応システム上のアクティブ・パーティションごとに、プロセッサー使用量、ネットワーク使用量、ストレージ使用量、アクセラレーター使用量、および暗号使用量を報告します。

このメトリック・グループの各項目では、以下のメトリックが提供されます。

メトリック 説明 粒度
プロセッサー使用量 プロセッサー使用率。 15 秒
ネットワーク使用量 ネットワーク使用率。 15 秒
ストレージ使用量 ストレージ使用率。 15 秒
アクセラレーター使用量 アクセラレーター使用率。 15 秒
暗号使用量 暗号使用率。 15 秒

zCPC の環境および電力 (C+D)

このメトリック・グループは、zCPC の環境データと電力消費量を報告します。

このメトリック・グループの各項目では、以下のメトリックが提供されます。

メトリック 説明 粒度
温度 (摂氏) 周囲温度 15 秒
湿度 相対湿度 15 秒
露点 (摂氏) 露点 15 秒
電力消費量 (ワット) ワット単位の電力消費量 15 秒
熱負荷 システムの合計熱負荷 (熱負荷 (強制空気) + 熱負荷 (水)) 15 秒
熱負荷 (強制空気) 強制空気で除去される熱負荷 15 秒
熱負荷 (水) 水で除去される熱負荷 15 秒
排気温度 (摂氏) 排気温度 15 秒

zCPC プロセッサー (C+D)

このメトリック・グループは、システム上の物理 zCPC プロセッサーごとにプロセッサー使用量を報告します。 これにはシステム補助プロセッサー (SAP) が含まれます。 このメトリック・グループのインスタンスは、CPC のプロセッサーごとに作成されます。

このメトリック・グループの各項目では、以下のメトリックが提供されます。

メトリック 説明 粒度
プロセッサー名 zCPC プロセッサーの名前 (プロセッサー・タイプ + プロセッサー ID の形式)。 15 秒
プロセッサー・タイプ zCPC プロセッサーのタイプ。 15 秒
プロセッサー使用量 プロセッサー使用率。 15 秒
SMT 使用量 プロセッサーが同時マルチスレッド化 (SMT) モードで実行されている時間の比率。 15 秒
スレッド 0 使用量 プロセッサーが同時マルチスレッド化 (SMT) モードで実行されている場合のスレッド 0 の使用率。 15 秒
スレッド 1 使用量 プロセッサーが同時マルチスレッド化 (SMT) モードで実行されている場合のスレッド 1 の使用率。 15 秒

暗号 (C)

このメトリック・グループは、システム上の暗号ごとにアダプター使用量を報告します。 このメトリック・グループのインスタンスは、暗号アダプターごとに作成されます。 DPM システムでは、このメトリック・グループが使用されません。 DPM では、暗号アダプターが「アダプター」メトリック・グループで報告されます。

このメトリック・グループの各項目では、以下のメトリックが提供されます。

メトリック 説明 粒度
チャネル ID 暗号の物理チャネル ID 15 秒
暗号 ID 暗号の 暗号 ID (10 進数の 0-15) 15 秒
アダプター使用量 アダプター使用率 (0-100%) 15 秒

アダプター (D)

このメトリック・グループは、DPM 対応システム上のアダプターごとにアダプター使用量を報告します。 このメトリック・グループのインスタンスは、アダプターごとに作成されます。

このメトリック・グループの各項目では、以下のメトリックが提供されます。

メトリック 説明 粒度
アダプター使用量 アダプター使用率 (0-100%) 15 秒

フラッシュ・メモリー・アダプター (C)

このメトリック・グループは、システム上のフラッシュ・メモリー (Flash Express) アダプターごとにアダプター使用量を報告します。 このメトリック・グループのインスタンスは、CPC のフラッシュ・メモリー・アダプターごとに作成されます。 フラッシュ・メモリー・アダプターがない CPC の場合は、このメトリック・グループにデータが出力されません。

このメトリック・グループの各項目では、以下のメトリックが提供されます。

メトリック 説明 粒度
チャネル ID フラッシュ・メモリー・アダプターの物理チャネル ID 15 秒
アダプター使用量 アダプター使用率 (0-100%) 15 秒

ネットワーク・アダプター・ポート・メトリック・グループ (D)

OSA および RoCE のネットワーク・アダプターには、ネットワークに接続する物理ポートが最大 2 個搭載されます。 DPM 対応システム上のこれらのポートからメトリックが収集され、ユーザーに提供されます。 このメトリック・グループには、1 つの物理ポートのメトリックを表すメトリック・データが含まれます。

このメトリック・グループの各項目では、以下のメトリックが提供されます。

メトリック 説明 粒度
ネットワーク・ポート ID ネットワーク・アダプターの物理ポートに対応する数値。 15 秒
送信バイト この物理ポートが接続ネットワークに送信したバイト数。 15 秒
受信バイト この物理ポートが接続ネットワークから受信したユニキャスト・パケットの数。 15 秒
送信パケット この物理ポートが接続ネットワークに送信したユニキャスト・パケットの数。 15 秒
受信パケット この物理ポートが接続ネットワークから受信したユニキャスト・パケットの数。 15 秒
ドロップされた送信パケット この物理ポートが接続ネットワークにパケットを送信しているときにドロップされたパケットの数。 15 秒
ドロップされた受信パケット この物理ポートが接続ネットワークからパケットを受信しているときにドロップされたパケットの数。 15 秒
廃棄された送信パケット この物理ポートが接続ネットワークにパケットを送信しているときに廃棄されたパケットの数。 15 秒
廃棄された受信パケット この物理ポートが接続ネットワークからパケットを受信しているときに廃棄されたパケットの数。 15 秒
送信マルチキャスト・パケット この物理ポートが接続ネットワークに送信したマルチキャスト・パケットの数。 15 秒
受信マルチキャスト・パケット この物理ポートが接続ネットワークから受信したマルチキャスト・パケットの数。 15 秒
送信ブロードキャスト・パケット この物理ポートが接続ネットワークに送信したブロードキャスト・パケットの数。 15 秒
受信ブロードキャスト・パケット この物理ポートが接続ネットワークから受信したブロードキャスト・パケットの数。 15 秒
間隔の送信バイト 収集間隔にこの物理ポートが送信したバイト数。 15 秒
間隔の受信バイト 収集間隔にこの物理ポートが受信したバイト数。 15 秒
送信バイト/秒 収集間隔にこの物理ポートが送信した 1 秒当たりのバイト数。 15 秒
受信バイト/秒 収集間隔にこの物理ポートが受信した 1 秒当たりのバイト数。 15 秒
使用率 リンク帯域幅全体の使用率として表されるリンク使用率。 15 秒
MAC アドレス このアップリンクの MAC アドレス (既知の場合)。 15 秒
フラグ このインターフェースでサポートされるメトリックのタイプを示すフラグ。 15 秒

ネットワークインターフェースのメトリックグループ (D)

このメトリック・グループは、DPM 対応システム上の NIC のメトリックを報告します。 ネットワーク・インターフェース・コントローラー は、分散表示管理区画に関連付けられたネットワーク・リソースです。 アクティブ化された ネットワーク・インターフェース・コントローラー のみがメトリック・データを報告します。 このメトリック・グループには、1 つの ネットワーク・インターフェース・コントローラーのメトリックを表すメトリック・データが含まれます。 メトリックは一定の間隔で収集され、提供されます。提供される各メトリックは合計累積値であり、差分ではありません。

このメトリック・グループの各項目では、以下のメトリックが提供されます。

メトリック 説明 粒度
パーティション ID メトリックがこのメトリック・グループに含まれている NIC を所有するパーティションの固有 ID。 30 秒
送信バイト/秒 収集間隔において、このネットワーク・アダプターによって 1 秒当たりに送信されたバイト数。 30 秒
1 秒当たりの受信バイト数 収集間隔において、このネットワーク・アダプターによって受信された 1 秒当たりのバイト数。 30 秒
送信パケット このネットワーク・アダプターが接続ネットワークに送信したユニキャスト・パケットの数。 30 秒
受信パケット このネットワーク・アダプターが接続ネットワークから受信したユニキャスト・パケットの数。 30 秒
ドロップされた送信パケット このネットワーク・アダプターが接続ネットワークに送信していたときにドロップされたパケットの数。 30 秒
受信パケット-ドロップ このネットワーク・アダプターが接続ネットワークから受信していたときに除去されたパケットの数。 30 秒
送信パケット-廃棄 このネットワーク・アダプターが接続ネットワークに送信していたときに廃棄されたパケットの数。 30 秒
受信パケット-廃棄 このネットワーク・アダプターが接続ネットワークから受信していたときに廃棄されたパケットの数。 30 秒

RoCE アダプター( C )

このメトリック・グループは、システム上の各 RoCE (10GbE RoCE) アダプターのアダプター使用量を報告します。 このメトリック・グループのインスタンスは、現行プロセッサー・キャパシティ の RoCE アダプターごとに作成されます。

このメトリック・グループの各項目では、以下のメトリックが提供されます。

メトリック 説明 粒度
チャネル ID RoCE アダプターの物理的なチャネル ID。 15 秒
adapter-usage アダプターの使用率 (0 から 100%)。 15 秒

CPC(サーバー)およびHMCコンソールからイベントを管理する

いくつかの障害またはインシデントが原因で、これらのサーバーからクリティカル・イベントがトリガーされます。 以下のタイプのイベントが Instana に送信され、イベント・ページに表示されます。

  • CPC からの問題のあるハードウェア・メッセージ
  • コンソールからの問題のあるハードウェア・メッセージ
  • 重要なコンソール監査イベント
  • 重要なコンソール・セキュリティー・イベント

トラブルシューティング

  • Z HMC サーバーが使用する自己署名証明書のインポート Z HMC サーバーが自己署名証明書を使用する場合は、それが jvm の cacert にインポートされていることを確認してください。 また、ログに以下の例外が示されている場合は、Z HMC サーバーが自己署名証明書を使用しており、それを jvm の cacert にインポートする必要があることを示しています。 sun.security.provider.certpath.SunCertPathBuilderException: unable to find valid certification path to requested target. PKIX path building failed: sun.security.provider.certpath.SunCertPathBuilderException: unable to find valid certification path to requested target.

    解決策:「 自己署名証明書」の手順に従って、自己署名証明書をインポートしてください。

  • 無効な SAN を持つ自己署名証明書 SAN に予期された IP アドレスがない場合、サーバー証明書は無効です。

    解決策: サーバー証明書を訂正し、再度インポートしてください。

  • 403 Forbidden HTTP 403 Forbidden レスポンスステータスコードは、サーバーがリクエストを認識しているものの、そのリクエストを許可しないことを示します。

    解決策: configuration.yaml ファイルに指定された資格情報と、ユーザーに必要なすべての権限を確認してください。