ホスト・アラートのトリガー条件

IBM Storage Insights Pro を設定して、ホストの属性、容量、およびパフォーマンスを調査し、変更または違反が検出されると通知するようにできます。

アラートは、以下のリソースに関する一般的な変更、容量、およびパフォーマンスの問題をユーザーに通知することができます。
重要: アラートを通知できるすべての属性がここにリストされているわけではありません。 アラートを出すことができる属性の完全なリストを表示するには、アラート・ポリシーが割り当てられていないホストのアラート定義を編集するか、新規カスタム・アラート・ポリシーを作成し、ポリシー内に新規アラートを定義することができます。 カスタム・アラート・ポリシーを作成するには、 構成 > 「アラート・ポリシー」 に進み、 「ポリシーの作成」をクリックします。

以下の表では、デフォルト・アラートにアスタリスク (*) のマークが付いています。

ホスト (一般的な変更)

表 1. ホストの事前定義されたアラート
一般属性 属性の定義条件
状況*
ホストで以下のいずれかの状況が検出されました。
異常
ホストまたはその内部リソースでエラーまたは警告状況が検出されました。
警告
ホストまたはその内部リソースで警告状況が検出されました。
エラー (デフォルト)
ホストまたはその内部リソースでエラー状況が検出されました。
到達不能
1 つのホストにおいて 1 つ以上のモニター対象リソースが応答していません。 この状況は、ネットワークに問題があるために発生した可能性があります。
プローブ状況*
プローブで以下のいずれかの状況が検出された場合に、アラートを生成します。
失敗
データ収集中にエラーまたは警告が発生しました。 この状況は、プローブでリソースに関するいずれのデータも収集されなかったか、一部のデータ・セットしか収集されなかったことを示します。
警告
プローブは完了しましたが、完全なデータ・セットが収集されなかった可能性があります。 この状況は、リソースの 1 つ以上の内部リソースについてデータを収集できない場合に発生する可能性があります。
エラー
リソースに関する資産データの収集時にプローブが完了しませんでした。 この状況は、データ収集時にリソースに到達できない場合に発生する可能性があります。
パフォーマンス・モニター状況*
パフォーマンス・モニターで以下のいずれかの状況が検出されました。
失敗
データ収集中にエラーまたは警告が発生しました。 この状況は、パフォーマンス・モニターでリソースに関するいずれのデータも収集されなかったか、一部のデータ・セットしか収集されなかったことを示します。
警告
パフォーマンス・モニターは完了しましたが、完全なパフォーマンス・データのセットが収集されませんでした。 この状況は、データ収集中にリソースがリブートされた場合、リソースによって有効なパフォーマンス・データが提供されなかった場合、あるいはリソースまたはその関連エージェントとの通信エラーが発生した場合に発生する可能性があります。
エラー
リソースに関するパフォーマンス・データの収集の収集時にパフォーマンスが完了しませんでした。 この状況は、データ収集時にリソースに到達できない場合、あるいはリソースの構成データが使用できない場合に発生する可能性があります。

正常に実行された最後のプローブ

正常に実行された最後のモニター

プローブまたはパフォーマンス・モニターがホストに関するデータを正常に収集してから、指定された時間が経過しました。 このアラートを使用して、最新の構成、状況、またはパフォーマンス・データがホストに関して収集されておらず、その既存のデータが失効している可能性がある場合に通知されるようにすることができます。 この状態は、リソース、ネットワーク、またはサーバーが使用不可の場合に発生する可能性があります。

ホスト (容量の変更)

ホストの容量が指定のしきい値を超えたときに通知するアラートを定義します。 アラートでは、ホストの容量 (使用容量、使用可能な容量、およびファイル・システム容量を含む) を測定するメトリックに基づいて条件を指定することができます。 容量条件を使用してアラートを作成することにより、ネットワーク・インフラストラクチャー内の潜在的なボトルネックについて通知されるようにすることができます。

例えば、SAN の使用容量が指定のしきい値以上になると通知するアラートを定義できます。 SAN の使用容量は、ホストに関連付けられているボリュームによって使用される SAN ストレージの合計量を表します。 このアラートは、ホストがどの程度の SAN 容量を消費しているかを特定するのに役立ちます。

また、少ない SAN 容量を使用しているホストを識別する場合など、メトリックが指定されたしきい値より小さい場合にも通知することができます。

アラートを出すことができるホスト・メトリックの完全なリストについては、 表 2 の表を参照してください。
表 2. ホスト容量メトリック
メトリック 定義
SAN 容量 ホストに割り当てられているストレージ・システムからの SAN ディスク容量。
SAN 使用容量 ホストに関連付けられているボリュームによって使用されている SAN ストレージの合計量。
FlashCopy® プロビジョン済み容量 すべての FlashCopy ターゲットの合計ストレージ・スペース容量。
FlashCopy の使用済み容量 FlashCopy ターゲットによって使用されるストレージ・スペース。
1 次プロビジョン済み容量 ホストに直接マップされているボリュームの合計ストレージ・スペース容量。
1 次使用容量 ホストに直接マップされているボリューム上で使用されるストレージ・スペース。
リモート・ミラーのプロビジョン済み容量 コピー・サービス関係のターゲットであるボリューム(メトロ・ミラーまたはグローバル・ミラーなど)の合計ストレージ・スペース容量。
リモート・ミラーの使用容量 コピー・サービス関係のターゲットであるボリューム(メトロ・ミラーまたはグローバル・ミラーなど)で使用されるストレージ・スペース。
VDisk ミラーのプロビジョン済み容量 すべてのVDiskコピーの合計ストレージ容量。
VDisk ミラーの使用容量 VDiskコピーによって使用されるストレージ容量。
ベスト・プラクティス: 容量条件にしきい値を設定する場合は、誤ったアラートを過剰に生成することなく最大限のメリットを得られるように、最適な値を決定してください。 適切なしきい値は、実行するワークロードのタイプ、ハードウェア構成、物理ディスクの数、正確なモデル番号などの要因によって大きく異なるので、簡単あるいは標準的なデフォルト規則はありません。

推奨される方法は、数週間のリソースの容量をモニターし、その履歴データを使用して、各容量条件に対して妥当なしきい値を決定することです。 値の決定後は、条件設定を微調整して、誤ったアラートの数を最小限にすることができます。

アラート定義の編集」をクリックし、容量アラート定義ごとに「履歴の表示」をクリックし、ホスト容量の履歴を表示し、そのデータに対するしきい値を設定します。

ヒント: 容量属性の場合、ストレージ量が指定された値より大きい、指定された値より小さい、または指定された値に等しい場合にアラートを生成できます。 また、属性の測定単位 (KiB、MiB、GiB、または TiB) を決定することもできます。

ホスト (パフォーマンスの変更)

ホストのパフォーマンスが指定のしきい値を超えたときに通知するアラートを定義します。 アラートでは、応答時間、I/O 速度、およびデータ速度を含む、ホストのパフォーマンスを測定するメトリックに基づいて条件を指定できます。 パフォーマンス条件を指定してアラートを作成することで、ネットワーク・インフラストラクチャーにおける潜在的なボトルネックに関する通知を受けることができます。

例えば、ドライブの合計応答時間が指定されたしきい値以上である場合に通知するアラートを定義できます。 「合計応答時間」は、バックエンド・ストレージ・リソースが読み取り操作または書き込み操作に応答する平均時間 (ミリ秒) を表します。 このアラートを使用して、ホストのパフォーマンスを低下させる可能性のあるディスク条件を識別します。

また、応答時間が低いドライブを識別する場合など、メトリックが指定されたしきい値より小さい場合にも通知することができます。

アラートを出すことができるホスト・メトリックの完全なリストについては、 ホストのパフォーマンス・メトリックを参照してください。
パフォーマンス条件のヒント:
  • IBM Storage Insights Pro がしきい値に違反しているかどうかを判断し、パフォーマンス条件に対してアラートを生成する前に、Data Collection をリソースに対して一定時間実行する必要があります。
ベスト・プラクティス: パフォーマンス条件のしきい値を設定する場合は、誤ったアラートを多く生成することなく最大限のメリットを得られるように、最適な値を決定してください。 適切なしきい値は、実行するワークロードのタイプ、ハードウェア構成、物理ディスクの数、正確なモデル番号などの要因によって大きく異なるので、簡単あるいは標準的なデフォルト規則はありません。

何週間にもわたってリソースのパフォーマンスをモニターし、その履歴データを使用して、各パフォーマンス条件の妥当なしきい値を決定する方法をお勧めします。 値の決定後は、条件設定を微調整して、誤ったアラートの数を最小限にすることができます。

アラート定義の編集」をクリックし、パフォーマンス・アラート定義ごとに「履歴の表示」をクリックしてホスト・パフォーマンスの履歴を表示し、そのデータに対するしきい値を設定します。

HBA (一般的な変更)

表 3. HBA の事前定義されたアラート
一般属性 属性の定義条件
状況
ホストで以下のいずれかの状況が検出されました。
異常
HBA でエラー状況または警告状況が検出されました。
警告
HBA で警告状況が検出されました。
エラー (デフォルト)
HBA でエラー状況が検出されました。
除去されたHBA 以前にモニターされていた HBA を検出できなくなりました。 HBA に関する履歴データは保持されていますが、現在のデータは収集されていません。 HBA が取り外されたか、使用不可になった場合、このアラートを使用して通知されます。
新規HBA HBA が初めて検出されました。

ドライブ (一般的な変更)

表 4. ドライブの事前定義されたアラート
一般属性 属性の定義条件
状況
ディスクで以下のいずれかの状況が検出されました。
異常
ディスクでエラー状況または警告状況が検出されました。
警告
ディスクで警告状況が検出されました。
エラー (デフォルト)
ディスクでエラー状況が検出されました。
削除済みドライブ 以前にモニターされていたドライブが見つかりません。 ドライブに関する履歴データは保持されていますが、現在のデータは収集されていません。 ドライブが取り外されたか、使用不可になった場合、このアラートを使用して通知を受けられます。
新規のドライブ ドライブが初めて検出されました。 このアラートを使用して、ホストにハードウェアの変更を通知します。
パス ドライブに関連付けられているアクセス・パスの数が、指定された範囲外であるか、または指定された値と等しいか、等しくありません。

ドライブ (容量の変更)

表 5. ドライブの事前定義されたアラート
一般属性 属性の定義条件
容量 ホスト・ドライブに割り当てられているストレージ容量の合計量。
使用可能なドライブ容量 ホスト・ドライブ上の未使用容量。
使用容量 ホスト・ドライブ上の使用済みmpストレージ容量。

ドライブ (パフォーマンスの変更)

表 6. ドライブの事前定義されたアラート
一般属性 属性の定義条件
I/O 速度 (読み取り) バックエンド・ストレージ・リソースに発行される 1 秒当たりの読み取り操作の平均数。
I/O 速度 (書き込み) バックエンド・ストレージ・リソースに発行される 1 秒当たりの書き込み操作の平均数。
I/O 速度 (合計) バックエンド・ストレージ・リソースとコンポーネント間で送信される 1 秒当たりの入出力操作の平均数。 この値には、読み取りと書き込みの両方の操作が含まれます。
データ速度 (読み取り) バックエンド・ストレージ・リソースから読み取られる MiB の 1 秒当たりの平均数。
データ速度 (書き込み) バックエンド・ストレージ・リソースに書き込まれる MiB の 1 秒当たりの平均数。
データ速度 (合計) データがバックエンド・ストレージ・リソースとコンポーネント間で送信される平均速度。 速度は秒当たりの MiB 単位で測定され、読み取りと書き込みの両方の操作を含みます。
応答時間 (読み取り) バックエンド・ストレージ・リソースが読み取り操作に応答する平均時間 (ミリ秒数)。
応答時間 (書き込み) バックエンド・ストレージ・リソースが書き込み操作に応答する平均時間 (ミリ秒数)。
応答時間 (合計) バックエンド・ストレージ・リソースが読み取り操作または書き込み操作に応答する平均時間 (ミリ秒数)。

パス (一般的な変更)

表 7. パスの事前定義されたアラート
一般属性 属性の定義条件
状況
パスで以下のいずれかの状況が検出されました。
異常
パスでエラー状況または警告状況が検出されました。
警告
パスで警告状況が検出されました。
エラー (デフォルト)
パスでエラー状況が検出されました。
削除済みパス 以前にモニターされていたホスト・ドライブのアクセス・パスが見つかりません。 この変更は、使用可能なパスが複数存在する可能性があるため、ドライブの可用性に影響を与えるかもしれないし、影響しない場合もあります。
新規パス ドライブのアクセス・パスが、初めて検出されました。

データ・ストア (一般的な変更)

表 8. データ・ストアの事前定義アラート
一般属性 属性の定義条件
状況
データ・ストアで以下のいずれかの状況が検出されました。
異常
データ・ストアでエラー状況または警告状況が検出されました。
警告
データ・ストアで警告状況が検出されました。
エラー (デフォルト)
データ・ストアでエラー状況が検出されました。
削除されたデータ・ストア 以前にモニターされていたデータ・ストアを検出できなくなりました。 データ・ストアに関する履歴データは保持されていますが、現在のデータは収集されていません。 データ・ストアが取り外されたか、使用不可になった場合、このアラートを使用して通知されます。
新規データ・ストア データ・ストアが初めて検出されました。

データ・ストア (容量の変更)

表 9. データ・ストアの事前定義アラート
一般属性 属性の定義条件
使用容量 (%) ホスト・データ・ストアで使用されているストレージ容量の割合 (%)。
容量 ホストに割り当てられているストレージ・システムからの SAN ディスク容量。
使用容量 ホストに関連付けられているデータ・ストアによって使用されている SAN ストレージの合計量。
利用可能容量 ホスト・データ・ストアの未使用ストレージ容量。
ファイル・システム容量 リソースのファイル・システムのストレージ・スペースの量。
使用済みのファイル・システム容量 ホスト・ファイル・システムの使用容量。
使用可能なファイル・システム容量 ファイル・システム上の未使用のストレージ容量の合計量。

データ・ストア (パフォーマンスの変更)

表 10. データ・ストアの事前定義アラート
一般属性 属性の定義条件
I/O 速度 (読み取り) バックエンド・ストレージ・リソースに発行される 1 秒当たりの読み取り操作の平均数。
I/O 速度 (書き込み) バックエンド・ストレージ・リソースに発行される 1 秒当たりの書き込み操作の平均数。
I/O 速度 (合計) バックエンド・ストレージ・リソースとコンポーネント間で送信される 1 秒当たりの入出力操作の平均数。 この値には、読み取りと書き込みの両方の操作が含まれます。
データ速度 (読み取り) バックエンド・ストレージ・リソースから読み取られる MiB の 1 秒当たりの平均数。
データ速度 (書き込み) バックエンド・ストレージ・リソースに書き込まれる MiB の 1 秒当たりの平均数。
データ速度 (合計) データがバックエンド・ストレージ・リソースとコンポーネント間で送信される平均速度。 速度は秒当たりの MiB 単位で測定され、読み取りと書き込みの両方の操作を含みます。
応答時間 (読み取り) バックエンド・ストレージ・リソースが読み取り操作に応答する平均時間 (ミリ秒数)。
応答時間 (書き込み) バックエンド・ストレージ・リソースが書き込み操作に応答する平均時間 (ミリ秒数)。
応答時間 (合計) バックエンド・ストレージ・リソースが読み取り操作または書き込み操作に応答する平均時間 (ミリ秒数)。

VMDK (一般的な変更)

表 11. VMDK の事前定義されたアラート
一般属性 属性の定義条件
除去済み VMDK 以前にモニターされていた VMDK を検出できなくなりました。 VMDK に関する履歴データは保持されていますが、現在のデータは収集されていません。 VMDK が取り外されたか、使用不可になった場合、このアラートを使用して通知されます。
新規 VMDK VMDK が初めて検出されました。

VMDK (容量の変更)

表 12. VMDK の事前定義されたアラート
一般属性 属性の定義条件
使用容量 ホスト・データ・ストアの VMDK で使用されているストレージ容量の割合 (%)。
サイズ ホスト・データ・ストアの VMDK のサイズ。

VMDK (パフォーマンスの変更)

表 13 VMDK の事前定義されたアラート
一般属性 属性の定義条件
I/O 速度 (読み取り) バックエンド・ストレージ・リソースに発行される 1 秒当たりの読み取り操作の平均数。
I/O 速度 (書き込み) バックエンド・ストレージ・リソースに発行される 1 秒当たりの書き込み操作の平均数。
I/O 速度 (合計) バックエンド・ストレージ・リソースとコンポーネント間で送信される 1 秒当たりの入出力操作の平均数。 この値には、読み取りと書き込みの両方の操作が含まれます。
データ速度 (読み取り) バックエンド・ストレージ・リソースから読み取られる MiB の 1 秒当たりの平均数。
データ速度 (書き込み) バックエンド・ストレージ・リソースに書き込まれる MiB の 1 秒当たりの平均数。
データ速度 (合計) データがバックエンド・ストレージ・リソースとコンポーネント間で送信される平均速度。 速度は秒当たりの MiB 単位で測定され、読み取りと書き込みの両方の操作を含みます。
応答時間 (読み取り) バックエンド・ストレージ・リソースが読み取り操作に応答する平均時間 (ミリ秒数)。
応答時間 (書き込み) バックエンド・ストレージ・リソースが書き込み操作に応答する平均時間 (ミリ秒数)。
応答時間 (合計) バックエンド・ストレージ・リソースが読み取り操作または書き込み操作に応答する平均時間 (ミリ秒数)。