db2_hang_detect - Db2 データベースのハングを検知、報告、解決するスクリプト

Db2 データベースに関する可能性のあるアプリケーションのハングを検出し、その状態を通知および解決するために動作します。 db2_hang_detect は、ハング検出テストのパッケージが含まれる ksh スクリプトです。 db2_hang_detect スクリプトは、 Linux® およびUNIXオペレーティングシステムでのみご利用いただけます。

db2_hang_detect スクリプトは、ノードおよびインスタンスごとに定期的に実行するように設計されています。 理想的には、高可用性 (HA) クラスター・マネージャーで提供される HA 機能を補完するものとして、このスクリプトを実行します。

db2_hang_detect スクリプトは sqllib/samples/pd/ ディレクトリー内にあります。

選択したパラメーターの値に応じて、別々にか、またはグループとして実行される、次の 4 つのハング検出検査があります。

instance_level_detect
ハングしているインスタンスを検出します。
latch_level_detect
ラッチが原因で発生するハングを検出します。
db_cat_node_fail_monitor
ノード・リカバリー中のハングを検出します。
progress_detect
エージェント内のハングを検出します。

許可

root ユーザー権限

必要な接続

なし

構文

db2_hang_detect [DB2INSTANCE] [NN] [DETECTLEVEL] [ACTION] [DBNAME] [NOTIFYADDRESS] [LOOPBACKNAME] [VERBOSE]

Parameters

DB2INSTANCE
モニターするインスタンスを指定します。
NN partition または node number
モニターするノードまたはパーティションの番号を指定します。
検出レベル テストレベル
ハング検出検査のレベルを指定します。 次の値が使用されます。
0
検査のいずれも実行しません。
1
instance_level_detect 検査を実行します。
※2
instance_level_detect 検査および latch_level_detect 検査を実行します。
3
instance_level_detect、latch_level_detect、および db_cat_node_fail_monitor の各検査を実行します。
4
instance_level_detect、latch_level_detect、db_cat_node_fail_monitor、および progress_detect の各検査を実行します。
ACTION
ハングが検出された場合に実行するアクションを指定します。 次の値が使用されます。
伝える (INFORM)
ハングしているアプリケーションを指定するメッセージを送信します。
FORCE
ハングしているアプリケーションをシステムから強制的に切断することによって停止します。
終了
ハングしているアプリケーションを強制終了することによって停止します。
DBNAME
モニターするデータベースの名前を指定します。
通知先アドレス
ハングが検出された場合のメッセージの送信先 E メール・アドレスを指定します。
ループバックデータベース名
リモート接続を通じてカタログするデータベースの名前を指定します。 nulldb を指定した場合、データベースはカタログされません。
バーボース
状況メッセージを標準出力に出力します。 次の値が使用されます。
バーボース
状況メッセージを出力します。
ノーバーボーズ
状況メッセージを出力しません。

次の例では、インスタンスの DB2INST1 に関する潜在的なハングを検索します。 ノード 0 と、4 つのテストをすべて使用することを指定します。 ハングが検出された場合、メッセージによって通知されます。 モニターされるデータベースは DB2SAMPL です。 アプリケーションがハングしているというメッセージが user@domain.com という E メール・アドレスに送信されます。 データベースはカタログされず、状況メッセージは表示されません。
db2_hang_detect db2inst1 0 4 inform  db2sampl user@domain.com nulldb noverbose

戻りコード

以下の表に、戻される可能性のあるすべての戻りコードをリストします。

表1. db2_hang_detectの戻りコード
戻りコード 説明
0 ハングが検出されなかったこと、およびインスタンスが稼働中であることを示します。
1 インスタンスがオフラインであることを示します。
2 環境の問題を示します。例えば、ご使用のシステムが正しく設定されていず、正常な実行が妨げられている場合があります。
3 以上 潜在的なハングを示します。

使用上の注意

このスクリプトは root として実行しなければなりません。 また、Db2 インスタンスがあるサーバー上でローカルにこのスクリプトを実行しなければなりません。

スクリプトの複数のコピーを同時に実行することはできません。