restart light が 1 つのホストで失敗し、別のホストで完了する
restart light の際には、リカバリー・プロセスを完了させるためにメンバーがゲスト・ホストにフェイルオーバーします。 このトピックの情報を使用すると、最初のゲスト・ホストで restart light が失敗し、2 番目のゲスト・ホストで正常に完了した理由を診断するのに役立ちます。
症状
以下の db2instance -list コマンドの出力例は、3 つの メンバー と 2 つの クラスター・キャッシング・ファシリティーを持つ環境を示しています。
ID TYPE STATE HOME_HOST CURRENT_HOST ALERT PARTITION_NUMBER LOGICAL_PORT NETNAME
-- ---- ----- --------- ------------ ----- ---------------- ------------ -------
0 MEMBER WAITING_FOR_FAILBACK hostA hostC YES 0 1 hostC-ib0
1 MEMBER STARTED hostB hostB NO 0 0 hostB-ib0
2 MEMBER STARTED hostC hostC NO 0 0 hostC-ib0
128 CF PRIMARY hostD hostD NO - 0 hostD-ib0
129 CF PEER hostE hostE NO - 0 hostE-ib0
HOSTNAME STATE INSTANCE_STOPPED ALERT
-------- ----- ---------------- -----
hostA INACTIVE NO YES
hostB ACTIVE NO NO
hostC ACTIVE NO NO
hostD ACTIVE NO NO
hostE ACTIVE NO NO
メンバー 0は、ホームホストである hostA, で問題が発生したため、 hostB で再起動を試みました。 しかし hostB での restart light は失敗しました。 次に、このメンバーは hostC での restart light を試行し、それが成功しました。hostA が再び使用可能になった場合、その状態は INACTIVE から ACTIVE に変わります。 メンバー 0は hostA, にフェイルバックし、 メンバー の状態はWAITING_FOR_FAILBACKからSTARTEDに変化します。
ID TYPE STATE HOME_HOST CURRENT_HOST ALERT PARTITION_NUMBER LOGICAL_PORT NETNAME
-- ---- ----- --------- ------------ ----- ---------------- ------------ -------
0 MEMBER STARTED hostA hostA YES 0 0 hostA-ib0
1 MEMBER STARTED hostB hostB NO 0 0 hostB-ib0
2 MEMBER STARTED hostC hostC NO 0 0 hostC-ib0
128 CF PRIMARY hostD hostD NO - 0 hostD-ib0
129 CF PEER hostE hostE NO - 0 hostE-ib0
HOSTNAME STATE INSTANCE_STOPPED ALERT
-------- ----- ---------------- -----
hostA ACTIVE NO NO
hostB ACTIVE NO NO
hostC ACTIVE NO NO
hostD ACTIVE NO NO
hostE ACTIVE NO NO
トラブルシューティングの手順
hostB での restart light 失敗のトラブルシューティングを行うには、以下のいずれか 1 つ、または両方の手順を実行してください。
- db2diag ログ・ファイルで失敗に関する情報を確認した後、それについて調査します。以下の出力例は、hostB での restart light 試行を示しています。
diag メッセージを調べて、hostB での restart light 失敗に対応するエラーを分析します。2009-08-27-23.37.52.416270-240 I6733A457 LEVEL: Event PID : 1093874 TID : 1 KTID : 2461779 PROC : db2star2 INSTANCE: NODE : 000 HOSTNAME: hostB EDUID : 1 FUNCTION: Db2, base sys utilities, DB2StartMain, probe:3368 MESSAGE : Idle process taken over by member DATA #1 : Database Partition Number, PD_TYPE_NODE, 2 bytes 996 DATA #2 : Database Partition Number, PD_TYPE_NODE, 2 bytes 0 - hostAでのホスト障害を診断する手順については、 restart light を使用したホスト・リブートの診断 を参照してください。
- このシナリオのトラブルシューティング方法の例については、 restart light 中に発生したクラスター・ファイル・システム障害の診断 を参照してください。
- 問題を診断した後、 メンバーのアラートをクリアします。