restart light が 1 つのホストで失敗し、別のホストで完了する

restart light の際には、リカバリー・プロセスを完了させるためにメンバーがゲスト・ホストにフェイルオーバーします。 このトピックの情報を使用すると、最初のゲスト・ホストで restart light が失敗し、2 番目のゲスト・ホストで正常に完了した理由を診断するのに役立ちます。

症状

以下の db2instance -list コマンドの出力例は、3 つの メンバー と 2 つの クラスター・キャッシング・ファシリティーを持つ環境を示しています。
ID        TYPE         STATE                 HOME_HOST    CURRENT_HOST    ALERT   PARTITION_NUMBER        LOGICAL_PORT    NETNAME
--        ----         -----                 ---------    ------------    -----   ----------------        ------------    -------
0         MEMBER       WAITING_FOR_FAILBACK  hostA        hostC           YES                    0                   1    hostC-ib0
1         MEMBER       STARTED               hostB        hostB           NO                     0                   0    hostB-ib0
2         MEMBER       STARTED               hostC        hostC           NO                     0                   0    hostC-ib0
128       CF           PRIMARY               hostD        hostD           NO                     -                   0    hostD-ib0
129       CF           PEER                  hostE        hostE           NO                     -                   0    hostE-ib0

HOSTNAME    STATE      INSTANCE_STOPPED ALERT
--------    -----      ---------------- -----
hostA       INACTIVE   NO               YES
hostB       ACTIVE     NO               NO
hostC       ACTIVE     NO               NO
hostD       ACTIVE     NO               NO
hostE       ACTIVE     NO               NO
メンバー 0は、ホームホストである hostA, で問題が発生したため、 hostB で再起動を試みました。 しかし hostB での restart light は失敗しました。 次に、このメンバーは hostC での restart light を試行し、それが成功しました。
hostA が再び使用可能になった場合、その状態は INACTIVE から ACTIVE に変わります。 メンバー 0は hostA, にフェイルバックし、 メンバー の状態はWAITING_FOR_FAILBACKからSTARTEDに変化します。
ID        TYPE             STATE           HOME_HOST   CURRENT_HOST    ALERT   PARTITION_NUMBER        LOGICAL_PORT    NETNAME
--        ----             -----           ---------   ------------    -----   ----------------        ------------    -------
0         MEMBER           STARTED         hostA       hostA           YES                    0                   0    hostA-ib0
1         MEMBER           STARTED         hostB       hostB           NO                     0                   0    hostB-ib0
2         MEMBER           STARTED         hostC       hostC           NO                     0                   0    hostC-ib0
128       CF               PRIMARY         hostD       hostD           NO                     -                   0    hostD-ib0
129       CF               PEER            hostE       hostE           NO                     -                   0    hostE-ib0

HOSTNAME              STATE      INSTANCE_STOPPED ALERT
--------              -----      ---------------- -----
hostA                 ACTIVE     NO               NO
hostB                 ACTIVE     NO               NO
hostC                 ACTIVE     NO               NO
hostD                 ACTIVE     NO               NO
hostE                 ACTIVE     NO               NO

トラブルシューティングの手順

hostB での restart light 失敗のトラブルシューティングを行うには、以下のいずれか 1 つ、または両方の手順を実行してください。
  • db2diag ログ・ファイルで失敗に関する情報を確認した後、それについて調査します。
    以下の出力例は、hostB での restart light 試行を示しています。
    2009-08-27-23.37.52.416270-240 I6733A457            LEVEL: Event
    PID     : 1093874              TID  : 1             KTID : 2461779
    PROC    : db2star2
    INSTANCE:                      NODE : 000
    HOSTNAME: hostB
    EDUID   : 1
    FUNCTION: Db2, base sys utilities, DB2StartMain, probe:3368
    MESSAGE : Idle process taken over by member
    DATA #1 : Database Partition Number, PD_TYPE_NODE, 2 bytes
    996
    DATA #2 : Database Partition Number, PD_TYPE_NODE, 2 bytes
    0
    diag メッセージを調べて、hostB での restart light 失敗に対応するエラーを分析します。
  • hostAでのホスト障害を診断する手順については、 restart light を使用したホスト・リブートの診断 を参照してください。
  • このシナリオのトラブルシューティング方法の例については、 restart light 中に発生したクラスター・ファイル・システム障害の診断 を参照してください。
  • 問題を診断した後、 メンバーのアラートをクリアします。