ストレージ・コントローラー障害からのリカバリー

複製ファイル・システムのストレージ・コントローラーまたはディスクで障害が発生すると、システムは、アクセスを他のレプリカに経路指定します。 管理者による介入は不要で、ファイル・システムへのアクセスに対する影響もありません。 問題が解決し、ディスクが再び使用可能な状態になったら、それらのディスクを手動で開始する必要があります。

始める前に

  • このタスクを実行するには、 Db2® クラスター・サービス管理者でなければなりません。

プロシージャー

  1. ファイル・システムにダウン状態のディスクがあるかどうかを確認するには、以下のコマンドを使用します。
    db2cluster -cfs -list -filesystem <fs name> 
  2. 「状態」 列の下に「 ダウン 」状態のディスクがある場合は、以下のコマンドを使用して再始動します。
    db2cluster -cfs -start -filesystem <fs name> -disk

    このコマンドによって、もう一方のストレージ・コントローラーがダウンしていた間に追加されたデータの複製がトリガーされるわけではありません。 このコマンドが戻ると、両方のストレージで新しいデータの複製が開始されます。

    ディスク始動操作により、ファイル・システム・メタデータとユーザー・ファイル (該当する場合) の自動修復が行われます。 後者が必要な場合は、対象ファイルへのアクセスが制限され、それらのファイルにアクセスする必要がある進行中のトランザクションがブロックされます。 その期間は、必要な修復の程度によります。 したがって、このコマンドは、使用率がオフピークの時間帯に実行することをお勧めします。

  3. 次のコマンドを実行して、ファイル・システム内のすべてのディスクが正常に開始され、状態が Up になっていることを確認します。
    db2cluster -cfs -list -filesystem <fs name>

    上記のコマンドは、ターゲット・ファイル・システムの構成と状況を再検証します。 再検証の際に、問題となる状態が解決されていれば、既存のアラートは解除されます。 問題がある場合、新しいアラートが発行されます。

  4. ストレージがダウンしていた間にシステムに追加されたデータを複製するには、以下のコマンドを実行します。 この操作は入出力負荷が高いため、使用率がオフピークの時間帯に実行することをお勧めします。
    db2cluster -cfs -replicate -filesystem <fs name>
  5. 最後に、ファイル・システムのリバランスが必要になる場合があります。 db2instance -list を実行して、アラートがあるかどうかを確認します。 db2cluster -list -alerts を使用すれば、アラートの詳細を確認できます。 unbalanced のアラートが生成されている場合は、以下のコマンドを実行してファイル・システムのリバランスを行います。 この操作は入出力負荷が高いため、使用率がオフピークの時間帯に実行することをお勧めします。
    db2cluster -cfs -rebalance -filesystem <fs name>