データ関連障害

このトピックの情報を使用して、データの問題を特定し、解決することができます。

表 1. データの問題
問題 検出 解決策
レプリカノード上のトランザクションアプリケーションに障害が発生しました。 ReplMaxRetryAttempts イベントは、設定された再試行回数を使い果たした後に、アプ リケーションエージェントによって検出され、eventmgr によって報告される。 設定メタデータが更新され、レプリカ・ノードのレプリケーションが一時停止されたことが反映される。 障害が構成またはデータに関連するものであると仮定して、トランザクションを完了できるようにデータベースを修正する。 場合によっては、トランザクションを強制的にスキップするために、トランザクションのメタデータを更新する必要があるかもしれない。 これは、カスタマー・サポートと nzreploverridecsi コマンドの助けを借りて行うことができます。 その後、レプリカ・ノードでレプリケーションを再開します。
複数のレプリカ・ノードがある環境では、そのうちの1つのノードで問題が発生し、処理が停止する。 故障したノードがバックログになるため、最終的にすべてのノードがディスク容量を使い果たしてしまう。 スペースはプルーニングによって解放されるが、故障したレプリカノードの場合、次のレプリケートされたトランザクションはすでにレプリケーションログサーバーからプルーニングされている。 applyエージェントは、次のトランザクションの適用を要求しても、そのトランザクションを見つけることができず、その結果、レプリカノードはさらに遅れてしまう。 プライマリとレプリカ間のコミット間隔のギャップが MAX_COMMIT_DELTA 構成パラメータの値(デフォルト値は 600 秒)を超えると、 ReplCommitDeltaExceeded イベントが発行されます。 nzreplanalyzenzreplbackupnzreplrestore コマンドを使用してレプリカを復旧します。 その後、レプリカ・ノードのレプリケーションを再アクティブ化する。
レプリカ・ノードはプライマリ・ノードより一貫性維持までの時間が遅れている。 v_replication_apply_logビューを監視し、プライマリのトランザクションコミット時間とレプリカのトランザクションコミット時間の差分の値が増加していることを確認する。 プライマリとレプリカ間の通信パイプのサイズを大きくしたり、レプリカの処理能力を上げたり、プライマリの更新負荷を軽減したりする必要があるかもしれません。