IBM Support

AIXまたはVIOSで特定のデバイス・ドライバーを使用時に、マルチパス構成のストレージ・デバイスでのパス障害発生後、データ整合性が損なわれる可能性があります

Flashes (Alerts)


Abstract

問題 AIX または VIOS が稼働しているシステムにおいて、特定の物理ファイバー・チャネル・アダプターまたは、仮想ファイバー・チャネル・アダプター(NPIV)を介して接続されるマルチパス構成のストレージ・デバイスでパス障害が発生すると、整合性を損なうデータを書き込む可能性があり、データの破損または、整合性を損なう可能性があります。

Content

問題

AIX または VIOS が稼働しているシステムにおいて、特定の物理ファイバー・チャネル・アダプターまたは、仮想ファイバー・チャネル・アダプター(NPIV)を介して接続されるマルチパス構成のストレージ・デバイスでパス障害が発生すると、整合性を損なうデータを書き込む可能性があり、データの破損または、整合性を損なう可能性があります。


原因

パス障害により該当のストレージ・デバイスへのアクセスができなくなった場合、ドライバーは障害の発生したパスを閉塞し、利用可能な別のパスへ自動的に切り替えて入出力要求の処理を継続します。その際、同一ブロックに対する複数の書き込み要求が交錯した順序で処理される可能性があり、書き込まれるデータの整合性を損なう可能性があります。この不具合に対して、ディスク入出力要求中断の命令がストレージ側で完了したかどうかがわからない場合、LUN RESET命令を送信し、すべての中断された命令をストレージからフラッシュするため、追加の回復処理を実行するように修正が行われています。


発生条件

以下のすべての条件を満たす場合、当該問題が発生する可能性があります。

(1) 物理ファイバー・チャネル・アダプターまたは、仮想ファイバー・チャネル・アダプター(NPIV)を介してマルチパス接続するIBM Flash Systemsまたは、IBM San Volume Controller / IBM Storwize family(キャッシュ未使用)を使用
※除外対象として明記していない機器や構成、特に他社製ストレージ・デバイス(ストレージ・デバイスへのアクセス経路を管理するプログラムを含む) については、弊社で調査や検証ができず問題が発生する可能性を否定することができません。 このため発生する可能性がある前提で、修正を適用する等の対策をご検討ください。

以下のストレージ・デバイスを使用している場合は、当該問題は発生しません。
・IBM DS8000 series
・IBM San Volume Controller (キャッシュを使用)※
・IBM Storwize family(キャッシュを使用)※
・IBM XIV family
・EMC Symmetrix family

※キャッシュを使用しているかどうかは、SVCコマンド・ライン・インターフェース lsvdiskコマンドにてご確認ください。cacheの値がreadwriteであればキャッシュを使用しています(デフォルト)。
ただし、意図的にキャッシュを未使用にした環境だけでなく、IBM San Volume Controller / IBM Storwize family 機器のメンテナンス実施時や障害発生時にキャッシュが未使用状態となり当問題に該当する可能性がありますので、恒久的にはfixの適用をご検討ください。

参考:IBM Knowledge Center
lsvdisk
https://www.ibm.com/support/knowledgecenter/ja/STPVGU_8.1.0/com.ibm.storage.svc.console.810.doc/svc_lsvdisk_21pdwu.html
chvdisk
https://www.ibm.com/support/knowledgecenter/ja/STPVGU_8.1.0/com.ibm.storage.svc.console.810.doc/svc_modifyvdisk_21kdan.html


(2) 特定レベルのファイルセットを使用している

対象となるAIX/VIOSのバージョン
対象となるファイルセット
VIOS 2.2.3.0 - VIOS 2.2.3.90devices.fcp.disk.rte 6.1.9.0 - 6.1.9.201
devices.pci.77102224.com 6.1.9.0 - 6.1.9.201
devices.pci.df1000f7.com 6.1.9.0 - 6.1.9.201
devices.pciex.df1060e214103404.com 6.1.9.0 - 6.1.9.201
VIOS 2.2.4.0 - VIOS 2.2.4.40devices.fcp.disk.rte 6.1.9.100 - 6.1.9.201
devices.pci.77102224.com 6.1.9.100 - 6.1.9.201
devices.pci.df1000f7.com 6.1.9.100 - 6.1.9.201
devices.pciex.df1060e214103404.com 6.1.9.100 - 6.1.9.201
VIOS 2.2.5.0 - VIOS 2.2.5.20devices.fcp.disk.rte 6.1.9.200 - 6.1.9.201
devices.pci.77102224.com 6.1.9.200 - 6.1.9.201
devices.pci.df1000f7.com 6.1.9.200 - 6.1.9.201
devices.pciex.df1060e214103404.com 6.1.9.200 - 6.1.9.201
6100-09-00 - 6100-09-09devices.fcp.disk.rte 6.1.9.0 - 6.1.9.201
devices.pci.77102224.com 6.1.9.0 - 6.1.9.201
devices.pci.df1000f7.com 6.1.9.0 - 6.1.9.201
devices.pciex.df1060e214103404.com 6.1.9.0 - 6.1.9.201
7100-03-00 - 7100-03-09 devices.fcp.disk.rte 7.1.3.0 - 7.1.3.49
devices.pci.77102224.com 7.1.3.0 - 7.1.3.49
devices.pci.df1000f7.com 7.1.3.0 - 7.1.3.49
devices.pciex.df1060e214103404.com 7.1.3.0 - 7.1.3.49
7100-04-00 - 7100-04-04 devices.fcp.disk.rte 7.1.4.0 - 7.1.4.31
devices.pci.77102224.com 7.1.4.0 - 7.1.4.31
devices.pci.df1000f7.com 7.1.4.0 - 7.1.4.31
devices.pciex.df1060e214103404.com 7.1.4.0 - 7.1.4.31
7200-00-00 - 7200-00-04 devices.fcp.disk.rte 7.2.0.0 - 7.2.0.3
devices.pci.77102224.com 7.2.0.0 - 7.2.0.3
devices.pci.df1000f7.com 7.2.0.0 - 7.2.0.3
devices.pciex.df1060e214103404.com 7.2.0.0 - 7.2.0.3
7200-01-00 - 7200-01-02devices.fcp.disk.rte 7.2.1.0 - 7.2.1.1
devices.pci.77102224.com 7.2.1.0 - 7.2.1.1
devices.pci.df1000f7.com 7.2.1.0 - 7.2.1.1
devices.pciex.df1060e214103404.com 7.2.1.0 - 7.2.1.1


(3) 以下のデバイス・ドライバーのいずれかを使用している 
問題が発生する可能性のあるデバイス・ドライバーは以下の3つです。
・efcdd
・emfcdd
・vfcdd

使用しているデバイス・ドライバーは、odmget -q "name = fcsX" CuDv にてご確認下さい。

実行例:
# odmget -q "name = fcs0" CuDv

CuDv:
name = "fcs0"
status = 1
chgstatus = 2
ddins = "pci/efcdd" <===== efcdd であることが確認できます
location = "00-08"
parent = "pci0"
connwhere = "8"
PdDvLn = "adapter/pci/df1000fd"


(4) 以下の2つの要求が同一ブロックに対する書き込みで、同じようなタイミングで行われる
・障害の発生したパスで処理していた要求
・入出力を継続する正常なパスで処理していた要求


回避策・解決策

1)回避策
なし

2)解決策
修正を含むサービスパックの適用により、問題が解決されます。
この不具合に対して、ディスク入出力要求中断の命令がストレージ側で完了したかどうかがわからない場合、LUN RESET命令を送信し、すべての中断された命令をストレージからフラッシュするため、追加の回復処理を実行するように修正が行われています。

対象となるAIX/VIOSのバージョン修正レベル 暫定フィックス
VIOS 2.2.3.0 - VIOS 2.2.3.90VIOS 2.2.6.10(IV96553)http://aix.software.ibm.com/aix/ifixes/iv96553/
VIOS 2.2.4.0 - VIOS 2.2.4.40
VIOS 2.2.5.0 - VIOS 2.2.5.20
6100-09-00 - 6100-09-096100-09-10(IV96553)http://aix.software.ibm.com/aix/ifixes/iv96553/
7100-03-00 - 7100-03-09 NONE 提供予定なし。iFixのみの提供http://aix.software.ibm.com/aix/ifixes/iv97772/
7100-04-00 - 7100-04-04 7100-04-05(IV96603)http://aix.software.ibm.com/aix/ifixes/iv96603/
7200-00-00 - 7200-00-04 7200-00-05(IV96606)http://aix.software.ibm.com/aix/ifixes/iv96606/
7200-01-00 - 7200-01-027200-01-03(IV96604)http://aix.software.ibm.com/aix/ifixes/iv96604/


以上

[{"Product":{"code":"HW1A1","label":"IBM Power Systems"},"Business Unit":{"code":"BU058","label":"IBM Infrastructure w\/TPS"},"Component":"--","Platform":[{"code":"PF002","label":"AIX"}],"Version":"All Versions","Edition":"","Line of Business":{"code":"LOB57","label":"Power"}}]

Historical Number

29867AD35CBB84D0492581C90023B2BE

Product Synonym

対象システム:Power Systems;AIX;VIOS

Document Information

Modified date:
25 September 2022

UID

jpn1J1013401