Db2 pureScale 環境の共有ストレージのサポート

IBM® Db2 pureScale Feature でサポートされる共有ストレージ・デバイスは、3 つのカテゴリーに分けられます。 このカテゴリーは、2 つのストレージ・フィーチャーに基づいて、ストレージ・デバイスとマルチパス入出力ドライバーの対をグループ化します。 高速入出力フェンシング・サポートと Db2 クラスター・サービス ・タイブレーカー・サポートの 2 つの機能により、障害が発生したホストのリカバリー時間が短縮され、回復力が向上し、可用性が向上します。

2 台のマシンで偶数個のホストを持つ構成では、ちょうど半数のホストで障害が発生するケースに備えることは、特に重要です。 この構成では、1 台のマシンで障害が発生した場合にホストの半数で障害が発生するので、操作クォーラムを得るためにタイブレーカーが必要です。

Db2 pureScale Feature は、論理装置番号 (LUN) として参照される、すべてのストレージ・エリア・ネットワーク (SAN) および直接接続された共有ブロック・ストレージをサポートします。

高速 I/O フェンシング

Db2 pureScale インスタンスで障害が発生した メンバー をリカバリーする前に、 Db2 クラスター・サービス は、障害が発生した メンバー がディスク上の共有データを変更できないようにします。 この予防措置は、I/O フェンシングと呼ばれます。 一部のストレージ・コントローラーとマルチパス入出力ドライバーの組み合わせは、 SCSI-3 Persistent Reserve (PR) と呼ばれる特殊な機能をサポートしています。この機能には、 すべての登録者を排他的に書き込む 永続予約タイプ (タイプ 7h) があります。 このタイプにより、 Db2 クラスター・サービス は、わずか 1 秒から 2 秒で高速 I/O フェンシングを実行できます。

リカバリー時間とは、ホストで障害が発生してから、コミットされていないトランザクションのためにロックが解放されるまでの経過時間を指します。 トランザクションが短い一般的な OLTP ワークロードの場合、高速 I/O フェンシングにより、リカバリー時間は約 20 秒になります。 ロック・リースの終了時間の観点からすると、高速 I/O フェンシングは、代替方法と比べてはるかに高速です。 使用するカテゴリーを決める際は、サービス・レベル・アグリーメント (SLA) を満たすために高速 I/O フェンシング・サポートが必要かどうかを評価してください。

Db2 クラスター・サービス ・タイブレーカー・サポート

ホストのサブクラスターは、 IBM Reliable Scalable Cluster Technology (RSCT) の操作クォーラムを必要とします。これにより、サブクラスターは、 ホスト障害が発生した場合に Db2 pureScale インスタンスの実行を継続できます。 RSCT から操作クォーラムを得るには、サブクラスターに過半数のホストが含まれている必要があります。 クラスターでちょうど半分のホストの通信状態が維持されていれば、そのサブクラスターでタイブレーカーを排他的に予約して、操作クォーラムを得ることができます。

Db2 11.1 以降のフィックスパックでは、サポートされる Linux® オペレーティング・システム上で、クラスター・マネージャー・タイブレーカー・ディスクとして使用されるデバイスの SCSI-3 PR WRITE EXCLUSIVE REGISTRANTS ONLY 予約タイプ・コード 0x50 が有効になっている必要があります。

サポートされる AIX® オペレーティング・システムでは、クラスター・マネージャー・タイブレーカー・ディスクとして使用されるデバイスは、 SCSI-3 PR WRITE EXCLUSIVE REGISTRANTS ONLY 予約タイプ・コード 0x50 を使用可能にするか、 SCSI-2 予約タイプを使用可能にすることができます。

Linuxで SCSI-3 PR 状況を確認するには、以下に示す構文でコマンド sg_persist を使用します。 Write Exclusive, registrants only の値が 1 であることを確認してください。

サンプル出力を次に示します。
sg_persist -c /dev/dm-7
    IBM       2145         0000
    Peripheral device type: disk
    Report capabilities response: Compatible
    Reservation Handling (CRH): 1
    Specify Initiator Ports Capable (SIP_C): 0
    All Target Ports Capable (ATP_C): 0
    Persist Through Power Loss Capable (PTPL_C): 1 
    Type Mask Valid (TMV): 1
    Allow Commands: 0
    Persist Through Power Loss Active(PTPL_A): 1
     Support indicated in Type mask:
      Write Exclusive, all registrants: 1
      Exclusive Access, registrants only: 1     
      Write Exclusive, registrants only: 1
      Exclusive Access: 1
      Write Exclusive: 1
      Exclusive Access, all registrants: 1

コマンド sg_persistについて詳しくは、このコマンドの Linux マニュアル・ページを参照してください。

AIXで SCSI-3 PR 状況を確認するには、以下に示す構文でコマンド lsattr を使用します。 PR_exclusive がリストされていることを確認します。
lsattr -R -l hdisk1 -a reserve_policy
no_reserve
single_path
PR_exclusive
PR_shared

コマンド lsattrについて詳しくは、 AIX マニュアル・ページを参照してください。

タイブレーカー・ディスクは要件ではありません。 しかし、クラスター内に偶数台数のマシンがあり、タイブレーカー・ディスクがない場合に、クラスター内のマシンの半数に障害が発生すると、操作クォーラムは失われます。 クラスターを稼働状態にするには、操作クォーラムがなければなりません。 操作クォーラムがないと、データベースは使用できなくなります。

Subsystem Device Driver Path Control Module (SDDPCM)

SDDPCM を 2.6.3.x にアップグレードすると、アップグレードされたデバイス上の algorithm 属性が fail_over に設定されている場合には、デバイス構成が失敗する可能性があります。 装置構成設定が失敗した場合、 Db2 pureScale クラスターが影響を受ける可能性があります。 algorithm 属性で fail_over オプションを使用する場合には、timeout_policy 属性を retry_path に設定しなければなりません。 詳しくは、この IBM サポート技術情報を参照してください。

マルチパス・サービスの構成

Linux での DM-MP マルチパス・サービスの構成については、IBM Spectrum Scale の FAQ ページの Q4.6 を参照してください。 詳しくは、 IBM Spectrum Scale 「よくある質問と回答」を参照してください。

カテゴリー 1 のストレージ・デバイスとマルチパス入出力ドライバーの組み合わせ

このカテゴリーにリストされたストレージ・デバイスとマルチパス入出力ドライバーの組み合わせは、 Db2 クラスター・サービス ・タイブレーカーと高速入出力フェンシングの両方を正常にサポートできます。 カテゴリー 1 のデバイスは、 Db2 pureScale Feature を使用して検証され、回復力が最大になり、リカバリー時間が最短になります。
表 1. カテゴリー 1 のストレージ・デバイスとマルチパス入出力ドライバーの組み合わせ
ストレージ・デバイス AIX システムに必要なマルチパス入出力ドライバー Linux システムに必要なマルチパス入出力ドライバー プロトコル
IBM Storwize ® V7000 (6.4.0.1 以上) SDDPCM、MPIO DM-MP ファイバー・チャネル
IBM SAN ボリューム・コントローラー (6.4.0.1 以上) SDDPCM、MPIO DM-MP ファイバー・チャネル
IBM System Storage® DS8000® シリーズ IBM 提供の SDDPCM ドライバー (ドライバー・ファイル devices.fcp.disk.ibm.mpio.rte および devices.sddpcm<Your specific AIX version>.rte) DM-MP ファイバー・チャネル
IBM System Storage DS5000 シリーズ IBM で提供される MPIO ドライバー (ドライバー・ファイル devices.fcp.disk.ibm.mpio.rte) DM-MP ファイバー・チャネル
IBM System Storage DS4000® シリーズ IBM で提供される MPIO ドライバー (ドライバー・ファイル devices.fcp.disk.ibm.mpio.rte) DM-MP ファイバー・チャネル
IBM System Storage DS3000 シリーズ IBM で提供される MPIO ドライバー (ドライバー・ファイル devices.fcp.disk.ibm.mpio.rte) DM-MP ファイバー・チャネル
EMC VMAX/Symmetrix ファミリー 1

EMC PowerPath 5.5 P04 B00310 および EMC AIX ODM パッケージ 5.3.0.6

EMCが提供する MPIO ドライバー (ドライバー・ファイル EMC.Symmetrix.fcp.MPIO.rte)

DM-MP ファイバー・チャネル
NetApp FAS ファイラー NetApp で提供される MPIO ドライバー DM-MP iSCSI
Virtual I/O Server (VIOS) 2 MPIO または SDDPCM 該当なし ファイバー・チャネル
Hitachi 仮想ストレージ・プラットフォーム (VSP)5 Hitachi 提供の MPIO ドライバー (devices.fcp.disk.Hitachi.array.mpio.rte)

Hitachi 提供の AIX バージョン 7.3.1 以降用の HDLM ドライバー

DM-MP ファイバー・チャネル
Hitachi Universal Storage (HUS) 100 シリーズ6 Hitachi 提供の MPIO ドライバー (devices.fcp.disk.Hitachi.array.mpio.rte)

Hitachi 提供の AIX バージョン 7.3.1 以降用の HDLM ドライバー

DM-MP ファイバー・チャネル
Hitachi Universal Storage (HUS) VM7 Hitachi 提供の MPIO ドライバー (devices.fcp.disk.Hitachi.array.mpio.rte)

Hitachi 提供の AIX バージョン 7.3.1 以降用の HDLM ドライバー

DM-MP ファイバー・チャネル
Hitachi VSP G10007 Hitachi 提供の MPIO ドライバー (devices.fcp.disk.Hitachi.array.mpio.rte)

Hitachi 提供の AIX バージョン 7.3.1 以降用の HDLM ドライバー

DM-MP ファイバー・チャネル
IBM XIV® Storage System MPIO DM-MP ファイバー・チャネル
IBM FlashSystem 840 IBM (ドライバー・ファイル devices.fcp.disk.ibm.mpio.rte) DM-MP ファイバー・チャネル
IBM Storwize V5000 (7.3.0 以上) SDDPCM DM-MP ファイバー・チャネル
IBM Flash System 900 MPIO DM-MP ファイバー・チャネル
IBM Flash System v9000 MPIO   ファイバー・チャネル
Huawei OceanStor 5500 V3   DM-MP ファイバー・チャネル
IBM FlashSystem™ A900010 MPIO DM-MP ファイバー・チャネル
IBM FlashSystem™ A9000R10 MPIO DM-MP ファイバー・チャネル
IBM FlashSystem™ 7200 MPIO DM-MP ファイバー・チャネル
IBM FlashSystem™ 9200 MPIO DM-MP ファイバー・チャネル
IBM FlashSystem™ 5000 MPIO DM-MP ファイバー・チャネル
注:
  1. EMC VMAX/Symmetrix ファミリーのストレージ・システムに接続する各々のホストのポートでは、フロントエンド・アダプター・ポート構成に SCSI_3 (SC3) フラグが設定されていなければなりません。 ハイパーボリュームでは、 Db2 クラスター・サービス ・タイブレーカーに使用する論理装置番号 (LUN) に、 SCSI3_persist_reserv オプションを設定する必要があります。

    サポートされる Linux システムでは、クラスター・マネージャー (RSCT) タイブレーカー用に選択されたデバイスは、予約タイプ WRITE EXCLUSIVE REGISTRANTS ONLY タイプ・コード 5hをサポートしている必要があります。 SCSI-3 PR を有効にすると、永続予約ホルダーが 1 つ存在します (クォーラム・デバイスを獲得したノード)。 EMC VMAX 共有ストレージを使用する Db2 pureScale クラスターでは、マップされたディスクに対して SCSI3_persist_reserve タイプのオプションを有効にする必要があります。 デフォルトでは有効になっていません。

  2. ストレージ・システムと AIX システム・マルチパス入出力ドライバーの組み合わせの場合は、N_Port ID Virtualization (NPIV) とともに Virtual I/O Server を使用する必要があります。 VIOS ストレージのカテゴリーは、基礎となる物理ハードウェア・ストレージ・システムのストレージが属するカテゴリーと同じです。 カテゴリー 1 のストレージと見なされる VIOS ストレージについては、その物理ストレージ・ハードウェアとドライバーの組み合わせが、カテゴリー 1 の表に記載されているはずです。
  3. SDDPCM v2630 以降、 Db2 pureScale Featureをインストールする前に、タイブレーカー・ディスクの timeout_policy 属性を retry_path に変更する必要があります。 timeout_policy 属性の値を変更するには、次のコマンドを入力します。
    chdev -l hdiskX -a timeout_policy=retry_path 
  4. これらのドライバーについて詳しくは、以下を参照してください。
  5. 以下の制約事項が適用されます。
    • Hitachi 提供の HDLM (Hitachi Dynamic Link Manager) for AIX バージョン 7.3.1 以降
    • Linux システムで必要なマルチパス入出力ドライバー - DM-MP のみ
    • 最小マイクロコード・レベル 70-04-31-00/00
    • HDLM が使用されている場合:
      • HGLM (Hitachi Global Link Manager Software) を使用してタイブレーカー・ディスクのロード・バランシング設定を OFF にします。
      • "/usr/DynamicLinkManager/bin/dlmodmset -r on" を実行して、LUN RESET オプションを on に設定します。
    • Db2 によって使用されるすべてのディスクに固有の設定:
      • ホスト・モード・オプション 02 および 72 をオン
      • HDLM が使用されている場合のみファイバー・チャネル
  6. 以下の制約事項が適用されます。
    • Hitachi 提供の HDLM for AIX バージョン 7.3.1 以降
    • Linux システムで必要なマルチパス入出力ドライバー - DM-MP のみ
    • 最小マイクロコード・レベル 0945/A
    • ディスクをタイブレーカー・ディスクとして使用する場合、「Allocation length Expand mode」 チェック・ボックスを選択してください。
    • 高速 I/O フェンシング (SCSI-3PR) が有効
    • GPFS ファイル・システムの一部であり、高速 I/O フェンシングが有効なディスクについては、「 Unique Reserve mode 2」チェック・ボックスを選択してください。
  7. 以下の制約事項が適用されます。
    • Hitachi 提供の HDLM for AIX バージョン 7.3.1 以降
    • Linux システムで必要なマルチパス入出力ドライバー - DM-MP のみ
    • HUS VM 最小マイクロコード・レベル 73-01-32-00/00
    • VSP G1000 最小マイクロコード・レベル 80-01-41-00/00
    • HDLM が使用されている場合:
      • HGLM を使用してタイブレーカー・ディスクのロード・バランシング設定を OFF にします。
      • "/usr/DynamicLinkManager/bin/dlmodmset -r on" を実行して、LUN RESET オプションを on に設定します。
    • Db2 によって使用されるすべてのディスクに固有の設定:
      • ホスト・モード・オプション 02 および 72 をオン
      • HDLM が使用されている場合のみファイバー・チャネル
  8. EMC PowerPath 5.5 P04 B003 での SCSI-3 PR の変更をサポートするには、EMC Symmetrix が Enginunity コード 5876 基本レベル以上を実行していなければなりません。
  9. 推奨設定については、 カテゴリー 1 ストレージ・デバイスの共有ストレージ・ディスク設定 を参照してください。
  10. DB2 リリース 11.1.2.2 およびそれ以降のフィックスパックでサポートされています。

カテゴリー 2 のストレージ・デバイスとマルチパス入出力ドライバーの組み合わせ

このカテゴリーにリストされているストレージ・デバイスとマルチパス入出力ドライバーの組み合わせがサポートされ、 Db2 pureScale Featureで検証済みです。 このカテゴリーの組み合わせは、 Db2 クラスター・サービス ・タイブレーカーを正常にサポートできますが、高速 I/O フェンシングはサポートできません。
表 2. カテゴリー 2 のストレージ・デバイスとマルチパス入出力ドライバーの組み合わせ
ストレージ・デバイス AIX システムに必要なマルチパス入出力ドライバー Linux システムに必要なマルチパス入出力ドライバー プロトコル
EMC VMAX/Symmetrix ファミリー EMC PowerPath   ファイバー・チャネル
Hitachi Universal Storage Platform V (USP V) MPIO   ファイバー・チャネル

カテゴリー 3 のストレージ・デバイスとマルチパス入出力ドライバーの組み合わせ

カテゴリー1 、カテゴリー2として識別されないすべてのストレージ・デバイスとマルチパス入出力ドライバーの組み合わせは、カテゴリー 3に分類されます。 カテゴリー 3 の組み合わせは、 Db2 pureScale Featureではサポートされていますが、検証されていません。

Db2 pureScale 環境におけるホスト障害のリカバリー時間は、ストレージ・デバイスおよびマルチパス入出力ドライバーのカテゴリーに関係なく、他のベンダー・ソリューションと競合します。
注: このカテゴリーのストレージ・デバイスには、高速 I/O フェンシングまたはディスク・タイブレーカー機能をサポートする機能がない場合があります。