RoCE ネットワーク上でのスイッチ構成 (AIX)

スイッチ・フェイルオーバー機能は、スイッチで Link Aggregate Control Protocol (LACP) を構成することによって提供される高可用性フィーチャーです。

始める前に

この構成手順は、 AIX® システムを使用する環境のスイッチ、および Remote Direct Memory Access (RDMA) over Converged Ethernet (RoCE) ネットワークに固有のものです。 スイッチ・フェイルオーバー機能は、スイッチで Link Aggregate Control Protocol (LACP) を構成することによって提供される高可用性フィーチャーです。

始めに
  1. Db2® pureScale® Feature インストール計画が作成されていることを確認します。 インストール計画を立てることにより、システムが前提条件を満たしていること、およびインストール前タスクが実行済みであることを確認するのに役立ちます。
  2. Db2 pureScale 環境のネットワーク・トポロジー構成サポートで、 Db2 pureScale 環境でサポートされているネットワーク・トポロジーについて説明していることを確認してください。
  3. スイッチの電源をオンにし、シリアル・ケーブルまたはイーサネット・ケーブルをスイッチに接続します。

このタスクについて

RoCE ネットワーク・スイッチは、以下をサポートする必要があります。
  • スイッチ・フェイルオーバー構成のための Link Aggregate Control Protocol (LACP)
  • Global Pause フロー制御 (IEEE 802.3x)
  • オプション。 同じ IP サブネット上の IP アドレスから ping 可能なスイッチ上のローカル・ループバック IP アドレスのサポート。 これに関する詳細と制約事項については、 自動アダプター稼働テストの制約事項に関する技術情報を参照してください。
  • VLAN ID は、個別の各クラスターで使用されるすべてのスイッチにわたって同じでなければなりません。
  • 注: 現在、 Db2 pureScale は RoCE v1のみをサポートしています。

この手順では、スイッチ・フェイルオーバーをサポートする 2 つのスイッチを構成するためのステップを詳しく説明します。 スイッチ・フェイルオーバー機能は、ネットワークの回復力 (フォールト・トレランス) に役立ちます。

複数のスイッチを使用する Db2 pureScale 環境を作成するには、 CF サーバー上に複数のクラスター相互接続があり、スイッチ上にスイッチ・フェイルオーバーを構成する必要があります。


の制約事項

  1. スイッチでの管理アクセスが必要です。

プロシージャー

  1. 2 つのスイッチを相互に接続します。
    • 各スイッチで、スイッチ間リンク (ISL) として使用するための 2 つ以上のポートを指定し、物理的に接続します。
    • すべての ISL を Link Aggregate Control Protocol (LACP) を使用して集約します。
    • 両方のスイッチのすべての ISL ポートをアクティブ・ポートとしてセットアップする必要があります。
  2. Converged Enhanced Ethernet (CEE) フィーチャーを使用不可にします。
  3. Global Pause フロー制御 (IEEE 802.3x) を使用可能にします。
    • 関係するのは、スイッチ・レベルにおける構成のみです。
    • ファームウェア・レベルが 6.5.2 以上の BNT スイッチの場合、Global Pause を使用可能にするには、フロー制御の送信と受信の両方を、ISL ポートを含めてすべての Db2 関連ポートで「オン」に設定します。
  4. 次の 2 つのスパンニング・ツリー・プロトコル (STP) 構成のいずれかを実行します。
    1. STP を使用不可にする
      • この設定によって構成全体の複雑さが軽減されます。これは、pS スイッチが pureScale ホストによる使用に制限されている専用プライベート pureScale ネットワークに適しています。
    2. STP を使用可能にする
      • これは、pureScale 以外のトラフィックが pureScale スイッチを経由する可能性がある pureScale 共有ネットワークにおいて推奨されます。 STP を使用可能にすると、意図せずにネットワーク・ループが生じるという事態を避けられます。 実際に使用するコマンドは、スイッチ製品とモデルによって異なります。 BNT スイッチの場合、次の設定が必要になります。
        • ISL 以外のすべてのポート (未使用のものを含む) をエッジ・ポートとしてマークする
        • すべてのエッジ・ポートで BPDU ガードを使用可能にする
        • すべてのエッジ・ポートで root ガードを使用可能にする
  5. V11.1.4.4 から、アダプター・ポートの有効性テストが拡張されて自動化されたために、この手順は不要になりました。 いくらかの制限があります。 制約事項については、 technote#0733765 を参照してください。

    ただし、このステップは、技術情報「 Restrictions of automated adapter 状 test」の「 Answer 」セクションにリストされている環境では必須です。この場合、拡張された単純化されたアダプターの稼働状況テストを活用することはできません。 このステップは、多層スイッチのセットアップでのネットワーク障害を検知することができるため、技術情報に記載されていない環境でも推奨されています。

    IP サポートのある RoCE ネットワークでスイッチを使用する場合、スイッチに対して ping 可能な IP アドレスを割り当てます。 スイッチに (IP インターフェースとして) 割り当てるこれらの IP アドレスは、RoCE ネットワーク上のホストで使用されている IP アドレスと同じ IP サブネット内にあります。 ホスト上の IP アドレスが同じスイッチに接続していて別々の IP サブネット内にある場合、それらのそれぞれの IP サブネットには、ホストが直接接続されるスイッチに割り当てられる、対応する IP アドレスがなければなりません。 ホスト IP アドレスのセットアップの完了後に、ホストからスイッチの IP アドレスに ping できます。

    例えば、IP アドレス 10.1.1.1 (ネットマスク 255.255.255.0) がホストの en1 ネット・インターフェースに割り当てられ、IP アドレス 10.1.2.1 がホストの en2 ネット・インターフェースに割り当てられ、それぞれが別々のスイッチに接続している場合、IP アドレス 10.1.1.24 をスイッチ 1 に割り当て、IP アドレス 10.1.2.23 をスイッチ 2 に割り当てることができます。

    2 つ目の例として、10.1.1.1 がホストの en1 に割り当てられ、10.1.3.1 が en3 に割り当てられ (ネットマスクは 255.255.255.0)、これらが同じスイッチに接続しているとします (さらに 10.1.2.1 がホストの en2 に割り当てられ、10.1.4.1 が en4 に割り当てられ、別のスイッチに接続している)。 この場合、10.1.1.24 と 10.1.3.24 の両方をスイッチ 1 に割り当て、10.1.2.23 と 10.1.4.23 の両方をスイッチ 2 に割り当てることができます。

  6. クラスター内のすべてのスイッチで上記の手順を繰り返します。

次の作業

Db2 pureScale 環境に含める予定のホストのネットワーク設定を構成します。