Netezza Performance Server for Cloud Pak for Data Systemの拡張
Netezza Performance Server for Cloud Pak for Data System を拡張して、より多くのデータを保存し、多数の SPU(Snippet Processing Unit)でクエリを処理する並列性を高めます。
Netezza Performance Serverによる拡張
- ハードウェア/プラットフォームの拡張
- 追加のSPUを収納する筐体を物理的に追加・接続し、これらのノードを構成する。
- ソフトウェアの拡張
- Netezza Performance Serverのシステム・トポロジー・メタデータを更新して、追加の SPU、接続された NVMe ディスク、追加のデータ・スライスの数と場所を表す。
データ再配布 - 概要
データの再分配とは、クエリを正しく処理するために、各テーブルの分散方法に基づいて、既存の行を新しいデータ・スライス・セットに分散させることである。 Netezza Performance Server 11.2.1.11 11はオフライン再配布とオンライン再配布の両方をサポートしています。 エクスパンション後の再分配方法は、この2つのどちらかを選択する。
分散キーで述べたように、 Netezza Performance Serverのクエリとワークロードのパフォーマンスは、SPUディスクに存在するデータスライス上のさまざまなテーブルの分散方法に非常に大きく影響されます。 与えられたテーブルの配布方法はランダムか ハッシュのどちらかであり、後者の方法は、ユーザーが指定した最大4つの配布キーの列のセットでテーブルの行をハッシュする。
Netezza Performance Server を拡張すると、既存の SPU ディスク上の既存のデータ・スライスはそのまま残り、新しい SPU のディスク上に新しいデータ・スライスが追加されます。 これらの新しいデータスライスの数は、1エンクロージャー(4ノード)あたり96個、または1組のエンクロージャー(8ノード)あたり192個となる。
Netezza Performance Serverを拡張する前に、テーブルの行は元のデータスライス数に分散方法とキーを使用して分散されます。 スニペット・プロセッシング・ユニット(SPU)を追加してハードウェアとソフトウェアを拡張した後、システムのデータスライス数は増加する。 しかし、各テーブルの行は元のデータスライス数に分散されている。
- オフライン
- Netezza Performance Server 11.2.1.11 より前のリリースでは、 Netezza Performance Serverの拡張は IBM サポート・エンジニアがお客様と一緒に行っていました。 拡張の前後にはいくつかのステップがあるが、核となるソフトウェアの拡張と再配布のステップは、単一のプログラム nzredrexpand に統合された。 このスタイルのデータ再配布(ソフトウェア拡張後)は、 Netezza Performance Serverがクライアント・アプリケーションから利用できない状態で実行されるため、オフラインと呼ばれます。 詳しくはオフラインデータ再配布を参照。
- オンライン
Netezza Performance Server 11.2.1.11のオンラインデータ再分配は、クライアントアプリケーションが経験する長時間のダウンタイムに対応します。 ダウンタイムは、ソフトウェア拡張後にデータへのアクセスを開放し、データの再分配を非同期で、WLM(ワークロード管理)リソースの制限を選択しながら進めることで対処する。
Netezza Performance Serverのダウンタイムが許容できる場合は、既存のオフライン再分配手法を引き続き利用できます。 ユーザーはこの時点で、ハードウェアの拡張後にオンラインで再配布を行うか、拡張後すぐに自動的にオフライン再配布を行うかを選択することができます。 詳細はデータ再配布-オンラインを参照。
- Netezza Performance Serverの構成とトポロジー情報を更新して、追加の SPU、それに接続された NVMe ディスク、追加のデータ・スライスの数と場所を表します。
- オフライン再分配を選択した場合は、 Netezza Performance Serverがまだクライアントのワークロードに使用できない間にすべてのテーブルを再分配します。