Erweiterung des Netezza Performance Server für Cloud Pak for Data System

Bereitstellungsoptionen: Netezza Performance Server für Cloud Pak for Data System

Erweitern Sie Ihren Netezza Performance Server für Cloud Pak for Data System, um mehr Daten zu speichern und eine höhere Parallelität bei der Verarbeitung von Abfragen über viele SPUs (Snippet Processing Units) zu unterstützen.

Erweiterung mit Netezza Performance Server

Die Erweiterung eines Cloud Pak for Data System mit Netezza Performance Server besteht aus zwei Hauptteilen:
Hardware/Plattform-Erweiterung
Physisches Hinzufügen und Verbinden von Gehäusen, die zusätzliche SPUs enthalten, und Konfigurieren dieser Knotenpunkte.
Erweiterung der Software
Aktualisierung der Netezza Performance Server, um die zusätzlichen SPUs, ihre angeschlossenen NVMe-Festplatten sowie die Anzahl und den Standort der zusätzlichen Daten-Slices darzustellen.

Umverteilung von Daten - Überblick

Bei der Neuverteilung der Daten werden die vorhandenen Zeilen auf der Grundlage der Verteilungsmethode der einzelnen Tabellen auf den neuen Satz von Datenscheiben verteilt, um eine korrekte Abfrageverarbeitung zu ermöglichen. Netezza Performance Server 11.2.1.11 unterstützt sowohl die Offline- als auch die Online-Weiterverteilung. Wählen Sie nach der Expansion eine dieser beiden Umverteilungsmethoden.

Wie in den Verteilungsschlüsseln erwähnt, wird die Leistung von Abfragen und Workloads auf dem Netezza Performance Server in hohem Maße von den Verteilungsmethoden für verschiedene Tabellen über die Daten-Slices auf den SPU-Platten beeinflusst. Die Verteilungsmethode für eine gegebene Tabelle ist entweder zufällig oder Hash, wobei die letztere Methode Tabellenzeilen auf einen Satz von bis zu vier benutzerdefinierten Verteilungsschlüsselspalten hasht.

Wenn der Netezza Performance Server erweitert wird, bleiben die vorhandenen Daten-Slices auf den vorhandenen SPU-Festplatten erhalten, und neue Daten-Slices werden auf den Festplatten der neuen SPUs hinzugefügt. Die Anzahl dieser neuen Daten-Slices beträgt 96 pro Gehäuse (4 Knoten) oder 192 pro Gehäusepaar (8 Knoten).

Vor der Erweiterung werden die Tabellenzeilen mit ihren Verteilungsmethoden und Schlüsseln über die ursprüngliche Anzahl von Datenscheiben verteilt, bevor ein Netezza Performance Server erweitert wird. Nach der Hardware- und Softwareerweiterung mit zusätzlichen Snippet Processing Units (SPU) wird das System über eine größere Anzahl von Datenscheiben verfügen. Die Zeilen jeder Tabelle sind jedoch auf die ursprüngliche Anzahl von Datenscheiben verteilt.

Netezza Performance Server Version 11.2.1.11 unterstützt zwei Methoden der Datenumverteilung nach der Expansion:
Offline
Bei Netezza Performance Server vor 11.2.1.11 wurde die Netezza Performance Server von einem IBM Support-Techniker in Zusammenarbeit mit dem Kunden durchgeführt. Es gibt einige Schritte vor und nach der Erweiterung, aber die Kernschritte der Software-Erweiterung und -Verteilung wurden in ein einziges Programm nzredrexpand integriert. Diese Art der Datenumverteilung (nach der Software-Erweiterung) wird als offline bezeichnet, da sie durchgeführt wird, während der Netezza Performance Server für Client-Anwendungen nicht verfügbar ist. Einzelheiten finden Sie unter Offline-Datenweitergabe.
Online

Die Online-Datenumverteilung in Netezza Performance Server 11.2.1.11 behebt die verlängerte Ausfallzeit von Client-Anwendungen. Die Ausfallzeit wird dadurch behoben, dass der Zugriff auf die Daten nach der Softwareerweiterung geöffnet wird und die Datenumverteilung zeitweise asynchron und mit WLM-Ressourcenlimits (Workload Management) Ihrer Wahl erfolgen kann.

Der bestehende Offline-Umverteilungsansatz ist weiterhin verfügbar, wenn die zu erwartende Ausfallzeit des Netezza Performance Server akzeptabel ist. Der Benutzer kann an dieser Stelle wählen, ob er nach der Hardware-Erweiterung selbst eine Online-Umverteilung durchführen möchte oder ob er die Offline-Umverteilung automatisch und unmittelbar nach der Erweiterung durchführen lassen möchte. Einzelheiten finden Sie unter Datenweitergabe - Online.

Nachdem Sie sich für eine Umverteilungsmethode entschieden haben und nachdem die neuen Cloud Pak for Data System Enclosures physisch installiert und angeschlossen wurden, werden die Cloud Pak for Data System Platform Expansion und Netezza Performance Server Software Expansion durchgeführt. Platform Expansion wird die neuen Cloud Pak for Data System in den neuen Gehäusen als Netezza Performance Server "SPU"-Knoten bereitstellen. Software-Erweiterung wird:
  • Aktualisieren Sie die Konfigurations- und Topologieinformationen Netezza Performance Server, um die zusätzlichen SPUs, die angeschlossenen NVMe-Laufwerke sowie die Anzahl und Position der zusätzlichen Daten-Slices darzustellen.
  • Wenn Sie die Offline-Umverteilung gewählt haben, können Sie optional alle Tabellen umverteilen, während der Netezza Performance Server noch nicht für Client-Workloads verfügbar ist.