Espansione di Netezza Performance Server for Cloud Pak for Data System

Opzioni di distribuzione: Netezza Performance Server per Cloud Pak for Data System

Espandete il vostro Netezza Performance Server for Cloud Pak for Data System per archiviare più dati e supportare un maggiore parallelismo per l'elaborazione delle query su molte SPU (Snippet Processing Unit).

Espansione con Netezza Performance Server

L'espansione di un Cloud Pak for Data System con Netezza Performance Server si articola in due parti principali:
Espansione hardware/piattaforma
Aggiungere e collegare fisicamente gli alloggiamenti che contengono SPU aggiuntive e configurare questi nodi.
Espansione del software
Aggiornamento dei metadati della topologia del sistema Netezza Performance Server per rappresentare le SPU aggiuntive, i relativi dischi NVMe collegati e il numero e la posizione delle fette di dati aggiuntive.

Ridistribuzione dei dati - Panoramica

La ridistribuzione dei dati è il processo che consiste nel prendere le righe esistenti e distribuirle sul nuovo insieme di fette di dati in base al metodo di distribuzione di ciascuna tabella per una corretta elaborazione delle query. Netezza Performance Server 11.2.1.11 supporta la ridistribuzione sia offline che online. Scegliere uno dei due metodi di ridistribuzione dopo l'espansione.

Come indicato nelle chiavi di distribuzione, le prestazioni delle query e dei carichi di lavoro su Netezza Performance Server sono in gran parte influenzate dai metodi di distribuzione delle varie tabelle sulle fette di dati che risiedono sui dischi SPU. Il metodo di distribuzione per una determinata tabella è casuale o hash, con quest'ultimo metodo che esegue l'hashing delle righe della tabella su un insieme di fino a quattro colonne di chiavi di distribuzione specificate dall'utente.

Quando Netezza Performance Server viene espanso, le fette di dati attualmente presenti sui dischi delle SPU esistenti rimarranno al loro posto, mentre le nuove fette di dati verranno aggiunte sui dischi delle nuove SPU. Il numero di queste nuove fette di dati sarà di 96 per alloggiamento (4 nodi) o 192 per coppia di alloggiamenti (8 nodi).

Prima dell'espansione, le righe della tabella vengono distribuite utilizzando i metodi e le chiavi di distribuzione sul numero originale di fette di dati prima di espandere un sistema Netezza Performance Server. Dopo l'espansione hardware e software con ulteriori Snippet Processing Unit (SPU), il sistema avrà un numero maggiore di fette di dati. Ma le righe di ogni tabella sono distribuite sul numero originale di fette di dati.

Netezza Performance Server versione 11.2.1.11 supporta due metodi di ridistribuzione dei dati dopo l'espansione:
Non in linea
Nelle versioni di Netezza Performance Server precedenti alla 11.2.1.11, l'espansione di Netezza Performance Server veniva eseguita da un tecnico dell'assistenza IBM in collaborazione con il cliente. Ci sono alcune fasi precedenti e successive all'espansione, ma le fasi principali di espansione e ridistribuzione del software sono state integrate in un unico programma nzredrexpand. Questo tipo di ridistribuzione dei dati (dopo l'espansione del software) è definito offline, poiché viene eseguito mentre Netezza Performance Server non è disponibile per le applicazioni client. Per ulteriori informazioni, vedere Ridistribuzione dei dati offline.
In linea

La ridistribuzione dei dati online in Netezza Performance Server 11.2.1.11 risolve il problema dei tempi di inattività prolungati delle applicazioni client. I tempi di inattività vengono affrontati aprendo l'accesso ai dati dopo l'espansione del software e consentendo la ridistribuzione dei dati in modo asincrono in orari e con limiti di risorse WLM (workload management) a scelta.

L'attuale approccio di ridistribuzione offline continua a essere disponibile, nei casi in cui il tempo di inattività previsto per Netezza Performance Server è accettabile. A questo punto l'utente può scegliere l'espansione, se eseguire personalmente la ridistribuzione online dopo l'espansione dell'hardware o se procedere alla ridistribuzione offline automaticamente e immediatamente dopo l'espansione. Per i dettagli, vedere Ridistribuzione dei dati - Online.

Dopo aver scelto un metodo di ridistribuzione e dopo che i nuovi alloggiamenti Cloud Pak for Data System sono stati fisicamente installati e collegati, verrà eseguita l'espansione della piattaforma Cloud Pak for Data System e l'espansione del software Netezza Performance Server. Platform Expansion fornirà i nuovi nodi hardware Cloud Pak for Data System nei nuovi alloggiamenti come nodi Netezza Performance Server "SPU". L'espansione del software:
  • Aggiornare le informazioni di configurazione e topologia Netezza Performance Server per rappresentare le SPU aggiuntive, i relativi dischi NVMe collegati e il numero e la posizione delle fette di dati aggiuntive.
  • Opzionalmente, se si è scelta la ridistribuzione offline, ridistribuire tutte le tabelle mentre Netezza Performance Server non è ancora disponibile per i carichi di lavoro dei client.