Ridistribuzione dei dati

Opzioni di distribuzione: Netezza Performance Server per Cloud Pak for Data System

Dopo l'espansione della piattaforma e del software, se si è scelta la ridistribuzione online delle tabelle, è ora possibile eseguirla con il comando nz_redistribute.

Ridistribuzione dei dati offline

Dopo la fase di espansione della topologia, le fette di dati appena aggiunte sono vuote. nzredrexpand avvia la ridistribuzione dei dati della tabella sull'insieme aumentato di fette di dati. L'accesso al database Netezza Performance Server non è disponibile durante questo processo.

Il processo di ridistribuzione richiede una piccola quantità di spazio su ogni slice di dati; è necessario solo circa l'1% dello spazio libero. Lo strumento di ridistribuzione convalida che ogni slice abbia la quantità di spazio libero necessaria prima di avviare la ridistribuzione.

Il lavoro di ridistribuzione esegue un test a campione per stimare il tasso di distribuzione. Quindi identifica le dimensioni di tutte le tabelle esistenti nel sistema. Con queste informazioni, il lavoro di ridistribuzione stima il tempo totale per la ridistribuzione.

Il lavoro di ridistribuzione itera su ogni tabella del sistema, ridistribuendo ogni tabella a turno. La ridistribuzione viene eseguita in modo incrementale, pochi estensioni alla volta. Il processo garantisce l'assenza di perdita o duplicazione di estensioni, anche in caso di interruzioni o guasti hardware.

Il piano di esecuzione della ridistribuzione per ogni tabella consiste nella scansione della tabella e nella ridistribuzione dei record in base alla chiave di distribuzione della tabella, con le chiavi di distribuzione rielaborate, in base al nuovo numero di fette di dati. Le tabelle che vengono distribuite in modo casuale sono round-robin e vengono distribuite tra le nuove fette di dati. La modalità di distribuzione casuale chunked viene riconosciuta quando è abilitata.

La fase di ridistribuzione può essere riavviata se viene interrotta per qualsiasi motivo eseguendo nzredrexpand --resume. Tuttavia, finché la ridistribuzione non è completa, il sistema non è disponibile per le interrogazioni degli utenti. Una volta avviata, la ridistribuzione deve essere eseguita fino al completamento e ripresa se interrotta. Non è possibile tornare al vecchio numero di fette di dati all'avvio del processo.

Al termine del processo di espansione, tutti i backup dell'host eseguiti prima dell'espansione sono inutili.

Ridistribuzione dei dati online

La ridistribuzione dei dati online risolve il problema dell'interruzione potenzialmente lunga delle applicazioni client, aprendo l'accesso ai dati dopo l'espansione del software e consentendo la ridistribuzione dei dati e con limiti di risorse WLM (workload management) a scelta dell'utente.