Configurazione del cluster per l'alta disponibilità in un ambiente GDPC

La procedura di configurazione descritta in questo argomento è specifica per il cluster geograficamente disperso (GDPC) Db2® pureScale® (GDPC). Questa procedura deve essere eseguita dopo la creazione dell'istanza iniziale o dopo qualsiasi operazione di riparazione o cancellazione successiva per il modello di risorsa o il dominio peer.

Informazioni preliminari

Assicurarsi di disporre della replica Spectrum Scale impostata (consultare la sezione Impostazione della replicazione IBM Spectrum Scale in un ambiente GDPC.) Se si utilizza un sistema operativo AIX su una rete RoCE , assicurarsi di aver impostato una rete RoCE .

Procedura

Aggiornamento tempo di errore di archiviazione.

Assicurarsi che nel caso di controller di archiviazione o errore del sito, venga restituito rapidamente un errore a Spectrum Scale impostando i relativi parametri del driver del dispositivo. Da notare che i parametri rilevanti differiscono per i diversi driver di dispositivi. Controllare la documentazione del controller di archiviazione o consultare un esperto di archiviazione sul sito per garantire che gli errori vengano restituiti entro 20 seconds minuti.
Ad esempio, su DS8K utilizzando il valore predefinito AIX® SDDPCM, gli aggiornamenti sono:
```
chdev -l hdiskX -a 'cntl_delay_time=20 cntl_hcheck_int=2' –P

repeat for every hdiskx 

chdev -1 fscsiY -a dyntrk=yes -a fc_err_recov=fast_fail -P

repeat for every fscsiY adapter

reboot the host

repeat chdevs for every host in the cluster
```

Verificare che gli attributi siano stati impostati correttamente su ogni computer:

root> lsattr -El fscsi0  
attach          switch     How this adapter is CONNECTED           False
dyntrk          yes        Dynamic Tracking of FC Devices          True
fc_err_recov    fast_fail  FC Fabric Event Error RECOVERY Policy   True

root> lsattr -El hdiskA1
PCM             PCM/friend/otherapdisk  Path Control Module              False
PR_key_value    none                    Persistent Reserve Key Value     True
Algorithm       fail_over               Algorithm                        True
autorecovery    no                      Path/Ownership Autorecovery      True
clr_q           no                      Device CLEARS its Queue on error True
cntl_delay_time 20                      Controller Delay Time            True
cntl_hcheck_int 2                       Controller Health Check Interval True

Aggiorna il time - out delle risorse.

A causa dei requisiti di ripristino della replica Spectrum Scale , i tempi di ripristino per alcuni errori possono essere leggermente più lunghi in un ambiente GDPC ( Db2 pureScale cluster) geograficamente disperso rispetto a un ambiente Db2 pureScale a sito singolo. Per ovviare a questo problema, è necessario modificare i valori di timeout di alcune risorse dell' IBMTivoli® System Automation for Multiplatforms. Per regolare i time - out, eseguire i seguenti comandi una volta come root su uno qualsiasi degli host presenti nel cluster:

	root> export CT_MANAGEMENT_SCOPE=2;
	# Update 2 member-specific timeouts.  For these, the resource
	# names to update will look like db2_<instance>_<member_id>-rs.
	# In this example we have members 0-4, and our instance name is
	# db2inst1:
	root> chrsrc -s "Name like 'db2_db2inst1_%-rs'" IBM.Application 		CleanupCommandTimeout=600
	root> chrsrc -s "Name like 'db2_db2inst1_%-rs'" IBM.Application 		MonitorCommandTimeout=600

	# In the next two commands, replace ‘db2inst1’ with your instance
	# owning ID
	root> chrsrc -s "Name like 'primary_db2inst1_900-rs'" 			IBM.Application CleanupCommandTimeout=600
	root> chrsrc -s "Name like 'ca_db2inst1_0-rs'" IBM.Application 		CleanupCommandTimeout=600

	# In the following commands, replace ‘db2inst1’ with your
	# instance owning ID, and repeat for each host in your cluster,
	# except the tiebreaker host T
	root> chrsrc -s "Name like 'instancehost_db2inst1_hostA1'" 			IBM.Application MonitorCommandTimeout=600
	root> chrsrc -s "Name like 'instancehost_db2inst1_hostA2'" 			IBM.Application MonitorCommandTimeout=600
	root> chrsrc -s "Name like 'instancehost_db2inst1_hostA3'" 			IBM.Application MonitorCommandTimeout=600
	root> chrsrc -s "Name like 'instancehost_db2inst1_hostB1'" 			IBM.Application MonitorCommandTimeout=600
	root> chrsrc -s "Name like 'instancehost_db2inst1_hostB2'" 			IBM.Application MonitorCommandTimeout=600
	root> chrsrc -s "Name like 'instancehost_db2inst1_hostB3'" 			IBM.Application MonitorCommandTimeout=600

	# In the last two commands, replace ‘db2inst1’ with your instance
	# owning ID, and ‘hostA3’ with the hostname of the first CF added
	# to the cluster, and ‘hostB3’ with the hostname of the second
	# CF added to the cluster.
	root> chrsrc -s "Name like 'cacontrol_db2inst1_128_hostA3'" 		IBM.Application MonitorCommandTimeout=600
	root> chrsrc -s "Name like 'cacontrol_db2inst1_129_hostB3'" 		IBM.Application MonitorCommandTimeout=600

Per mostrare i time - out aggiornati, eseguire il seguente comando come root:

lsrsrc -t IBM.Application Name MonitorCommandTimeout CleanupCommandTimeout

Per creare risorse di resilienza di rete per la gestione della rete Ethernet privata:

root> /home/db2inst1/sqllib/bin/db2cluster -cfs -repair -network_resiliency -all

Su ogni host, verificare la configurazione di resilienza della rete eseguendo:

root> /home/db2inst1/sqllib/bin/db2cluster -cfs -verify -network_resiliency 

Sample output of successful verification:
$ db2cluster -cfs -verify -network_resiliency
Successfully verified configurations on local host.

Risultati

L'ambiente GDPC è installato e configurato.

Operazioni successive

È possibile creare il database .