Esecuzione del monitoraggio di routine dei cluster
Stabilisci un programma per monitorare le tue IBM® Software Hub implementazioni su Red Hat® OpenShift® Container Platform.
Lo stato di salute del tuo cluster può avere un impatto enorme sullo stato di salute delle tue IBM Software Hub distribuzioni.
- Chi dovrebbe svolgere questo compito?
- Amministratore del cluster Questa operazione deve essere eseguita da un amministratore del cluster.
- Con quale frequenza dovresti eseguire questa operazione?
Si consiglia di eseguire questa operazione almeno una volta al giorno o una volta per turno.
Tuttavia, se si verificano variazioni significative nel numero di utenti o attività simultanee, si consiglia di eseguire questa operazione con maggiore frequenza durante i periodi di picco.
La tua routine dovrebbe includere le seguenti attività:
- Se lo spazio di archiviazione è remoto, assicurati che la tua rete funzioni a una velocità pari o superiore a 10 Gbps.
- Esegui il playbook di convalida delle prestazioni dello storage per verificare che non vi siano problemi di prestazioni sottostanti con lo storage persistente.
- Esamina i dati di monitoraggio dalla console OpenShift
Container Platform web.Importante: assicurarsi di abilitare il monitoraggio per i progetti definiti dall'utente in cui è IBM Software Hub installato il software.
OpenShift Versione Risorse Versione 4.14 Versione 4.16 Versione 4.17 Versione 4.18 Versione 4.19 Versione 4.20 Esamina i seguenti dashboard:
- Prestazioni API
- Kubernetes / Risorse di calcolo / Cluster
- Kubernetes / Risorsa di calcolo / Nodo (Pod)
- Kubernetes / Risorse di calcolo / Spazio dei nomi (Pod)
- Controlla lo stato degli Operand Deployment Lifecycle Manager oggetti sul cluster:
- Verificare che le origini del catalogo sul cluster sianoReady:
oc get catalogsource -A \ -o jsonpath="{range .items[*]}{.metadata.name}{': '}{.status.connectionState.lastObservedState}{'\n'}{end}" - Ottieni informazioni sugli abbonamenti IBM Software Hub dell'operatore per determinare il canale e confermare che il CSV corrente sia lo stesso del CSV installato:
oc get subscription -n ${PROJECT_CPD_INST_OPERATORS} \ -o jsonpath="{range .items[*]}{.metadata.name}{' - channel: '}{.spec.channel}{', installedCSV: '}{.status.installedCSV}{', currentCSV: '}{.status.currentCSV}{'\n'}{end}" - Verificare che le distribuzioni dell'operatore siano pronte e dispongano di repliche disponibili:
oc get deploy -n ${PROJECT_CPD_INST_OPERATORS} - Controllare lo stato dei pod dell'operatore e determinare se uno dei pod è stato riavviato:
oc get pods -n ${PROJECT_CPD_INST_OPERATORS}
- Verificare che le origini del catalogo sul cluster sianoReady:
- Se è stato installato il servizio di monitoraggio privilegiato, controllare la pagina Monitoraggio > Avvisi ed eventi per gli eventi relativi al controllo dello stato di squilibrio dei nodi.
- Se l'evento di controllo dello stato di squilibrio dei nodi segnala che il cluster è sbilanciato, eseguire il descheduler per riequilibrare i nodi sul cluster. Per ulteriori informazioni, consultare la sezione Espulsione dei pod tramite il descheduler nella Red Hat
OpenShift Container Platform documentazione:
Importante: eseguire il descheduler durante una finestra di manutenzione per evitare interruzioni.