Esecuzione del monitoraggio di routine dei cluster

Stabilisci un programma per monitorare le tue IBM® Software Hub implementazioni su Red Hat® OpenShift® Container Platform.

Lo stato di salute del tuo cluster può avere un impatto enorme sullo stato di salute delle tue IBM Software Hub distribuzioni.

Chi dovrebbe svolgere questo compito?
Amministratore del cluster Questa operazione deve essere eseguita da un amministratore del cluster.
Con quale frequenza dovresti eseguire questa operazione?

Si consiglia di eseguire questa operazione almeno una volta al giorno o una volta per turno.

Tuttavia, se si verificano variazioni significative nel numero di utenti o attività simultanee, si consiglia di eseguire questa operazione con maggiore frequenza durante i periodi di picco.

La tua routine dovrebbe includere le seguenti attività:

  1. Se lo spazio di archiviazione è remoto, assicurati che la tua rete funzioni a una velocità pari o superiore a 10 Gbps.
  2. Esegui il playbook di convalida delle prestazioni dello storage per verificare che non vi siano problemi di prestazioni sottostanti con lo storage persistente.
  3. Esamina i dati di monitoraggio dalla console OpenShift Container Platform web.
    Importante: assicurarsi di abilitare il monitoraggio per i progetti definiti dall'utente in cui è IBM Software Hub installato il software.
    OpenShift Versione Risorse
    Versione 4.14
    Versione 4.16
    Versione 4.17
    Versione 4.18
    Versione 4.19
    Versione 4.20

    Esamina i seguenti dashboard:

    • Prestazioni API
    • Kubernetes / Risorse di calcolo / Cluster
    • Kubernetes / Risorsa di calcolo / Nodo (Pod)
    • Kubernetes / Risorse di calcolo / Spazio dei nomi (Pod)
  4. Controlla lo stato degli Operand Deployment Lifecycle Manager oggetti sul cluster:
    1. Verificare che le origini del catalogo sul cluster sianoReady:
      oc get catalogsource -A \
      -o jsonpath="{range .items[*]}{.metadata.name}{': '}{.status.connectionState.lastObservedState}{'\n'}{end}"
    2. Ottieni informazioni sugli abbonamenti IBM Software Hub dell'operatore per determinare il canale e confermare che il CSV corrente sia lo stesso del CSV installato:
      oc get subscription -n ${PROJECT_CPD_INST_OPERATORS} \
      -o jsonpath="{range .items[*]}{.metadata.name}{' - channel: '}{.spec.channel}{', installedCSV: '}{.status.installedCSV}{', currentCSV: '}{.status.currentCSV}{'\n'}{end}"
    3. Verificare che le distribuzioni dell'operatore siano pronte e dispongano di repliche disponibili:
      oc get deploy -n ${PROJECT_CPD_INST_OPERATORS}
    4. Controllare lo stato dei pod dell'operatore e determinare se uno dei pod è stato riavviato:
      oc get pods -n ${PROJECT_CPD_INST_OPERATORS}
  5. Se è stato installato il servizio di monitoraggio privilegiato, controllare la pagina Monitoraggio > Avvisi ed eventi per gli eventi relativi al controllo dello stato di squilibrio dei nodi.
  6. Se l'evento di controllo dello stato di squilibrio dei nodi segnala che il cluster è sbilanciato, eseguire il descheduler per riequilibrare i nodi sul cluster. Per ulteriori informazioni, consultare la sezione Espulsione dei pod tramite il descheduler nella Red Hat OpenShift Container Platform documentazione:
    Importante: eseguire il descheduler durante una finestra di manutenzione per evitare interruzioni.