Ativando o watsonx Assistant para processar solicitações de API em vários clusters..

Você pode configurar o site IBM watsonx Assistant para uma implantação de vários clusters ativo-ativo, permitindo que as solicitações de API sejam processadas em vários clusters. Quando você ativa esse recurso, as instâncias do serviço watsonx Assistant têm URLs determinísticos. O termo ativo-ativo refere-se à distribuição de cargas de trabalho em vários clusters para aumentar a disponibilidade e a tolerância a falhas. No entanto, diferentemente de uma arquitetura ativo-ativo tradicional, essa implementação não garante a continuidade da sessão entre clusters e não envolve a replicação de dados. Cada cluster opera de forma independente em termos de tratamento de sessões e armazenamento de dados.

Para usar essa configuração completamente, mantenha os nomes de instância watsonx Assistant e os nomes watsonx Assistant idênticos nos clusters. watsonx Assistant name refere-se ao nome atribuído durante a criação de um watsonx Assistant em uma instância. 
O uso do mesmo nome de instância para seu watsonx Assistant garante a resolução determinística do URL, levando a IDs de ambiente e assistente idênticos em diferentes clusters. Essa consistência elimina a necessidade de especificar o nome do watsonx Assistant nas chamadas de API, pois as IDs permanecem constantes nos clusters.

Quem precisa concluir esta tarefa.

Administrador da instância Um administrador da instância pode concluir esta tarefa

Quando você precisa concluir esta tarefa?

Conclua esta tarefa se você achar que deseja que essa instância do watsonx Assistant faça parte de uma implementação de vários clusters ativos.

Deve-se concluir essa tarefa antes de provisionar instâncias de serviço do watsonx Assistant .

Não é possível aplicar essa configuração depois de criar as instâncias de serviço

Importante: conclua esta tarefa em todos os clusters que você deseja incluir na implementação de vários clusters ativos.

Antes de iniciar

Gere um identificador exclusivo universal (UUID) versão 4 e configure a variável de ambiente ACTIVE_ACTIVE_SEED para o UUID:

Linux®
export ACTIVE_ACTIVE_SEED=$(uuidgen -r)
Mac OS
export ACTIVE_ACTIVE_SEED=$(uuidgen)
Windows Subsystem for Linux
export ACTIVE_ACTIVE_SEED=$(uuidgen -r)
Importante: deve-se usar o mesmo UUID para todos os clusters que participam da topologia de implementação ativa-ativa

Sobre esta tarefa

Para ativar uma topologia de implementação de vários clusters ativo / ativo, deve-se editar o recurso customizado watsonx Assistant para:
  • Ativar modo ativo-ativo
  • Especifique o identificador exclusivo universal (UUID) da Versão 4 que deseja usar

Procedimento

Conclua as etapas a seguir em ambos os clusters nos quais você deseja ativar o modo ativo-ativo para watsonx Assistant:

  1. Efetue login no Red Hat® OpenShift® Container Platform como um usuário com permissões suficientes para concluir a tarefa.
    ${OC_LOGIN}
    Lembre-se: OC_LOGIN é um alias para o comando oc login .
  2. Configure o ASSISTANT_CR para o nome do recurso customizado watsonx Assistant :
    export ASSISTANT_CR=$(oc get wa -n=${PROJECT_CPD_INST_OPERANDS} | grep -v NAME | awk '{print $1}')
  3. Corrigir o recurso customizado para ativar o modo ativo / ativo e especificar o UUID:
    oc patch wa ${ASSISTANT_CR} \ --namespace=${PROJECT_CPD_INST_OPERANDS} \ --type=merge \ --patch="{ \ \"configOverrides\":{ \ \"store\":{ \ \"extra_vars\":{ \ \"store\":{ \ \"ACTIVE_ACTIVE_ENABLED\":\"true\", \ \"ACTIVE_ACTIVE_SEED\":\"${ACTIVE_ACTIVE_SEED}\"}}}}}

    Ao executar esse comando, os pods ${ASSISTANT_CR}-store são reiniciados automaticamente.

  4. Aguarde que o recurso customizado esteja pronto e estável antes de criar quaisquer instâncias de serviço.
    Para verificar o status do recurso customizado, execute o comando a seguir:
    oc get wa --namespace=${PROJECT_CPD_INST_OPERANDS}
    A resposta tem o seguinte formato:
    NAME  VERSION   READY   READYREASON   UPDATING   UPDATINGREASON   DEPLOYED   VERIFIED   QUIESCE        AGE
    wa    5.1.0     True    Stable        False      Stable           19/19      19/19      NOT_QUIESCED   25h

    Assegure-se de que READY seja True e que READYREASON e UPDATINGREASON sejam Stable.