Después de actualizar una instancia de Watson
OpenScale , puede restablecer el estado de las evaluaciones de modelo en curso que no se están ejecutando correctamente.
Acerca de esta tarea
Cuando completa una actualización mensual no disruptiva de una instancia de Watson
OpenScale , es posible que algunas de sus características, como las evaluaciones de modelos planificadas o bajo demanda, no funcionen correctamente. Cuando finalice la actualización, puede utilizar los pasos siguientes para restablecer el estado de las evaluaciones de modelo en curso:
Procedimiento
- Inicie sesión en Red Hat OpenShift Container Platform con el mandato siguiente:
oc login <OpenShift_URL>:<port>
- Disminuya el microservicio de Watson
OpenScale con el mandato siguiente:
instanceProjectName='cpd-instance'
instanceCRName='aiopenscale'
oc scale deployment -n ${instanceProjectName} -l "component in (aios-bias,aios-bkpi,aios-drift,aios-explainability,aios-fast,aios-feedback,aios-ml,aios-mrm,aios-notification,aios-scheduling)" --replicas=0
Si no ha instalado Cloud Pak for Data en el proyecto cpd-instance o no ha utilizado aiopenscale como nombre del recurso personalizado Watson
OpenScale , especifique valores precisos en los campos instanceProjectName y instanceCRName .
- Inicie sesión en el pod de operador con el mandato siguiente:
operatorProjectName='cpd-operator'
OPERATOR_POD_NAME=$(oc get pods -n ${operatorProjectName} | grep wos | awk {'print $1'})
oc exec --tty --stdin ${OPERATOR_POD_NAME} -n ${operatorProjectName} -- /bin/bash
Si no ha instalado el operador Watson
OpenScale en el proyecto cpd-operator , especifique valores precisos en el campo operatorProjectName .
- Establezca los valores de las variables de entorno necesarias para restablecer el estado de evaluación con el mandato siguiente:
instanceProjectName='cpd-instance'
instanceCRName='aiopenscale'
export ETCD_ENDPOINTS=https://${instanceCRName}-ibm-aios-etcd.${instanceProjectName}.svc.cluster.local:2379
export ETCD_USER=root
export ETCD_PASSWORD=`kubectl get secret ${instanceCRName}-ibm-aios-etcd-secrets -n ${instanceProjectName} -o jsonpath='{.data.etcd-root-password}' | base64 -d`
export ETCD_CACERT_BASE64=`kubectl get secret internal-tls -n ${instanceProjectName} -o jsonpath='{.data.ca\.crt}'`
export AIOS_GATEWAY_URL=https://${instanceCRName}-ibm-aios-nginx-internal.${instanceProjectName}
export AIOS_SERVICE_CREDENTIALS=<api_token>
- Vaya a la carpeta
files del operador ejecutando el mandato siguiente:
- Inicie el procedimiento de restablecimiento especificando los argumentos necesarios tal como se muestra en el ejemplo siguiente:
RESET_TIMESTAMP='2022-05-30T00:00:00.000Z'
DATA_MART_IDS='00000000-0000-0000-0000-000000000000,00000000-0000-0000-0000-1655797537073567'
./wos_restore.sh -t ${RESET_TIMESTAMP} --delta 30 -i ${DATA_MART_IDS} -p
El atributo RESET_TIMESTAMP es la indicación de fecha y hora ISO-8601 desde la que se debe restablecer el estado de las evaluaciones en curso. Debe utilizar el formato YYYY-MM-DDTHH:MM:SS.sssZ para especificar la indicación de fecha y hora.
El atributo DATA_MART_IDS es una lista separada por comas de los identificadores de despensa de datos de Watson
OpenScale de destino que permiten la restauración. El valor de un identificador de despensa de datos es el identificador de instancia de servicio de Watson
OpenScale con el prefijo 00000000-0000-0000-0000- . La instancia de servicio de Watson
OpenScale predeterminada incluye un ID de despensa de datos de 00000000-0000-0000-0000-000000000000 fijo.
Puede utilizar los mandatos siguientes para ver una lista de identificadores de instancia de servicio de Watson
OpenScale :
curl -s -k -H "Authorization: Bearer ${TOKEN}" "https://internal-nginx-svc.${instanceProjectName}.svc:12443/zen-data/v3/service_instances?addon_type=aios&fetch_all_instances=true" | jq -r '.service_instances[] | [.id, .display_name] | @tsv'
El mandato muestra la lista de nombres de instancia de servicio y pares de ID de
Watson
OpenScale tal como se muestra en el ejemplo siguiente:
1655797537073567 inst2
1655691348195375 openscale-defaultinstance
- Ejecute el mandato de salida para salir del pod del operador.
- Una vez finalizada la restauración, reinicie los pods de servicio
aios-redis y aios-configuration con los mandatos siguientes:
oc delete pod -n ${instanceProjectName} -l app.kubernetes.io/component=aios-redis
oc delete pod -n ${instanceProjectName} -l app.kubernetes.io/component=aios-configuration
- Forzar al operador Watson
OpenScale a reconciliar la instancia de Watson
OpenScale con el mandato siguiente:
oc patch WOService ${instanceCRName} -n ${instanceProjectName} --type merge --patch '{"spec": {"forceReconcile": "'$(date +%s)'"}}'
- Compruebe el estado de la conciliación de recursos personalizados de Watson OpenScale con el mandato siguiente:
oc get WOService ${instanceCRName} -n ${instanceProjectName} -o jsonpath='{.status.wosStatus} {"\n"}'
El estado del recurso personalizado cambia a Completed cuando la conciliación finaliza correctamente.