Restablecimiento del estado de las evaluaciones de modelo de Watson OpenScale en curso

Después de actualizar una instancia de Watson OpenScale , puede restablecer el estado de las evaluaciones de modelo en curso que no se están ejecutando correctamente.

Antes de empezar

Debe obtener una clave de API. Para obtener más información, consulte Generación de una señal de autorización de API.

Acerca de esta tarea

Cuando completa una actualización mensual no disruptiva de una instancia de Watson OpenScale , es posible que algunas de sus características, como las evaluaciones de modelos planificadas o bajo demanda, no funcionen correctamente. Cuando finalice la actualización, puede utilizar los pasos siguientes para restablecer el estado de las evaluaciones de modelo en curso:

Procedimiento

  1. Inicie sesión en Red Hat OpenShift Container Platform con el mandato siguiente:
    oc login <OpenShift_URL>:<port>
  2. Disminuya el microservicio de Watson OpenScale con el mandato siguiente:
    instanceProjectName='cpd-instance'
    instanceCRName='aiopenscale'
    
    oc scale deployment -n ${instanceProjectName} -l "component in (aios-bias,aios-bkpi,aios-drift,aios-explainability,aios-fast,aios-feedback,aios-ml,aios-mrm,aios-notification,aios-scheduling)" --replicas=0
    

    Si no ha instalado Cloud Pak for Data en el proyecto cpd-instance o no ha utilizado aiopenscale como nombre del recurso personalizado Watson OpenScale , especifique valores precisos en los campos instanceProjectName y instanceCRName .

  3. Inicie sesión en el pod de operador con el mandato siguiente:
    operatorProjectName='cpd-operator'
    OPERATOR_POD_NAME=$(oc get pods -n ${operatorProjectName} | grep wos | awk {'print $1'})
    oc exec --tty --stdin ${OPERATOR_POD_NAME} -n ${operatorProjectName} -- /bin/bash
    

    Si no ha instalado el operador Watson OpenScale en el proyecto cpd-operator , especifique valores precisos en el campo operatorProjectName .

  4. Establezca los valores de las variables de entorno necesarias para restablecer el estado de evaluación con el mandato siguiente:
    instanceProjectName='cpd-instance'
    instanceCRName='aiopenscale'
    
    export ETCD_ENDPOINTS=https://${instanceCRName}-ibm-aios-etcd.${instanceProjectName}.svc.cluster.local:2379
    export ETCD_USER=root
    export ETCD_PASSWORD=`kubectl get secret ${instanceCRName}-ibm-aios-etcd-secrets -n ${instanceProjectName} -o jsonpath='{.data.etcd-root-password}' | base64 -d`
    
    export ETCD_CACERT_BASE64=`kubectl get secret internal-tls -n ${instanceProjectName} -o jsonpath='{.data.ca\.crt}'`
    
    export AIOS_GATEWAY_URL=https://${instanceCRName}-ibm-aios-nginx-internal.${instanceProjectName}
    export AIOS_SERVICE_CREDENTIALS=<api_token>
    
    
  5. Vaya a la carpeta files del operador ejecutando el mandato siguiente:
    cd roles/service/files
    
  6. Inicie el procedimiento de restablecimiento especificando los argumentos necesarios tal como se muestra en el ejemplo siguiente:
    RESET_TIMESTAMP='2022-05-30T00:00:00.000Z'
    DATA_MART_IDS='00000000-0000-0000-0000-000000000000,00000000-0000-0000-0000-1655797537073567'
    ./wos_restore.sh -t ${RESET_TIMESTAMP} --delta 30 -i ${DATA_MART_IDS} -p
    

    El atributo RESET_TIMESTAMP es la indicación de fecha y hora ISO-8601 desde la que se debe restablecer el estado de las evaluaciones en curso. Debe utilizar el formato YYYY-MM-DDTHH:MM:SS.sssZ para especificar la indicación de fecha y hora.

    El atributo DATA_MART_IDS es una lista separada por comas de los identificadores de despensa de datos de Watson OpenScale de destino que permiten la restauración. El valor de un identificador de despensa de datos es el identificador de instancia de servicio de Watson OpenScale con el prefijo 00000000-0000-0000-0000- . La instancia de servicio de Watson OpenScale predeterminada incluye un ID de despensa de datos de 00000000-0000-0000-0000-000000000000 fijo.

    Puede utilizar los mandatos siguientes para ver una lista de identificadores de instancia de servicio de Watson OpenScale :

    curl -s -k -H "Authorization: Bearer ${TOKEN}" "https://internal-nginx-svc.${instanceProjectName}.svc:12443/zen-data/v3/service_instances?addon_type=aios&fetch_all_instances=true" | jq -r '.service_instances[] | [.id, .display_name] | @tsv'
    
    Nota: Para ejecutar este script, debe generar y exportar la señal como la variable de entorno ${MY_TOKEN} . Para obtener detalles, consulte Generación de una señal de autorización de API.
    El mandato muestra la lista de nombres de instancia de servicio y pares de ID de Watson OpenScale tal como se muestra en el ejemplo siguiente:
    1655797537073567	inst2
    1655691348195375	openscale-defaultinstance
    
  7. Ejecute el mandato de salida para salir del pod del operador.
  8. Una vez finalizada la restauración, reinicie los pods de servicio aios-redis y aios-configuration con los mandatos siguientes:
    oc delete pod -n ${instanceProjectName} -l app.kubernetes.io/component=aios-redis
    oc delete pod -n ${instanceProjectName} -l app.kubernetes.io/component=aios-configuration
    
  9. Forzar al operador Watson OpenScale a reconciliar la instancia de Watson OpenScale con el mandato siguiente:
    oc patch WOService ${instanceCRName} -n ${instanceProjectName} --type merge --patch '{"spec": {"forceReconcile": "'$(date +%s)'"}}'
    
  10. Compruebe el estado de la conciliación de recursos personalizados de Watson OpenScale con el mandato siguiente:
    oc get WOService ${instanceCRName} -n ${instanceProjectName} -o jsonpath='{.status.wosStatus} {"\n"}'
    

    El estado del recurso personalizado cambia a Completed cuando la conciliación finaliza correctamente.