Configurazione di modelli aggiuntivi in BI di watsonx

È possibile scegliere di installare altri modelli per modificare il modo in cui la BI di watsonx gestisce determinati carichi di lavoro.

Prima di iniziare

È necessario installare il servizio BI di watsonx. Per ulteriori informazioni sulle risorse necessarie per i diversi modelli, consultare la sezione Requisiti GPU per i modelli.

Informazioni su questa attività

Gli unici modelli necessari per la BI di watsonx sono granite-3-8b-instruct e ibm-slate-30m-english-rtrvr. È possibile scegliere di aggiungere le seguenti configurazioni opzionali del modello:

ibm-slate-30m-english-rtrvr sulla GPU: Per impostazione predefinita, il ibm-slate-30m-english-rtrvr modello viene eseguito sulla CPU. Se hai carichi di lavoro elevati, puoi scegliere di eseguire il ibm-slate-30m-english-rtrvr modello sulla GPU.
OpenAI gpt-oss-120b: Il modello gpt-oss-120bOpenAI è un modello opzionale. Se desideri eseguire ragionamenti avanzati e personalizzabili in query BI complesse, puoi installare il gpt-oss-120b modello.; Patch 1 Per le attività di generazione SQL e altre funzioni basate su modelli linguistici in watsonx BI, è possibile utilizzare l' OpenAIgpt-oss-120b.

Procedura

Per installare modelli opzionali su una BI di watsonx :

Verifica quali modelli sono installati:

oc get watsonxaiifm watsonxaiifm-cr \
-n ${PROJECT_CPD_INST_OPERANDS} \
-o jsonpath="{.spec.install_model_list}"

Installa i modelli desiderati su BI di watsonx :

Esegui il ibm-slate-30m-english-rtrvr modello sulla GPU modificando la risorsa personalizzata:

oc patch watsonxaiifm watsonxaiifm-cr \
--namespace=${PROJECT_CPD_INST_OPERANDS} \
--type=merge \
--patch='{"spec":{"ibm_slate_30m_english_rtrvr_replicas": 1, "ibm_slate_30m_english_rtrvr_resources": {"limits": {"cpu": "2", "memory": "4Gi", "nvidia.com/gpu": 1}, "requests": {"cpu": "1", "memory": "4Gi", "nvidia.com/gpu": 1}}}}'

Installa il modello gpt-oss-120bOpenAI :

MODEL_LIST="${MODEL_LIST}, \"gpt-oss-120b\""

Aggiornare la risorsa watsonxaiifm personalizzata:

oc patch watsonxaiifm-cr \
-n ${PROJECT_CPD_INST_OPERANDS} \
-\-type=merge \
-\-patch="{\"spec\":{\"installed_model_list\":[${MODEL_LIST}]}}"

Verificare che i modelli siano stati aggiunti alla spec sezione della risorsa watsonxaiifm personalizzata:

oc get watsonxaiifm watsonxaiifm-cr \
-n ${PROJECT_CPD_INST_OPERANDS} \
-o jsonpath="{.spec.install_model_list}"

Cosa fare successivamente

Se hai installato il modello " gpt-oss-120bOpenAI ", selezionalo aprendo " watsonx BI ", quindi andando su "Configurazione e impostazioni" > "Impostazioni modello ".

Una volta installati e selezionati i modelli, BI di watsonx è pronto per l'uso. Per iniziare a utilizzare la BI di watsonx, consulta la guida introduttiva alla BI di watsonx.