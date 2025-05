O Model Risk Evaluation Engine, agora parte do watsonx.governance, ajuda na avaliação quantitativa de riscos de modelos de base. Ele calcula métricas relacionadas a um conjunto definido de dimensões de risco do AI Risk Atlas. Ao calcular essas métricas para uma ampla seleção de modelos de base, as empresas podem escolher os modelos que atendem a seus objetivos de negócios e, ao mesmo tempo, se alinham a seu apetite ao risco.

O Model Risk Evaluation Engine aceita a avaliação de grandes modelos de linguagem do IBM watsonx.ai, bem como qualquer grande modelo de linguagem externo. Os resultados preenchidos do mecanismo de avaliação podem ser salvos no Governance Console do watsonx.governance ou exportados como um relatório PDF.

O Model Risk Evaluation Engine ajuda a realizar as seguintes tarefas:

Calcular métricas usando o watsonx.ai como mecanismo de inferência

Calcular métricas de risco para modelos de base no watsonx.ai

Calcular métricas de risco para modelos de base externos

Armazenar métricas calculadas no Governance Console (OpenPages)

Recuperar métricas calculadas do Governance Console (OpenPages)

Adicionar seus próprios riscos e conjuntos de dados

Gerar um relatório em PDF de métricas calculadas

Implementar sua própria função de pontuação para qualquer avaliação de modelo (por exemplo, função determinística ou LLM-as-a-judge)

Exibir as métricas em uma célula de bloco de notas, em um formato de tabela ou gráfico

Quando todos esses dados voltarem para o Governance Console, poderão ser usados para informar a etapa de avaliação de risco do fluxo de trabalho de integração do modelo de base descrito acima.