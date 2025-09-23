Outra inovação da equipe da IBM é o "Evaluation Studio". Essa funcionalidade oferece dois recursos principais:

Otimização de prompts comparando diferentes versões dos prompts lado a lado e Rastreamento de experimentações para agentes

O Evaluation Studio ajuda os desenvolvedores a avaliar diferentes versões do prompt em um conjunto de dados e comparar os resultados em uma interface de usuário intuitiva. Ele também é compatível com uma classificação personalizada exclusiva, na qual os usuários podem criar um esquema de classificação personalizado, selecionando métricas e atribuindo a elas pesos com base na importância. Isso ajuda os usuários a otimizar facilmente um prompt que será usado em uma ferramenta ou agente.

O Evaluation Studio do watsonx.governance também é compatível com o rastreamento de experimentos, que é uma ferramenta poderosa para a criação de sistemas de IA agêntica melhores. Você pode configurar experimentos rapidamente, testar variantes diferentes (do agente) e marcá-los com detalhes como o modelo, recuperação ou prompt que você usou. Comparações lado a lado baseadas em latência, custo e qualidade (como fidelidade) facilitam ver o que funciona melhor. É importante ressaltar que a plataforma ajuda você a salvar o código exato para cada execução, liberando o tempo dos desenvolvedores de armazenar cada versão e permitindo que eles se concentrem na criação e no aprimoramento do agente.