Entre as causas de comportamentos inadequados de agentes de IA está a falta de instruções específicas por parte do usuário ou uma má interpretação das instruções do usuário pelo agente. Esses “mal-entendidos” podem fazer com que os agentes escolham as ferramentas erradas ou as usem de maneiras inadequadas ou prejudiciais, o que é conhecido como uma alucinação de chamada de função.

Felizmente, melhorar a chamada de função se tornou um esforço competitivo, com a criação de vários benchmarks para medir a eficácia da chamada de APIs por LLMs. Entre as melhorias mais recentes está uma nova funcionalidade na última versão do IBM Granite Guardian, Granite Guardian 3.1, parte da família de modelos de linguagem Granite da IBM, projetados especificamente para empresas. O modelo pode detectar alucinações de chamada de função por agentes antes que consequências indesejadas ocorram. “O detector verifica todos os tipos de erros, desde a descrição em linguagem humana até a função chamada,” explica Varshney.