Estimado em cerca de US$ 5 bilhões em 2024, o mercado de agentes de IA deve crescer para cerca de US$ 50 bilhões até 2030.1 No entanto, à medida que mais empresas criam agentes de IA para simplificar e automatizar fluxos de trabalho, surgem novos desafios no monitoramento do comportamento desses agentes, garantindo que funcionem conforme o esperado. O AgentOps é um conjunto aproximado de melhores práticas emergentes na avaliação do desempenho dos agentes, que se baseia em preceitos estabelecidos nos campos relacionados de DevOps (que padronizou a entrega de software) e MLOps (que fez o mesmo para modelos de aprendizado de máquina).

Porém, gerenciar agentes não é tão simples quanto criar um software tradicional ou mesmo um modelo de IA. Os sistemas "agênticos" são complexos e dinâmicos, envolvendo essencialmente software com uma mente própria. Os agentes agem de forma autônoma, encadeiam tarefas, tomam decisões e se comportam de forma não determinística. A ideia por trás do AgentOps é trazer observabilidade e confiabilidade para um domínio que pode ser caótico, permitindo que os desenvolvedores olhem para a caixa-preta das interações e outros comportamentos dos agentes.

Não existe uma ferramenta única para gerenciar o AgentOps, mas sim um ecossistema inteiro; um estudo recente descobriu 17 ferramentas no Github e outros repositórios de código relevantes para a prática, do Agenta ao LangSmith e Trulens (uma ferramenta de AgentOps com um nome ambicioso é chamada, simplesmente, de “AgentOps”). Essas ferramentas normalmente são compatíveis com o framework de agentes preferido dos desenvolvedores, seja ele o watsonx Agents da IBM ou Agents SDK da OpenAI. Nesse espaço aquecido, surgiram muitas plataformas e frameworks populares, incluindo o AutoGen, LangChain e CrewAI (este último, otimizado para a orquestração de sistemas multiagentes).