Ilustração que representa a comunicação online, com três personagens interagindo por meio de mensagens de texto

ALTK‑Evolve: aprendizado prático para agentes de IA agora disponível para construtores

Seu agente não deveria despertar como estagiário todas as manhãs. Com o ALTK-Evolve, ele aprende na prática, uma tarefa de cada vez.

O ALTK‑Evolve é um framework prático que transforma a experiência do agente em orientação reutilizável e sob demanda. Essa abordagem melhora a confiabilidade em tarefas realistas de várias etapas (especialmente as difíceis), sem sobrecarregar o sistema com contexto e se integra sem dificuldades aos stacks de agentes populares.

A maioria dos agentes consegue reler as transcrições do dia anterior, mas eles têm dificuldade para aprender os princípios subjacentes de um domínio. Essa lacuna manifesta-se na forma de erros repetidos, comportamentos instáveis diante da mudança de inputs e transferência deficiente de aprendizados para novas situações.

A introdução do ALTK-Evolve preenche essa lacuna, extraindo insights da experiência e os transformando em orientações portáteis que os agentes podem aplicar em diversas tarefas. Em vez de repetir os registros, o sistema aprende com eles, promovendo os padrões relevantes e descartando os ruídos, de modo que cada nova execução comece um pouco mais inteligente que a anterior.

Transformando a execução em know-how reutilizável

Em sua essência, o framework converte rastros brutos de execução em conhecimento prático. Após um agente concluir uma tarefa, os rastros de interação (pensamentos, chamadas de ferramentas, resultados) são analisados em busca de regras generalizáveis, em vez de receitas isoladas. Essas regras candidatas são avaliadas quanto à frequência, impacto e confiabilidade; apenas as úteis são mantidas no longo prazo.

Quando uma nova tarefa começa, o tempo de execução recupera exatamente a orientação relevante para as ferramentas e o contexto disponíveis e a insere no momento da ação. O resultado é uma memória concisa que aguça o julgamento sem sobrecarregar o prompt.

O sistema atende às equipes onde elas estão. Você pode começar com uma configuração leve para experimentar rapidamente o fluxo de trabalho, adicionar rastreamento de baixo código aos agentes existentes no estilo ReAct quando estiver pronto para mais visibilidade ou integrá-lo profundamente ao tempo de execução personalizado para total observabilidade e controle. Seja qual for o caminho escolhido, a ênfase permanece a mesma: aprender continuamente com o trabalho real e, em seguida, aplicar essas lições precisamente quando forem importantes.

Os resultados: agentes mais confiáveis em tarefas mais difíceis

No App World, onde os agentes realizam tarefas de API realistas com várias etapas, a adição de orientação em tempo real do sistema de memória aumentou a conclusão da meta do cenário em +8,9 pontos no geral, com os maiores ganhos nas tarefas mais difíceis (+14,2). Essas melhorias refletem uma verdadeira generalização, e não a memorização: os agentes tornaram-se mais consistentes em diferentes cenários e menos instáveis quando o fluxo de controle se tornou complexo.

Existem 4 benefícios principais para o ALTK-Evolve:

  1. Esta versão foi desenvolvida para profissionais que precisam de resultados confiáveis de sistemas agênticos. Os desenvolvedores têm um caminho simples para adicionar memória sem precisar redesenhar seu stack.
  2. As equipes empresariais observam um comportamento mais estável na produção e uma visão mais clara sobre por que os agentes têm sucesso ou falham.
  3. Os pesquisadores que exploram o aprendizado contínuo obtêm um framework reproduzível para extrair, pontuar e avaliar o conhecimento operacional.
  4. Os colaboradores de código aberto têm uma base que podem expandir com novos extratores, pontuadores e estratégias de recuperação.

Experimente o ciclo de melhoria em minutos

Experimente uma configuração simplificada para vivenciar o ciclo de melhoria em minutos com seus agentes existentes, como Claude Code ou IBM Bob.

Habilite o rastreamento de baixo código em um agente no estilo ReAct para visualizar pensamentos, ações e resultados e, em seguida, sincronize os rastreamentos para gerar diretrizes práticas de melhoria.

Integre-se profundamente com tempos de execução personalizados quando precisar de observabilidade total sobre planos, chamadas de ferramentas e estados intermediários.

Explore o ALTK-Evolve

Vatche Isahagian

Senior Research Scientist

Vinod Muthusamy

Principal Research Scientist

Autores adicionais: Jayaram Radhakrishnan (Cientista de Pesquisa Sênior), Punleuk Oun (Engenheiro de Software), Gaodan Fang (Engenheiro de Software) e Gegi Thomas (STSM)