O que é a memória de agente de IA?

Autores

Cole Stryker

Staff Editor, AI Models

IBM Think

A memória do agente de IA refere-se à capacidade de um sistema de inteligência artificial (IA) armazenar e relembrar experiências passadas para melhorar a tomada de decisão, a percepção e o desempenho geral.

Diferentemente dos modelos de IA que processam cada tarefa de forma independente, os agentes de IA com memória podem reter o contexto, reconhecer padrões ao longo do tempo e se adaptar com base nas interações passadas. Esse recurso é essencial para aplicações de IA orientadas a objetivos, onde são necessários ciclos de feedback, bases de conhecimento e aprendizado adaptativo.

A memória é um sistema que recorda algo sobre interações anteriores. Os agentes de IA não precisam necessariamente de sistemas de memória. Os agentes de reflexo simples, por exemplo, percebem informações em tempo real sobre o ambiente e atuam com base nelas ou simplesmente transmitem essas informações adiante.

Um termostato básico não precisa lembrar qual foi a temperatura de ontem. Já um “termostato inteligente” mais avançado, com memória, pode ir além da simples regulação de temperatura (liga/desliga), aprendendo padrões, adaptando-se ao comportamento do usuário e otimizando a eficiência energética. Em vez de reagir apenas à temperatura atual, ele pode armazenar e analisar dados passados para tomar decisões mais inteligentes.

Os grandes modelos de linguagem (LLMs) não podem, por si só, lembrar-se de coisas. O componente de memória deve ser adicionado. No entanto, um dos maiores desafios no design de memória de IA é otimizar a eficiência da recuperação, pois armazenar dados em excesso pode levar a tempos de resposta mais lentos.

O gerenciamento otimizado da memória ajuda a garantir que os sistemas de IA armazenem apenas as informações mais relevantes, mantendo o processamento de baixalatência para aplicações em tempo real.

As mais recentes tendências em IA, trazidas a você por especialistas

Receba insights selecionados sobre as notícias mais importantes (e intrigantes) sobre IA. Inscreva-se no nosso boletim informativo semanal Think. Consulte a Declaração de privacidade da IBM.

Agradecemos a você! Você se inscreveu.

Sua assinatura será entregue em inglês. Você encontrará um link para cancelar a assinatura em cada boletim informativo. Você pode gerenciar suas assinaturas ou cancelar a assinatura aqui. Consulte nossa Declaração de privacidade da IBM para obter mais informações.

Tipos de memória agêntica

Os pesquisadores categorizam a memória agêntica da mesma forma que os psicólogos categorizam a memória humana. O influente artigo Cognitive Architectures for Language Agents (CoALA)1 de uma equipe da Princeton University descreve os diferentes tipos de memória como:

Memória de curto prazo

A memória de curto prazo (STM) permite que um agente de IA se lembre de entradas recentes para tomada de decisão imediata. Esse tipo de memória é útil na IA conversacional, onde é necessária a manutenção do contexto em várias trocas.

Por exemplo, um chatbot que se lembra de mensagens anteriores em uma sessão pode fornecer respostas coerentes em vez de tratar cada entrada de usuário de forma isolada, melhorando a experiência do usuário. Por exemplo, o ChatGPT da OpenAI mantém o histórico de chat em uma única sessão, ajudando a garantir conversas mais suaves e conscientes do contexto.

O STM é normalmente implementado usando um buffer contínuo ou uma janela de contexto, que retém uma quantidade limitada de dados recentes antes de serem substituídos. Embora essa abordagem melhore a continuidade em interações curtas, ela não mantém informações além da sessão, tornando-a inadequada para personalização ou aprendizado a longo prazo.

Memória de longo prazo

A memória de longo prazo (LTM) permite que agentes de IA armazenem e recuperem informações entre diferentes sessões, tornando-os mais personalizados e inteligentes com o tempo.

Diferentemente da memória de curto prazo, a memória de longo prazo é projetada para armazenamento permanente, geralmente implementada por meio de bancos de dados, gráficos de conhecimento ou embeddings de vetores. Esse tipo de memória é essencial para aplicações de IA que exigem conhecimento histórico, como assistentes personalizados e sistemas de recomendação.

Por exemplo, um agente de suporte ao cliente impulsionado por IA pode lembrar interações anteriores com um usuário e personalizar as respostas adequadamente, melhorando a experiência geral do cliente.

Uma das técnicas mais eficazes para implementar memória de longo prazo é a geração aumentada de recuperação (RAG), na qual o agente busca informações relevantes de uma base de conhecimento armazenada para aprimorar suas respostas.

Memória episódica

A memória episódica permite que os agentes de IA recuperem experiências passadas específicas, semelhante à forma como os seres humanos se recordam de eventos individuais. Esse tipo de memória é útil para raciocínio baseado em casos, em que uma IA aprende com eventos passados a tomar decisões melhores no futuro.

A memória episódica geralmente é implementada registrando eventos-chave, ações e seus resultados em um formato estruturado que o agente pode acessar ao tomar decisões.

Por exemplo, um consultor financeiro impulsionado por IA pode se lembrar das escolhas de investimento anteriores de um usuário e usar esse histórico para apresentar melhores recomendações. Esse tipo de memória também é essencial em robótica e sistemas autônomos, em que um agente deve lembrar ações passadas para navegar de forma eficiente.

Memória semântica

A memória semântica é responsável por armazenar conhecimento factual estruturado que um agente de IA pode recuperar e usar para raciocinar.

Ao contrário da memória episódica, que lida com eventos específicos, a memória semântica contém informações generalizadas, como fatos, definições e regras. Agentes de IA normalmente implementam memória semântica utilizando bases de conhecimento, IA simbólica ou embeddings de vetores, permitindo que processem e recuperem informações relevantes de forma eficiente. Esse tipo de memória é usado em aplicações do mundo real que exigem conhecimento especializado, como assistentes jurídicos de IA, ferramentas de diagnóstico médico e sistemas de gerenciamento de conhecimento empresarial.

Por exemplo, um assistente jurídico de IA pode usar sua base de conhecimento para recuperar precedentes de casos e fornecer aconselhamento jurídico preciso.

Memória procedimental

A memória procedimental em agentes de IA refere-se à capacidade de armazenar e recuperar habilidades, regras e comportamentos aprendidos que permitem que um agente realize tarefas automaticamente, sem precisar de raciocínio explícito a cada vez.

Ela é inspirada na memória procedimental humana, que permite que as pessoas realizem ações como andar de bicicleta ou digitar sem pensar conscientemente em cada etapa. Na IA, a memória procedimental ajuda os agentes a melhorar a eficiência automatizando sequências complexas de ações com base em experiências anteriores.

Agentes de IA aprendem sequências de ações por meio de treinamento, muitas vezes utilizando aprendizado por reforço para otimizar o desempenho ao longo do tempo. Ao armazenar procedimentos relacionados a tarefas, os agentes podem reduzir o tempo de computação e responder mais rapidamente a tarefas específicas sem reprocessar dados a partir do zero.

Agentes de IA

Cinco tipos de agentes de IA: funções autônomas e aplicações no mundo real

Saiba como a IA orientada por objetivos e baseada em utilidade se adapta a fluxos de trabalho e ambientes complexos.

Frameworks para memória de IA agêntica

Os desenvolvedores implementam memória usando armazenamento externo, arquiteturas especializadas e mecanismos de feedback. Como os agentes de IA variam em complexidade (de agentes de reflexo simples a agentes de aprendizado avançados), a implementação da memória depende da arquitetura do agente, do caso de uso e da adaptabilidade necessária.

LangChain

Uma framework de agentes fundamental para construir agentes de IA habilitados para memória é o LangChain, que facilita a integração de memória, APIs e fluxos de trabalho de raciocínio. Ao combinar o LangChain com bancos de dados de vetores, os agentes de IA podem armazenar e recuperar com eficiência grandes volumes de interações passadas, permitindo respostas mais coerentes ao longo do tempo.

LangGraph

O LangGraph permite que os desenvolvedores construam gráficos de memória hierárquicos para agentes de IA, melhorando sua capacidade de rastrear dependências e aprender ao longo do tempo.

Ao integrar bancos de dados de vetores, os sistemas agênticos podem armazenar embeddings de interações anteriores de forma eficiente, possibilitando a recuperação contextual. Isso é útil para a geração de documentos orientada por IA, onde um agente deve lembrar das preferências do usuário e de modificações anteriores.

Outras ofertas de código aberto

A ascensão de frameworks de código aberto acelerou o desenvolvimento de agentes de IA aprimorados por memória. Plataformas como o GitHub hospedam vários repositórios que oferecem ferramentas e modelos para integrar memória a fluxos de trabalho de IA.

Além disso, aHugging Face oferece modelos treinados previamente que podem receber ajuste fino com componentes de memória para melhorar os recursos de recordação da IA. Python, uma linguagem dominante no desenvolvimento de IA, fornece bibliotecas para lidar com orquestração, mecanismos de armazenamento e recuperação de memória, tornando-se a escolha principal para a implementação de sistemas de memória de IA.

Notas de rodapé

1 "Cognitive Architectures for Language Agents," Princeton University, fevereiro de 2024.

Soluções relacionadas
Agentes de IA para empresas

Crie, implemente e gerencie assistentes e agentes de IA potentes que automatizam fluxos de trabalho e processos com a IA generativa.

    Explore o watsonx Orchestrate
    Soluções de agentes de IA da IBM

    Construa o futuro do seu negócio com soluções de IA em que você pode confiar.

    Explore soluções de agentes de IA
    Serviços de IA do IBM® Consulting

    Os serviços de IA da IBM Consulting ajudam a reinventar a forma como as empresas trabalham com IA para gerar transformação.

    Explore os serviços de inteligência artificial
    Dê o próximo passo

    Se você optar por personalizar aplicativos e habilidades criados previamente ou criar e implementar serviços agênticos personalizados usando um estúdio de IA, a plataforma IBM watsonx tem aquilo de que você precisa.

    Explore o watsonx Orchestrate Explore o watsonx.ai