Les chercheurs classent la mémoire agentique de la même manière que les psychologues classent la mémoire humaine. Rédigé par une équipe de l’université de Princeton, l’article phare Cognitive Architectures for Language Agents (CoALA)1 décrit différents types de mémoire :
Mémoire à court terme
La mémoire à court terme (STM) permet à un agent IA de se souvenir des entrées récentes pour prendre des décisions immédiates. Ce type de mémoire est utile dans l’IA conversationnelle, où il est nécessaire de préserver le contexte au cours de multiples échanges.
Ainsi, un chatbot qui se souvient des messages précédents au cours d’une session peut fournir des réponses cohérentes au lieu de traiter chaque entrée utilisateur de manière isolée, ce qui améliore l’expérience utilisateur. Par exemple, ChatGPT d’OpenAI conserve l’historique des conversations au sein d’une même session, ce qui contribue à rendre les conversations plus fluides et plus contextuelles.
La mémoire à court terme est généralement mise en œuvre à l’aide d’une mémoire tampon circulaire ou d’une fenêtre contextuelle, qui contient une quantité limitée de données récentes avant d’être écrasée. Si cette approche améliore la continuité dans les interactions courtes, elle ne conserve toutefois pas les informations au-delà de la session, ce qui la rend inadaptée à la personnalisation ou à l’apprentissage à long terme.
Mémoire à long terme
La mémoire à long terme (LTM) permet aux agents IA de stocker et de récupérer des informations entre différentes sessions, les rendant ainsi plus personnalisés et plus intelligents au fil du temps.
Contrairement à la mémoire à court terme, la mémoire à long terme est conçue pour le stockage permanent. Elle est souvent mise en œuvre à l’aide de bases de données, de graphes de connaissances ou d’embeddings vectoriels. Ce type de mémoire est essentiel pour les applications d’IA qui nécessitent des connaissances historiques, telles que les assistants personnalisés et les systèmes de recommandation.
Par exemple, un agent de support client alimenté par l’IA peut se souvenir des interactions précédentes avec un utilisateur et adapter ses réponses en conséquence, améliorant ainsi l’expérience client globale.
La génération augmentée de récupération (RAG) est l’une des techniques les plus efficaces pour mettre en œuvre la mémoire à long terme. Elle consiste pour l’agent à extraire des informations pertinentes d’une base de connaissances stockée afin d’améliorer ses réponses.
Mémoire épisodique
La mémoire épisodique permet aux agents IA de se souvenir d’expériences passées spécifiques, de la même manière que les humains se souviennent d’événements individuels. Ce type de mémoire est utile pour le raisonnement basé sur des cas, où une IA apprend des événements passés afin de prendre de meilleures décisions à l’avenir.
La mémoire épisodique est souvent mise en œuvre en enregistrant les événements clés, les actions et leurs résultats dans un format structuré auquel l’agent peut accéder lorsqu’il prend des décisions.
Ainsi, un conseiller financier alimenté par l’IA peut se souvenir des choix d’investissement passés d’un utilisateur et s’appuyer sur cet historique pour lui fournir de meilleures recommandations. Ce type de mémoire est également essentiel dans la robotique et les systèmes autonomes, où un agent doit se souvenir d’actions passées pour naviguer efficacement.
Mémoire sémantique
La mémoire sémantique est chargée de stocker des connaissances factuelles structurées qu’un agent IA peut récupérer et exploiter dans son raisonnement. Contrairement à la mémoire épisodique, qui traite des événements spécifiques, la mémoire sémantique contient des informations généralisées telles que des faits, des définitions et des règles.
Les agents IA implémentent généralement la mémoire sémantique à l’aide de bases de connaissances, d’IA symbolique ou d’embeddings vectoriels, leur permettant de traiter et de récupérer efficacement les informations pertinentes. Ce type de mémoire est utilisé dans des applications concrètes qui nécessitent une expertise dans un domaine particulier, telles que les assistants juridiques basés sur l’IA, les outils de diagnostic médical et les systèmes de gestion des connaissances d’entreprise.
Par exemple, un assistant juridique alimenté par l’IA peut se servir de sa base de connaissances pour retrouver des précédents et fournir des conseils juridiques précis.
Mémoire procédurale
La mémoire procédurale des agents IA désigne la capacité à stocker et à se souvenir des compétences, des règles et des comportements appris qui permettent à un agent d’effectuer des tâches automatiquement sans avoir à raisonner explicitement à chaque fois.
Elle s’inspire de la mémoire procédurale humaine, qui permet aux individus d’effectuer des actions telles que faire du vélo ou écrire à l’ordinateur sans réfléchir consciemment à chaque étape. Dans le domaine de l’IA, la mémoire procédurale aide les agents à améliorer leur efficacité en automatisant des séquences d’actions complexes sur la base d’expériences antérieures.
Les agents IA apprennent des séquences d’actions grâce à l’entraînement, souvent à l’aide de l’apprentissage par renforcement afin d’optimiser leurs performances au fil du temps. En stockant les procédures liées aux tâches, les agents IA peuvent réduire le temps de calcul et répondre plus rapidement à des tâches spécifiques sans avoir à traiter à nouveau les données depuis le début.