Pendant plus d'un siècle, les neurosciences ont présenté un récit simple sur la mémoire. Les neurones déclenchent, ils se connectent et, dans ces connexions, appelées synapses, les mémoires sont formées. Les neurones étaient considérés comme les moteurs de la pensée, et l'on pensait que la mémoire résidait dans la force de leur câblage. Mais un nouveau modèle élaboré par des chercheurs d'IBM suggère que cette vision pourrait être incomplète. Elle soulève également la possibilité que la biologie qui sous-tend la mémoire humaine puisse aider à guider le développement de la nouvelle génération d'intelligence artificielle.
Cette théorie place les astrocytes, des cellules gliales non neuronales qui constituent environ la moitié du cerveau, au centre d'un système de mémoire jusqu'alors méconnu. Longtemps considérés comme des cellules de soutien passives, les astrocytes pourraient jouer un rôle actif dans le stockage et la récupération des informations. Le modèle décrit une forme de mémoire associative qui partage des fonctionnalités principales avec des systèmes d'IA avancés, dont Transformers.
« Il existe une montagne de preuves montrant que les astrocytes sont impliqués dans la cognition », a déclaré Leo Kozachkov, chercheur chez IBM et co-auteur d’un article récent sur la théorie, à IBM Think lors d’une interview. « Nous nous demandions s’ils pouvaient mettre en œuvre des systèmes de mémoire puissants, et tout s’est avéré oui. »
Ce modèle s'appuie sur une longue histoire de recherches en neurosciences sur la « synapse tripartite », où un astrocyte enveloppe la connexion entre deux neurones. Dans la formulation de l'équipe d'IBM, les astrocytes ne sont pas des observateurs passifs. Au contraire, ils participent au traitement et à la distribution de l’information dans le cerveau d’une manière qui rappelle les capacités de gestion de la mémoire de certains des systèmes d’IA les plus sophistiqués utilisés aujourd’hui.
La recherche de l'emplacement de la mémoire dans le cerveau a défini les neurosciences pendant des décennies. Le modèle dominant a attribué la plasticité synaptique, le renforcement ou l'affaiblissement des connexions entre les neurones, comme substrat de la mémoire. Cette idée sous-tend à la fois les théories biologiques et de nombreuses hypothèses fondamentales de l'intelligence artificielle.
Mais la réalité est plus compliquée. Des études expérimentales ont montré que les astrocytes modulent la force synaptique , répondent aux neurotransmetteurs et neuromodulateurs, et semblent jouer un rôle dans la formation et la récupération de mémoires à long terme. Ces résultats ne s'inscrivent pas toujours parfaitement dans les modèles informatiques standard, et leurs implications restent difficiles à intégrer dans un cadre des exigences cohérent.
C’est dans ce contexte que s’inscrit le modèle de l’équipe IBM. Il propose un système dans lequel neurones, synapses et processus astrocytaires interagissent via un réseau dynamique partagé. Chaque élément est régi par des équations dérivées de principes mathématiques basés sur l'énergie. Le système résultant évolue vers des états attractives stables qui correspondent aux mémoires stockées.
L’idée centrale est que les astrocytes peuvent augmenter la capacité mémoire du système. Leurs réseaux internes de signalisation calcique permettent l’intégration et la propagation de l’information à travers de vastes régions spatiales. Cette architecture supporte un type de stockage mémoire plus distribué et flexible que ce qui est possible dans les réseaux uniquement neuronaux.
M. Kozachkov a expliqué comment l'idée est née. « Nous avons d'abord écouté des neuroscientifiques expérimentaux qui étudient les astrocytes », a-t-il déclaré. « Ils disposent d’une quantité toujours croissante de preuves suggérant que les astrocytes sont impliqués dans la cognition, la mémoire et le comportement. » Mais il n'existe qu'un petit ensemble de théories formelles spécifiques sur la façon dont les neurones et les astrocytes calculent ensemble. »
Il y avait également un aspect informatique. L’équipe travaillait avec la Dense Associative Memory, un type avancé de réseau qui s’appuie sur et étend le modèle original de Hopfield. Ces systèmes sont réputés pour leur capacité mémoire robuste et leurs capacités exceptionnelles de récupération de motifs.
« Malheureusement, ce que ces réseaux de mémoire associative dense gagnent en capacité de mémoire, ils en perdent en plausibilité biologique », explique M. Kozachkov. « Nous nous sommes donc naturellement demandé si ces réseaux pouvaient être mis en œuvre sur du matériel biologique. »
Lorsque l'équipe a commencé à réfléchir à la mise en œuvre biologique, les astrocytes sont rapidement apparus comme le candidat le plus probable. Leur structure anatomique, leur organisation spatiale et leur dynamique biochimique laissaient toutes présager un rôle potentiel dans la mémoire.
Selon la manière dont le système est réglé, le modèle peut se comporter comme une mémoire associative dense ou adopter les caractéristiques d'un transformateur. Cette flexibilité lui permet d'être plus qu'une simple comparaison avec l'IA. Elle propose une approche pratique pour examiner comment le cerveau et les systèmes modernes de machine learning pourraient résoudre des problèmes similaires.
« Si notre théorie est correcte, ne serait-ce que du point de vue conceptuel, elle a de profondes implications sur la façon dont nous Think à la mémoire dans le cerveau », a déclaré M. Kozachkov. « Notre théorie suggère que les souvenirs peuvent être codés par les voies de signalisation intracellulaires d'un seul astrocyte. Les poids synaptiques résultent des interactions au sein de ces voies, ainsi que des interactions entre les astrocytes et les synapses. »
Les implications de cette théorie pour l'IA sont tout aussi provocatrices. Les systèmes de machine learning actuels ont du mal à gérer la mémoire. Les Neural networks ont une capacité limitée à conserver l’information à long terme, et des architectures comme les couches d’attention ou les unités mémoire externes sont généralement utilisées pour surmonter cela. Ces composantes augmentent le coût et la complexité de calcul.
Le modèle prédit notamment que la perturbation de la signalisation intracellulaire dans les astrocytes devrait affecter le rappel de la mémoire et qu'une interférence sélective avec les réseaux astrocytaires pourrait nuire à certains types d'apprentissage. Ces idées sont testables, bien que techniquement difficiles, et pourraient orienter les futurs travaux en neurosciences fondamentales et en informatique inspirée du cerveau.
Bien sûr, le modèle reste théorique. Les chercheurs précisent que leur proposition est un cadre et non une conclusion.
« Avant toute chose, il serait formidable que les chercheurs expérimentaux fassent un effort sérieux pour réfuter notre modèle », a déclaré M. Kozachkov. « C’est-à-dire, essayer de prouver qu’il n'est pas bon. Je serais ravi de contribuer à cet effort. »
Pour l’instant, la théorie invite à une réévaluation plus large de la structure de l’intelligence.
« Nous sommes au début d’une explosion de renseignements de Cambrian », déclare M. Kozachkov. « Pour la première fois, nous savons comment construire des entités non animales intelligentes. Cela a des implications considérables pour les neurosciences, qu’il est difficile d’exagérer. »
Il ajoute qu’il estime que les neurosciences ont encore beaucoup plus à offrir en matière de machine learning. « Je ne pense pas que nous ayons encore épuisé toutes les idées que nous pouvons tirer du cerveau pour construire des systèmes plus intelligents. » Pas du tout. »
