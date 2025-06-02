Le bâtiment principal du laboratoire HHMI Janelia s'élève à l'edge du fleuve Potomac comme un vaisseau de verre et d'acier, ses angles aigus étant adoucis par les collines verdoyantes et les bassins réfléchissants qui l'entourent. À l’intérieur, la lumière naturelle s’infiltre dans les espaces ouverts de collaboration, des couloirs sinueux relient des suites de microscopie spécialisées et des clusters de chercheurs se rassemblent près de murs de croquis au tableau blanc et de scans cérébraux haute résolution.
Dans l'une de ces suites, située à Ashburn, en Virginie, un écran affiche un rendu volumétrique du cerveau d'une larve de poisson-zèbre. Chaque neurone émet des impulsions sous la forme d’un point de lumière (une étoile montante en minuscules) capturé en 3D à haute résolution. Pour un œil non averti, il ressemble à une murmuration de lucioles dans un dôme de cristal. Mais pour Jan-Matthis Lueckmann, un scientifique de recherche chez Google recherche, et ses collaborateurs, il s'agit d'une carte de travail de la cognition, encodée en scintillements. C'était un puzzle. Et sa résolution pourrait remodeler notre compréhension du cerveau et de l'intelligence artificielle.
« Au-delà des problèmes liés à la correction des déformations élastiques dans cette vidéo volumétrique, l'un des principaux défis consistait à localiser de manière fiable l'emplacement de ces neurones », explique M. Lueckmann dans une interview accordée à IBM Think. « Pour y remédier, nous avons pu collaborer étroitement avec une équipe de spécialistes de HHMI Janelia. Ils ont annoté méticuleusement à la main environ 2 000 neurones en utilisant un protocole d’annotation conçu sur mesure. »
Alors que les systèmes d'IA deviennent de plus en plus puissants, les chercheurs s'inspirent de plus en plus de la biologie, en particulier du cerveau, la machine à calculer la plus efficace de l'évolution. Le projet ZAPBench est l'un des exemples les plus ambitieux à ce jour : un jeu de données sur le cerveau entier d'un poisson zèbre conçu pour sonder la nature même du calcul et de la prédiction neuronaux.
Mais l’histoire ne s’arrête pas à la biologie. Chez IBM Recherche, une inspiration similaire a donné naissance à des puces inspirées du cerveau comme NorthPole, qui défient les architectures traditionnelles en imitant la façon dont les neurones calculent. À mesure que des projets tels que ZAPBench dévoilent les principes du fonctionnement du cerveau, ils pourraient inspirer la nouvelle génération de matériel d'IA.
Le jeu de données ZAPBench, le centre de cette histoire, n'est pas un scanner cérébral ordinaire. Il s'agit d'une vidéo volumétrique capturant deux heures continues d'activité cérébrale chez un poisson zèbre vivant, avec un rendu extrêmement détaillé. Chaque seconde contient des images tridimensionnelles qui suivent en temps réel la lueur d'environ 70 000 neurones, chacun s'allumant momentanément, signalant un élan de pensée.
Ce phrasé élégant ne reflète guère la complexité de l'ingénierie. La vidéo est un environnement (informatique) en mouvement. Les déformations élastiques, les déplacements microscopiques des tissus, créent des distorsions qui déforment les données. Les algorithmes trébuchent. En l'absence de cartes précises, la tâche la plus simple devient ardue : où se trouve exactement chaque neurone ?
Pour y répondre, M. Lueckmann et son équipe se sont tournés vers des mains humaines. En collaboration avec un groupe spécialisé de Janelia, ils ont annoté manuellement environ 2 000 neurones. Il s'agissait non seulement de marquer les cellules, mais aussi d'affiner chaque marque dans un processus de va-et-vient, une sorte de dialogue itératif entre le scientifique et la machine. « Ce processus a impliqué plusieurs phases de commentaires et de raffinement entre nos équipes, fournissant finalement les données d’entraînement pour notre algorithme personnalisé », explique-t-il.
Cette base étant posée, l'algorithme a fait le reste : cartographier les 70 000 autres. Il ne s'agissait pas seulement de force brute. C’était l’échafaudage nécessaire pour commencer à créer des modèles de machine learning capables de prédire le prochain déplacer du cerveau.
Le poisson zèbre utilisé dans l’étude ne se reposait pas simplement dans un réservoir. Il a été exposé à une séquence de stimuli virtuels, de courants simulés, de lumière vacillante et d'ombres en mouvement, tous conçus pour imiter les signaux environnementaux naturels. Alors que l’activité des musculaires de la queue du poisson a été enregistrée via des électrodes, son cerveau a été visualisé en temps réel à l’aide d’un microscope à feuille de lumière. Immobilisé dans un gel transparent, le poisson a été génétiquement modifié pour exprimer des indicateurs de calcul, qui brillent lorsque les neurones s’embrasent. Cette configuration a permis aux chercheurs d'obtenir à la fois des stimuli visuels et des réponses neuronales dans l'ensemble du cerveau des vertébrés.
ZAPBench inclut non seulement les données d'activité mais aussi un connectome à venir du même poisson, jusqu'au niveau de la synapse. Cela permet d’atteindre un niveau de modélisation jamais possible chez les espèces de indirects : activité et structure côte à côte. Grâce à cette combinaison, les modèles peuvent commencer à faire plus que des prévisions ; ils peuvent commencer à expliquer.
Deux autres initiatives reflètent des ambitions similaires. Le programme MICrONS de l'Allen Institute a combiné l'imagerie cérébrale structurelle et fonctionnelle chez la souris, offrant des cartes connectomiques denses avec des modèles d'activité neuronale pour comprendre comment l'information visuelle est traitée. Leur jeu de données a stimulé la recherche sur les relations structure-fonction dans le cerveau des mammifères, en particulier dans le cortex visuel.
Parallèlement, l'Observatoire du cerveau de l'université de Californie à San Diego a publié des données à grande échelle provenant de sondes Neuropixel enregistrant des milliers de neurones chez des souris qui se comportent bien. Bien qu'il ne soit pas aussi complet sur le plan spatial que ZAPBench, cet effort a fourni des données temporelles précieuses alignées sur le comportement, contribuant ainsi aux progrès de la modélisation prédictive de la dynamique corticale.
La véritable question que soulève ZAPBench ne concerne pas les neurones à proprement parler. Il s’agit de la façon dont nous les modélisons.
Pendant des décennies, la modélisation du cerveau s'est fortement appuyée sur des données chronologiques. Cela implique de réduire la structure 3D complexe du cerveau à des niveaux d'activité numériques au fil du temps. Il est plus simple, moins gourmand en ressources informatiques et plus facile à analyser.
Mais il y a un compromis à trouver.
« L'obtention de données chronologiques nécessite une étape de segmentation qui, malgré tous nos efforts, entraîne inévitablement un certain degré d'erreur à cette échelle », explique M. Lueckmann. La segmentation, le processus d’isolation et d’étiquetage des neurones, est par nature sujette aux erreurs. Une petite erreur commise très tôt peut se répercuter sur l'ensemble d'un modèle.
Les données volumétriques proposent une autre voie. Au lieu de réduire l’image 3D en signaux 1D, les modèles volumétriques visent à prédire l’activité directement à partir de la vidéo. C'est de bout en bout. Désordonné, mais élégant.
« Faire des prévisions sur des données volumétriques contourne directement le besoin de segmentation », explique M. Lueckmann à IBM Think. « Ceci offre une approche plus globale, une caractéristique souvent avantageuse dans les applications de machine learning. »
Lors des tests, l'équipe a constaté que les modèles vidéo volumétriques étaient plus performants que les modèles de séries temporelles lorsqu'ils ne disposaient que d'un bref contexte d'activité passée. Pourquoi ? Ils essaient toujours de le comprendre. Mais il est possible de recourir au biais inductif : les modèles vidéo, par nature, préservent mieux les relations spatiales entre les neurones.
« Nous étudions actuellement les raisons sous-jacentes », déclare M. Luckmann. « Notre hypothèse actuelle est que les biais inductifs inhérents aux modèles vidéo facilitent leur prise en compte des relations entre neurones. »
Le hic ? Les modèles volumétriques sont lourds en termes de calcul. Le chargement des données seul est un exploit d’ingénierie.
« Bien que le chargement des données ait représenté un défi technique de taille pour nos modèles vidéo, cela ne pose qu'un problème mineur pour les modèles de séries chronologiques, qui ont permis des essais beaucoup plus rapides », ajoute M. Lueckmann.
En pratique, les deux types de modélisation ne sont pas incompatibles. Ils représentent des compromis dans un objectif partagé : comprendre comment un cerveau Think en prédisant ce qu’il fera ensuite.
Cette convergence entre le cerveau et la machine n'est pas seulement théorique. Chez IBM recherche, Dharmendra Modha et son équipe ont créé NorthPole, un nouveau type de puce d'IA conçue pour l'inférence. Contrairement aux puces traditionnelles qui souffrent du goulot d'étranglement de von Neumann, faisant constamment la navette entre la mémoire et le processeur, NorthPole intègre les deux. C'est un reflet numérique du cerveau, où mémoire et calcul sont étroitement liés.
La puce y parvient en embedding la mémoire directement à côté des cœurs de calcul. Construit avec 22 milliards de transistors et fabriqué selon un processus de nœud de 12 nanomètres, NorthPole offre une performance d'inférence 25 fois supérieure à celle des principaux processeurs et GPU sur des benchmarks de référence comme ResNet-50. Cette architecture permet non seulement une efficacité énergétique, mais aussi des réductions massives de latence et d’espace.
Les modèles construits à partir des données ZAPbench peuvent vous dire ce qui va suivre : quels neurones sont susceptibles de déclencher, quand et même comment ce schéma peut se propager dans certaines régions du cerveau. Mais la question la plus profonde demeure : ces prévisions signifient-elles que nous comprenons le système qui les a générées ? Que se passe-t-il lorsqu’il est possible de prédire l’activité cérébrale ? Est-ce que cela signifie que vous comprenez ? Pas tout à fait, selon M. Lueckmann.
« ZAPBench se concentre actuellement sur la maximisation des performances prédictives, sans imposer de restrictions sur les types de modèles utilisés », explique M. Lueckmann.
Un objectif plus ambitieux se profile à l'horizon : passer de la prédiction à l'explication. Pour ceci, il faut non seulement savoir quels neurones s'enflamment, mais aussi pourquoi.
Et c'est là que les choses deviennent encore plus ambitieuses. Parallèlement aux données d'activité, les collaborateurs de M. Lueckmann compilent un jeu de données structurales sur le cerveau du même poisson. Il ne s'agit pas de savoir ce que font les neurones, mais comment ils sont câblés.
« Nos collaborateurs ont acquis un jeu de données à résolution synaptique provenant du même poisson », dit-il. « Ces données structurelles sont maintenant traitées pour reconstruire la morphologie de chaque neurone du cerveau, un effort complété par une relecture humaine à grande échelle. »
Il s'agit d'un véritable schéma électrique d'un cerveau vivant. Si les modèles prédictifs peuvent être enrichis de cette structure, par exemple en l’utilisant comme contrainte ou prior dans le processus de modélisation, le résultat pourrait être plus interprétable. Une carte qui n’indique pas seulement les étapes à venir, mais indique également pourquoi.
« Nous espérons que l’enrichissement des modèles prédictifs avec ces informations structurelles, par exemple, en incorporant le schéma de câblage physique comme contrainte de modèle, permettra d’obtenir des modèles non seulement plus précis, mais aussi plus interprétables », poursuit-il.
L'interprétabilité est importante. Si l'IA peut nous aider à décoder le cerveau, ce n'est pas seulement une victoire pour les neurosciences. Cela peut se répercuter sur l'IA elle-même, en proposant des schémas directeurs issus de la biologie que nous n'aurions jamais imaginés.
« Un pas en avant vraiment significatif serait de passer de la prédiction à la compréhension mécanicienne véritable », dit-il. « Pour l’instant, je considère toutefois qu’il s’agit avant tout d’une initiative utilisant l’IA pour faire progresser la compréhension scientifique, plutôt que d’un effort visant à faire progresser directement l’IA elle-même. »
Néanmoins, la boucle de commentaires est possible. De nouvelles méthodes d'IA pourraient ouvrir des portes dans le domaine des neurosciences. Et de nouvelles informations en neurosciences pourraient remodeler l'IA.
« Le meilleur résultat envisageable pour le test de référence ZAPBench serait qu’il serve de tremplin vers la découverte de principes actuellement inconnus du fonctionnement du cerveau des vertébrés », déclare M. Lueckmann. « Si cela devait se produire, il est concevable que ces informations puissent éclairer et inspirer de nouvelles orientations en matière d'IA. »
ZAPEnch peut provenir d’un petit poisson, mais ses implications vont bien au-delà de son échelle. L'ensemble de données ouvre une fenêtre inédite sur la relation entre la structure et l'activité du cerveau, en permettant aux chercheurs de sonder les fondements de la cognition et du calcul d'une manière auparavant inaccessible.
