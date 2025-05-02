Par une matinée grise à Oxford, en Angleterre, Christopher Summerfield est assis dans son bureau au département de psychologie expérimentale, un manuscrit de livre soigneusement posé sur le bord de son bureau. Ses journées sont très chargées. Entre ses recherches sur la cognition humaine, ses collaborations avec des laboratoires d’IA et un programme d’enseignement complet, Christopher Summerfield a trouvé le temps d’écrire These Strange New Minds: How AI Learned to Talk and What It Means (Les nouveaux esprits étranges de l’IA : comment l’IA a appris à parler et ce que cela signifie).
Ce nouvel ouvrage est à la fois un récit historique, un manifeste et une réflexion sur une question qui a longtemps perturbé les technologues et les philosophes : lorsque les machines semblent penser, que se passe-t-il réellement ?
Le livre de Christopher Summerfield arrive à un moment charnière. Les percées dans le domaine de l’IA, de la publication de modèles multimodaux comme GPT-4 aux avancées inspirées du cerveau comme la puce NorthPole d’IBM modifient la façon dont les scientifiques, les décideurs et le public comprennent l’intelligence des machines. À mesure que les systèmes d’IA deviennent plus performants, leur statut cognitif, c’est-à-dire savoir s’ils sont réellement capables de raisonner, de planifier et de réfléchir, est devenu l’un des débats les plus urgents et les plus controversés de notre époque. Dans These Strange New Minds, Christopher Summerfield soutient que pour entrevoir l’avenir de l’IA, il convient d’abord de comprendre la nature du raisonnement humain et de reconnaître à la fois les similarités et les différences entre les esprits biologiques et artificiels.
Professeur en neurosciences cognitives à l’université d’Oxford, Christopher Summerfield dirige le Human Information Processing (HIP) Lab, un groupe de recherche qui étudie comment les humains et les systèmes artificiels apprennent, catégorisent les informations et prennent des décisions. Ses travaux mêlent expériences comportementales, modèles informatiques et analyses de données neuronales, explorant souvent les similitudes entre les fonctions cérébrales et le machine learning. Ses recherches se situent à la croisée des sciences cognitives, de l’IA et des sciences sociales, des domaines qui convergent de plus en plus à mesure que les modèles d’IA gagnent en complexité.
Le département de psychologie expérimentale, actuellement installé dans des bâtiments vieillissants au bout du campus des sciences d’Oxford, ressemble à un espace en transition : les tableaux blancs sont épais et remplis de diagrammes, et l’odeur du vieux bois cohabite difficilement avec celle de nouveaux câbles. Bientôt, Christopher Summerfield et ses collègues s’installeront dans le Life and Mind Building, un complexe étincelant en pierre pâle et en verre où des salles d’EEG, des laboratoires dédiés au sommeil et des salles de suivi oculaire sont construits derrière des façades modernes et élégantes. Pourtant, même si Oxford revoit ses infrastructures, l’ambiance à l’intérieur du bâtiment reste inchangée : sérieuse, posée, mêlée à l’intensité silencieuse de personnes qui passent leur vie à essayer de comprendre comment les esprits, humains ou non, naissent.
En dehors de son laboratoire, l’auteur enseigne un cours intitulé « How to build a brain from scratch » (Comment construire un cerveau à partir de rien), qui s’appuie sur la psychologie, les neurosciences et l’IA pour s’intéresser aux principes fondamentaux de l’apprentissage et de l’inférence. Il est connu pour mettre l’accent sur la clarté et l’accessibilité, des qualités qui deviennent de plus en plus importantes à mesure que les discussions sur l’IA dépassent les cercles techniques et touchent un public plus large.
Pendant notre entretien, Christopher Summerfield semble détendu mais concentré. Ses cheveux se dressent en touffes indisciplinées, encadrant un visage ouvert et animé lorsque nous parlons de différentes idées. Il porte un simple pull sombre et des lunettes à monture métallique, lui donnant l’air d’une personne plus soucieuse de résoudre des problèmes que de cultiver une image soignée. Derrière lui, un tableau blanc plein de flèches, d’équations et de diagrammes capte la lumière du matin.
« On a tendance à présenter l’IA de manière radicalement opposée, explique-t-il. D’un côté, les optimistes pensent que nous disposerons très bientôt de technologies plus intelligentes que les humains. De l’autre, les sceptiques voient l’IA comme un élément tendance, un autre outil utilisé par les entreprises pour nous contrôler. »
Les récents développements lui ont donné à la fois des perspectives et des éléments avec lesquels travailler. Des modèles comme GPT-4, Claude et Granite d’IBM ont démontré des capacités de raisonnement plus larges, dépassant les systèmes antérieurs qui prédisaient simplement le mot suivant dans une séquence. Les chercheurs développent également des cadres des exigences multi-agent dans lesquels plusieurs systèmes d’IA collaborent ou s’affrontent pour résoudre des tâches. C’est une approche que certains considèrent comme une étape vers des comportements émergents plus complexes.
Pendant ce temps, des entreprises comme IBM développent des concepts inspirés du cerveau. La puce NorthPole, par exemple, est conçue pour imiter des aspects des réseaux de neurones biologiques, en mettant l’accent sur l’efficacité énergétique et le traitement parallèle plutôt que sur la puissance de calcul brute. Pour le professeur, ces efforts reflètent une prise de conscience croissante du fait que l’évolution des méthodes d’IA conventionnelles n’est peut-être pas suffisante et que de nouveaux modèles d’intelligence, issus de la biologie, pourraient indiquer la voie à suivre.
Demandez à Christopher Summerfield si les grands modèles de langage (LLM) comme ChatGPT sont capables de raisonner, et il vous répondra sans hésiter : oui, mais dans certaines limites.
« Dans un éventail restreint de domaines, les systèmes d’IA d’aujourd’hui raisonnent mieux que les humains », affirme l’homme.
Cela, ajoute-t-il, ne devrait pas être très surprenant. Depuis des décennies, les machines surpassent les performances humaines dans l’exécution de tâches de raisonnement spécialisées, non pas depuis la création de systèmes de jeu d’échecs comme Deep Blue d’IBM, mais dès 1956, lorsque le programme Logic Theorist a réussi à prouver des théorèmes mathématiques que ses créateurs n’avaient pas anticipés.
Les LLM d’aujourd’hui ne se contentent pas de récupérer des faits ; ils génèrent du code, rédigent des dissertations et proposent des solutions à des problèmes complexes. La toute nouvelle frontière, connue sous le nom d’IA multimodale, étend encore cette capacité en permettant aux systèmes de traiter simultanément images, texte, audio et vidéos, un développement que les chercheurs espèrent voir s’approcher de formes de raisonnement plus holistiques.
« Les modèles sont meilleurs que la plupart des gens dans la plupart des tâches cognitives », affirme Christopher Summerfield, s’empressant d’ajouter que des limites importantes subsistent. En effet, les modèles ont souvent du mal à accomplir des tâches qui nécessitent une compréhension sociale plus profonde, comme la capacité à gérer les émotions, à déduire les intentions ou à saisir les nuances non exprimées qui caractérisent les interactions humaines.
« L’interaction sociale est essentielle à notre survie, explique-t-il. Les modèles ne sont pas entraînés à cela. Il leur manque certaines des motivations et des repères émotionnels qui rendent le raisonnement social humain si sophistiqué. »
Des études récentes ont tenté de tester si les systèmes d’IA pourraient développer une « théorie de l’esprit », c’est-à-dire la capacité d’attribuer des états mentaux à d’autres. Certains modèles expérimentaux montrent des indices de cette capacité dans des environnements contrôlés, mais les chercheurs s’accordent généralement à dire que l’IA est encore loin des modèles mentaux stratifiés et intuitifs que l’homme déploie chaque jour.
Christopher Summerfield souligne que si les systèmes actuels peuvent simuler de manière impressionnante certains aspects du raisonnement logique, ils ne comprennent pas vraiment ce qu’ils font. Ils manquent d’expériences vécues du monde, une limitation fondamentale qu’aucun prompt intelligent ne peut entièrement effacer.
La nature de ces différences devient encore plus claire lorsque nous tenons compte d’un autre ingrédient essentiel de la pensée humaine : la mémoire.
Si la motivation oriente nos pensées, la mémoire, elle, leur donne une continuité. Là aussi, les machines divergent nettement de l’esprit biologique.
Les humains possèdent plusieurs systèmes de mémoire. La mémoire à court terme repose sur une activité électrique dynamique dans le cerveau, qui permet de conserver et de manipuler des informations pendant de brèves périodes. La mémoire à long terme, en revanche, implique des changements physiques dans les connexions neuronales, un processus lent et adaptatif qui permet aux individus de conserver des connaissances, des expériences et des compétences pendant des années, voire des décennies.
En sciences cognitives, les chercheurs distinguent la mémoire épisodique (souvenirs d'événements personnels), la mémoire sémantique (faits et concepts généraux) et la mémoire procédurale (compétences telles que la conduite d'une bicyclette). Les souvenirs émotionnels, profondément encodés par des structures cérébrales telles que l'amygdale, façonnent le comportement et la prise de décisions tout au long de la vie.
Les modèles d’IA actuels, en revanche, gèrent la mémoire de manière très différente. Les LLM opèrent dans une fenêtre contextuelle fixe : ils conservent temporairement les informations pendant une interaction, mais les suppriment ensuite. Lorsqu’une conversation se termine, la mémoire du système est réinitialisée.
« Lorsqu’on interagit avec un modèle de langage, explique le professeur, il n’y a pas d’histoire personnelle en cours. Il ne peut pas se souvenir de qui vous êtes ou de ce dont vous avez discuté à moins que ces informations ne soient transmises de manière explicite. »
Cette limitation n’est pas seulement gênante. Chez l’homme, la mémoire permet de créer une identité personnelle, d’approfondir les relations et de développer la confiance, la nuance et le sens partagé au fil du temps. En l’absence de cela, les systèmes d’IA restent fondamentalement transactionnels, excellents pour faire correspondre les modèles sur le moment, mais incapables de créer un contexte durable.
Certains chercheurs tentent de donner aux systèmes d’IA une mémoire à plus long terme. Des projets comme la mémoire d’OpenAI pour Chat-GPT permettent aux modèles de se souvenir des interactions passées entre chaque session. Anthropic a déclaré avoir conçu ses modèles Claude en mettant l’accent sur la cohérence contextuelle sur de longues périodes de dialogue. Cependant, ces approches sont précoces et soulèvent d’importantes préoccupations techniques et éthiques en ce qui concerne la confidentialité des utilisateurs, la sécurité des données et les risques de manipulation.
Même si les développeurs parviennent à surmonter les obstacles techniques, le fossé philosophique, lui, demeure encore bien présent. La mémoire humaine n’est pas seulement une base de données de faits: elle est malléable, émotionnelle et subjective. Elle évolue au fil des nouvelles expériences et acquiert de nouvelles compréhensions.
« Chez l’être humain, la mémoire ne se limite pas au stockage, fait remarquer Christopher Summerfield. C’est une interprétation. C’est une réécriture continue du passé à travers le prisme du présent. »
Sans cela, a-t-il soutenu, l’IA manquera toujours d’un élément fondamental de ce que signifie être véritablement intelligente et véritablement humaine.
Malgré les limites actuelles des systèmes artificiels, Christopher Summerfield estime que la tentative de construire des machines pensantes modifie déjà la façon dont les scientifiques comprennent l’intelligence naturelle.
« D’une certaine manière, l’IA sert de preuve d’existence, souligne-t--il. Si certaines stratégies de calcul fonctionnent pour les machines, cela suggère qu’elles pourraient également être appliquées aux systèmes biologiques. »
L’un des développements les plus frappants a été la découverte que des architectures de réseaux neuronaux relativement simples, lorsqu’elles sont mises à l’échelle de manière massive, peuvent produire des comportements qui, auparavant, étaient supposés nécessiter des conceptions beaucoup plus sophistiquées. Les modèles de transformateurs, qui sont à la base de systèmes tels que ChatGPT, Granite et Claude, ont montré que la reconnaissance et la généralisation des schémas à grande échelle peuvent émerger de l’entraînement statistique.
Ce succès pousse les chercheurs en sciences cognitives à revoir des théories de longue date sur la façon dont les humains apprennent, raisonnent et généralisent. Il remet notamment en question l’idée selon laquelle l’intelligence doit être codée en dur à l’aide de règles symboliques complexes. Au contraire, il suggère qu’une grande partie du raisonnement humain peut lui-même émerger de mécanismes simples opérant sur de vastes quantités de données et d’expériences.
Les modèles d’IA modernes peuvent déduire des solutions à des problèmes peu familiers, effectuer des analogies et, dans les bonnes conditions, se lancer dans des formes de métacognition, c’est-à-dire raisonner sur leur raisonnement. Les développeurs n’ont pas explicitement programmé ces capacités : elles sont apparues spontanément au cours du processus d’entraînement, reflétant certains aspects de la flexibilité cognitive humaine.
Christopher Summerfield met toutefois rapidement en garde contre les comparaisons faciles. Bien que le cerveau et l’IA puissent se ressembler d’un point de vue abstrait, les systèmes sous-jacents restent fondamentalement différents. Selon lui, les cerveaux humains ont évolué sous des pressions qui ont profondément ancré les émotions, les motivations et les biais dans le tissu de la cognition, des fonctionnalités largement absentes des machines.
« Il existe des similitudes frappantes au niveau algorithmique, souligne le professeur, mais le substrat, le milieu dans lequel l’intelligence est instanciée, est totalement différent. »
La pensée humaine n’est ni purement logique ni impartiale. Elle est colorée par les émotions, guidée par le contexte social et façonnée par le besoin de survivre et de se reproduire. Ces couches de complexité donnent lieu à des comportements que les modèles d’IA, malgré toute leur intelligence statistique, ne peuvent pas reproduire entièrement.
Christopher Summerfield soutient que le processus de création et d’étude de l’IA aide les chercheurs à mieux comprendre ce qu’est l’intelligence : il ne s’agit pas d’une capacité unique, mais d’un phénomène émergent résultant de nombreuses capacités imbriquées.
« Nous apprenons autant sur nous-mêmes, dit-il, que sur les machines. »
Si les efforts déployés pour intégrer la mémoire dans l’IA mettent en évidence le fossé entre les machines et les esprits, la question de la conscience accentue encore le contraste.
L’idée qu’un système artificiel puisse un jour devenir conscient, qu’il puisse vivre des expériences subjectives, qu’il possède une perception de soi ou une vie mentale intérieure, est depuis longtemps l’un des débats les plus controversés des sciences cognitives et de la philosophie.
Christopher Summerfield aborde la question avec sa précision habituelle. Il est sceptique, non pas parce qu’il considère que la conscience est uniquement magique, mais parce que les preuves ne soutiennent tout simplement pas l’idée que les systèmes d’IA d’aujourd’hui, quelle que soit leur capacité, possèdent quoi que ce soit qui ressemble à une conscience subjective.
« Quand un modèle de langage dit "Je suis conscient", explique-t-il, cela fait écho à des schémas qu’il a appris à partir de données humaines. Il n’y a aucune raison indépendante de croire que ces mots reflètent une réalité intérieure. »
Les LLM comme GPT-4 sont formés pour prédire le prochain texte le plus plausible, et non pour générer des expériences introspectives. Lorsqu’on les interroge sur leurs états internes, ils peuvent produire des réponses cohérentes, mais la cohérence n’est pas un indicateur fiable de la conscience.
Certains chercheurs ont proposé des tests comportementaux pour la conscience artificielle, afin d’examiner la complexité, l’adaptabilité et la cohérence des réponses de l’IA. Mais sans accès à l’expérience subjective, de telles évaluations restent spéculatives.
« Nous avons déjà bien du mal à évaluer la conscience chez les animaux non humains, fait remarquer l’auteur. L’inférer dans des systèmes synthétiques, construits sur des substrats entièrement différents, est un problème encore plus difficile. »
Dans les systèmes biologiques, la conscience semble émerger de l’interaction complexe de milliards de neurones, fortement liée aux émotions, aux sensations corporelles et à une histoire d’expériences incarnées. En revanche, les modèles d’IA d’aujourd’hui opèrent des transformations mathématiques à partir de données d’entrée, sans fondement sensoriel ni contexte émotionnel.
Christopher Summerfield propose une analogie simple : « Vous pouvez simuler le comportement d’un ouragan sur un ordinateur, mais la simulation n’est ni mouillée ni venteuse. C’est une abstraction. »
De la même manière, une IA peut simuler les modèles extérieurs d’une conversation, et même des rapports de conscience, sans vivre l’expérience en interne. Sans sensation, sans incorporation ni motivation intrinsèque, les modèles d’IA restent puissants mais vides. Ce sont de brillants imitateurs, plutôt que des esprits indépendants.
Pour l’instant, Christopher Summerfield estime qu’il est plus sûr et plus productif de considérer les systèmes d’IA comme des outils complexes, et non comme des êtres naissants. En les traitant autrement, on risque de confondre imitation et compréhension, et on se détourne de la tâche urgente de suivi de leur impact dans le monde réel.
Alors que notre conversation s’oriente vers l’avenir, Christopher Summerfield aborde un thème qui a relié discrètement toutes nos discussions : la gouvernance.
« Ces systèmes sont puissants, souligne le professeur. Et leur développement est largement motivé par des incitations commerciales. »
Ce dernier privilégie l’innovation technologique. Il voit dans l’IA un potentiel incroyable pour révolutionner des domaines tels que la médecine, l’enseignement et la recherche scientifique. Cependant, il craint que si nous ne mettons pas en place des mesures de sécurité strictes, les dangers pourraient finir par dépasser les avantages.
« Nous avons besoin de structures qui garantissent que ces outils soient développés et utilisés de manière responsable. Cela inclut les garanties techniques, mais aussi les mécanismes juridiques, éthiques et démocratiques. »
Certains cadres des exigences en matière de gouvernance commencent à émerger. La loi sur l’IA de l’Union européenne propose une approche fondée sur le risque, en réglementant les applications en fonction des dommages potentiels qu’elles peuvent causer. Aux États-Unis, le projet de charte des droits de l’IA (Blueprint for an AI Bill of Rights) énonce des principes visant à protéger les citoyens de la discrimination et de l’exploitation algorithmiques. Dans le même temps, des organismes de recherche et de défense publient des bonnes pratiques pour un développement et un déploiement responsables.
Selon Christopher Summerfield, il reste encore beaucoup à faire. Il affirme que de nombreux systèmes d’IA de pointe sont entraînés sur d’immenses jeux de données, sans le consentement explicite des utilisateurs. Leur fonctionnement interne est opaque, même pour leurs créateurs, et leur déploiement manque souvent de transparence et de responsabilité.
« Il ne s’agit pas seulement de correctifs techniques », ajoute-t-il. « C'est une question de choix de société. »
Il peut s’agir de choisir qui tire avantage des progrès de l’IA : qui supporte les risques ? Qui contrôle les outils qui façonnent de plus en plus nos économies, nos écosystèmes d’information et même nos relations privées ?
En fin de compte, Christopher Summerfield voit l’IA non pas comme une intelligence extraterrestre lointaine, mais comme le reflet de nous-mêmes, un miroir imparfait qui nous montre à la fois nos capacités et nos angles morts. Comprendre ce que nous voyons dans ce miroir sera, selon lui, l’un des défis déterminants des années à venir. Et, comme le montre clairement These Strange New Minds, le travail de compréhension ne fait que commencer.
Rejoignez un webinaire IBM pour découvrir comment réaliser un véritable ROI grâce à des initiatives d’IA agentique, avec des exemples dans plusieurs secteurs, des cas d’utilisation et même les propres témoignages de réussite d’IBM.
Découvrez pourquoi IBM a été nommé leader dans le Gartner Magic Quadrant 2025 pour les plateformes de science des données et de machine learning.
Découvrez comment les entreprises délaissent le lancement de projets pilotes disparates en matière d’IA au profit d’une utilisation visant à stimuler la transformation en profondeur.
Accédez à notre catalogue complet de plus de 100 cours en ligne en souscrivant aujourd’hui un abonnement individuel ou multiutilisateur afin d’élargir vos compétences dans certains de nos produits à un prix avantageux.
IBM Granite est une famille de modèles d’IA ouverts, performants et fiables, conçus pour les entreprises et optimisés pour dimensionner vos applications d’IA. Explorez les options de langage, de code, de séries temporelles et de garde-fous.
Dirigé par des leaders d’opinion IBM, le programme a pour but d’aider les chefs d’entreprise à acquérir les connaissances nécessaires qui leur permettront d’orienter leurs investissements IA vers les opportunités les plus prometteuses.
Nous avons interrogé 2 000 entreprises à propos de leurs initiatives d’IA pour découvrir ce qui fonctionne, ce qui ne fonctionne pas et comment progresser.
Activez ces cinq changements d’état d’esprit pour éliminer l’incertitude, stimuler la réinvention de l’entreprise et dynamiser la croissance grâce à l’IA agentique.
Découvrez comment intégrer en toute confiance l’IA générative et le machine learning dans votre entreprise.
Entraînez, validez, réglez et déployez une IA générative, des modèles de fondation et des capacités de machine learning avec IBM watsonx.ai, un studio d’entreprise nouvelle génération pour les générateurs d’IA. Créez des applications d’IA en peu de temps et avec moins de données.
Mettez l’IA au service de votre entreprise grâce à l’expertise de pointe d’IBM en matière d’IA et à son portefeuille de solutions.
IBM Consulting et ses services d'IA accompagnent les entreprises dans la redéfinition de leurs activités avec l'intelligence artificielle pour mener leur transformation.
Bénéficiez d’un accès centralisé aux fonctionnalités couvrant le cycle de développement de l’IA. Produisez des solutions IA puissantes offrant des interfaces conviviales, des workflows et un accès à des API et SDK conformes aux normes du secteur.