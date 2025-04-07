Le modèle d'IA Claude d'Anthropic ne se contente pas d'écrire de la poésie, il anticipe pour créer des rimes. Il ne se contente pas de répondre à des questions, il évalue le sens dans différentes langues, élabore des concepts internes et parfois simule sa logique pour être en accord avec un utilisateur. Et pour la première fois, les chercheurs observent ces processus se dérouler en temps réel.

Dans une nouvelle étude, les chercheurs d'Anthropic ont analysé en profondeur le modèle linguistique Claude à l'aide d'un ensemble novateur d'outils d'interprétabilité, c'est-à-dire des outils qui permettent d'expliquer comment et pourquoi les modèles d'IA prennent leurs décisions. Leurs résultats révèlent un système qui traite des tâches de raisonnement complexes d'une manière qui ressemble à la cognition humaine, avec une planification interne, une abstraction conceptuelle et des biais cognitifs occasionnels. Ces découvertes, qui repoussent les limites de la transparence dans le développement de l'IA, trouvent déjà un écho auprès des équipes d'IBM, où des chercheurs mènent des travaux d'interprétabilité sur les modèles d'IBM. Pour les deux entreprises, ces avancées sont plus que des curiosités scientifiques : elles constituent une étape cruciale vers la création de modèles compréhensibles, fiables et perfectibles.

« Ce que fait Anthropic est fascinant », déclare Kaoutar El Maghraoui, chercheur principal chez IBM, lors d'un entretien avec IBM Think. « Ils commencent à démontrer que les modèles développent des structures de raisonnement internes qui ressemblent beaucoup à la mémoire associative. Nous avons observé un comportement similaire dans nos propres modèles. »