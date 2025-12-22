En 2026, les modèles d’IA les plus intelligents ne seront peut-être pas les plus grands.

C’est le pari que font désormais les laboratoires, les investisseurs et les chercheurs qui viennent de passer toute une année à voir leurs hypothèses s’effondrer. Les 12 prochains mois, la course consistera non pas à construire des systèmes plus grands, mais à développer des systèmes plus intelligents, des modèles capables de réfléchir avant de parler et de faire plus avec moins.

« Vous pouvez faire en sorte qu’un petit modèle de langage soit aussi performant, voire plus, que les modèles beaucoup plus grands », estimait Kush Varshney, IBM Fellow, lors d’une interview accordée à IBM Think.

Il y a un an, cela aurait été considéré comme une hérésie. Pendant une décennie, l’IA avait fonctionné selon un précepte cruellement simple : plus de données, plus de paramètres, plus de puissance de calcul, plus d’intelligence. Les laboratoires annonçaient leur nombre de paramètres comme des culturistes montrant leurs muscles devant un miroir. L’entraînement consommait l’équivalent de la production électrique d’une petite ville. On aurait dit une course à la terre, sauf que le territoire revendiqué se mesurait en téraflops.

Puis est arrivé janvier 2025. Une société appelée DeepSeek, basée en Chine, a publié un modèle qui a fait chuter les actions de Nvidia de 17 % en une seule journée. L’intelligence algorithmique pourrait remplacer la force de calcul brute. Vous n’aviez pas besoin d’une cathédrale. Vous aviez besoin d’un meilleur plan architectural.

Les principaux laboratoires américains se sont rapidement adaptés. En quelques mois, ils sont passés de la construction de systèmes toujours plus grands à la construction de systèmes qui marquent une pause et réfléchissent avant de répondre. Seyed Emadi, professeur associé d’opérations à l’université de Caroline du Nord Kenan-Flagler, l’a dit sans détour lors d’un entretien avec IBM Think : « si je devais résumer l’année 2025 en matière d’IA, je dirais que nous avons cessé de créer des modèles plus grands et avons commencé à les rendre plus intelligents. »

Ce tournant détermine désormais la suite. Le consensus scientifique est saisissant, presque inquiétant. Lorsqu’on lui a demandé d’identifier le développement le plus important de l’année dernière, Misha Belkin, professeur de machine learning à l’université de San Diego, a souligné « l’essor des modèles de réflexion et la mise à l’échelle du temps d’inférence » , qu’il a qualifié de fondement pour 2026 lors d’une interview. Rada Mihalcea, qui dirige le laboratoire d’IA de l’université du Michigan, a exprimé un point de vue complémentaire : « les avancées en matière de systèmes multi-agents, ainsi qu’une compréhension plus approfondie des ... faiblesses » définiraient la voie à suivre, déclare-t-elle à IBM Think.

Ce changement représente une refonte de ce que représente l’intelligence en silicium. Selon l’ancienne approche, c’était quelque chose que vous pouviez préparer pendant l’entraînement, comme assaisonner un ragoût. Une fois terminé, le modèle était congelé. La nouvelle approche traite l’intelligence comme quelque chose qui peut émerger au moment de l’exécution en donnant au modèle plus de temps pour raisonner, ce que l’on appelle le calcul du temps d’inférence.

Les implications sont encore à l’étude. Gabriel Poesia, chercheur qui étudie le raisonnement IA à l’université de Stanford, a observé que les modèles s’amélioraient pour « réfléchir sur de longues périodes » et « utiliser fluidement des outils pendant de longues périodes de réflexion ». En clair, les machines ont appris à penser avant de parler.

Les anciens modèles fonctionnaient comme des réflexes : entrée, prédiction, pas de pause pour la réflexion. Les nouveaux délibèrent. Posez une question difficile, et le modèle s’y attardera, parfois pendant des minutes, vérifiant sa logique et revenant en arrière en cas d’impasse. Cela ressemble beaucoup à de la réflexion. S’agit-il de réflexion au sens propre du terme ? C’est l’une des grandes questions restées sans réponse.