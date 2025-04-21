La quête visant à créer des machines à penser semblables à des humains, des systèmes d'IA capables de raisonner, de s'adapter et de relever un large éventail de défis, fait la une des journaux et redéfinit les programmes technologiques. Mais Ruchir Puri, scientifique en chef d'IBM Research, milite pour un autre type de percée : une IA qui gagne sa vie en étant utile maintenant, et non à une date hypothétique dans le futur.
L’idée d’une machine qui pense comme un être humain fait partie de la culture technologique depuis plus d’un demi-siècle. Ces dernières années, elle est passée de la marge des conférences sur l’informatique au cœur des débats publics et politiques. L’intelligence artificielle générale (AGI) est devenue un fourre-tout pour les promesses et les dangers de l’IA moderne.
« Chaque fois que nous franchissons une étape importante, nous avons tendance à repousser cette limite », explique M. Puri, parlant de l’IA dans une interview accordée à IBM Think. « Nous avons pensé ça avec les échecs. Puis avec le langage. Aujourd’hui, c’est avec le codage ou le raisonnement. Mais l’intelligence générale reste indéfinie. »
L’expression « intelligence artificielle générale » a d’abord gagné en popularité dans les années 2000 comme moyen de distinguer les systèmes d’IA étroits – ceux conçus pour accomplir une seule tâche très bien – du type d’intelligence large et adaptable que l’on observe chez les humains. Pendant des décennies, cet objectif est resté marginal, un sujet de recherche théorique et de science-fiction plus que d'ingénierie courante.
Cela a commencé à changer avec l’avènement de l’apprentissage profond dans les années 2010 et l’émergence des modèles de fondation, ou réseaux de neurones à grande échelle entraînés sur de vastes jeux de données. Ces modèles ne pensaient pas de manière significative, mais ils pouvaient générer des textes convaincants, identifier des modèles et effectuer des tâches qui semblaient autrefois hors de portée des machines.
Ces évolutions se sont accélérées ces dernières années. GPT-4, Claude 3, Gemini et d’autres modèles peuvent désormais passer des tests standardisés, écrire du code, résumer des articles de recherche et même expliquer des blagues. Ils restent fragiles, se trompent souvent dans leurs réponses et manquent de véritable compréhension. Mais ils estompent la frontière entre l’IA étroite et quelque chose de plus flexible, ce qui, pour certains chercheurs, s’apparente à un stade précoce de l’IAG. D’autres mettent en garde contre le fait qu’il s’agit encore d’une illusion de compétence et que le terme « IAG » reste plus rhétorique que technique.
À la base, l’IAG désigne une machine capable d’effectuer toutes les tâches intellectuelles dont un être humain est capable (apprentissage, raisonnement, résolution de problèmes) avec la même adaptabilité et la même capacité de généralisation. Contrairement aux systèmes d’IA actuels, qui sont étroits et hautement spécialisés, l’AGI fonctionnerait avec souplesse dans un large éventail de domaines, sans avoir besoin d’être explicitement programmée pour chacun d’entre eux.
L’année dernière a été marquée par une vague de modèles de plus en plus performants qui n’ont fait qu’alimenter les attentes. Sam Altman, PDG d’OpenAI, a décrit l’IAG comme imminente. Ses déclarations publiques, ainsi que l’orientation stratégique de l’entreprise, suggèrent un engagement sans ambiguïté à concevoir des machines capables de raisonner avec une grande compétence. Google DeepMind et Anthropic ont emboîté le pas en lançant des systèmes optimisés pour un raisonnement, une mémoire et une utilisation des outils plus généraux.
Des investisseurs et des laboratoires de recherche de renom soutiennent la vision de l’IAG, certains déclarant qu’elle est réalisable d’ici cinq à dix ans. Les débats politiques ont également fait leur apparition dans les médias grand public, les législateurs et les organismes de surveillance s’interrogeant sur la manière de réglementer une technologie qui, par définition, n’a aucun précédent historique. Pour certains, l’avenir semble incroyablement proche ; pour d’autres, il est dangereusement prématuré.
La réponse de M. Puri n’est pas de rejeter catégoriquement cette ambition, mais de reformuler la question : et si la véritable frontière n’était pas de concevoir une machine capable de tout faire, mais capable de bien faire quelques tâches essentielles ?
Puri a joué un rôle déterminant dans la mise en place des systèmes qui alimentent les plateformes IBM Watson et watsonx.ai, qui ont établi des références en matière de performances des machines. Aujourd’hui, il estime que ce domaine a besoin d’un nouveau principe d’organisation, moins mythique et plus pratique. Cette idée, qu’il appelle « intelligence artificielle utile » (IAU), commence à influencer la manière dont IBM et d’autres instituts de recherche orientent leurs efforts.
« J’aime cette perspective qui consiste à ”rendre l’intelligence artificielle utile”, car si nous la rendons utile, personne ne s’y opposera », explique-t-il.
Contrairement à l’IAG, qui implique une machine capable d’égaler ou de dépasser l’intelligence humaine dans tous les domaines, l’IAU vise un objectif plus modeste mais avec un rendement potentiellement plus immédiat. Il ne s’agit pas de créer quelque chose qui puisse composer des symphonies ou remplacer les philosophes. Il s’agit de créer des outils qui fonctionnent de manière fiable dans des contextes clairement définis, tels que des copilotes de code, des vérificateurs de conformité et des optimiseurs de workflow.
M. Puri m’a parlé depuis son bureau du centre de recherche Thomas J. Watson d’IBM à Yorktown Heights, dans l’État de New York. Le bâtiment, une structure moderniste imposante nichée dans les collines boisées à environ une heure au nord de Manhattan, dégage la gravité tranquille d’un lieu où les avancées scientifiques se font à l’abri des regards. Les visiteurs passent devant des plaques bleues gravées de formules mathématiques et des tableaux blancs marqués d’équations à moitié résolues. Conçu par l’architecte moderniste Eero Saarinen au début des années 1960, le laboratoire a été le théâtre de certaines des percées les plus célèbres d’IBM. Puri y travaille depuis des décennies.
Avec ses longs couloirs et sa vue sur la forêt, c’est le genre d’endroit où la réflexion à long terme semble non seulement possible, mais attendue. Un cadre parfaitement adapté à la façon dont Puri aborde son travail. Selon lui, ce passage à l’IAU n’est pas tant un changement radical qu’une continuation des questions qu’il se pose depuis des années. Il s’intéresse depuis longtemps aux systèmes qui présentent une valeur pratique à grande échelle, tels que les outils d’IA pour le développement de logiciels, qu’il décrit comme « étonnamment utiles », non seulement pour les experts, mais aussi pour les débutants qui apprennent à coder. Selon lui, cette large accessibilité reflète le véritable potentiel de l’IA.
Et lorsque les modèles sont intégrés dans des opérations réelles, explique M. Puri, les enjeux sont importants. Dans les secteurs de la banque, du transport et de la santé, par exemple, les petites erreurs peuvent se répercuter rapidement en cascade.
« Je pense que le public s’est fait une fausse idée à cause de toutes ces démonstrations tape-à-l’œil, explique M. Puri. ChatGPT, Midjourney, Sora… Tous sont incroyables. Mais dans le monde de l’entreprise, on ne peut pas halluciner un chiffre ou mal interpréter une réglementation. Tout doit être exact. »
Cette préoccupation a incité IBM à adopter un modèle hybride. Plutôt que de s’appuyer uniquement sur des systèmes probabilistes, la société associe des modèles à des outils vérifiés, tels que des calculatrices, des API de recherche et des validateurs de données structurées, afin de minimiser les risques. Ces approches ne promettent pas une cognition semblable à celle des humains. Elles visent la cohérence. L’objectif est de garantir que les systèmes d’IA soient fiables dans des environnements à haut risque, où la précision et l’auditabilité importent plus que la créativité ou l’aisance conversationnelle.
« Il y a des cas d’utilisation où la créativité est un atout, dit-il, et d'autres où elle est un handicap. »
M. Puri cite l'expérience d'IBM en matière de développement de logiciels et d'automatisation comme preuve de concept. « Elle est devenue étonnamment utile », dit-il à propos de l’IA. « Des développeurs qui la trouvent utile dans leur vie quotidienne, aux étudiants qui apprennent à coder et à faire des choses, et qui trouvent aussi de l'aide auprès d'agents de codage automatisés, elle est devenue utile non seulement pour les experts, mais aussi pour tout le monde. »
Il se souvient des doutes initiaux de certains chercheurs quant à la difficulté pour les machines de s’attaquer au développement de logiciels, souvent considéré comme une tâche hautement créative et complexe. « Nous pensions que c’était une tâche très, très difficile », dit-il. Mais grâce à des LLM comme ChatGPT et à des modèles spécialisés internes, cette hypothèse ne s’est pas vérifiée. « Cela a été une surprise, non seulement pour moi, mais pour de nombreuses autres personnes. »
Selon M. Puri, l’implication plus large est que, puisque « toutes les entreprises sont désormais des entreprises basées sur les logiciels », l’utilité de l’IA dans le codage pourrait se traduire par une pertinence générale dans tous les secteurs.
Malgré tout le bruit qui entoure l'IA – ses promesses, ses pièges, sa mythologie – M. Puri affirme revenir souvent à une idée plus simple : la confiance. Non seulement au sens éthique, mais aussi au sens mécanique. Le système peut-il faire ce qu'il prétend faire ? Peut-on s'y fier, même lorsque personne ne le surveille ?
Il fait référence à la prolifération des modèles open source (Llama de Meta, les systèmes MoE (Mixture of Experts) de Mistral, la gamme Granite d’IBM) et à l’évolution plus générale vers une recherche transparente et collaborative. Ces systèmes ne sont pas conçus pour être spectaculaires. Ils sont destinés à être testés, ajustés et remis en question. Ils permettent un examen minutieux et invitent à la modification.
IBM, par exemple, ne présente pas ses modèles Granite comme des esprits polyvalents. Il s’agit plutôt d’outils développés en pensant aux entreprises clientes et optimisés pour traiter des tâches spécifiques dans les domaines de la finance, de la logistique et d’autres domaines hautement structurés. M. Puri souligne leur orientation intentionnelle et leur utilité ciblée.
« Ces modèles ne sont pas conçus pour remplacer les humains, dit-il. Ils sont conçus pour les aider à en faire plus. »
Plutôt que d'imiter l'intelligence humaine en bloc, souligne-t-il, le véritable test est de savoir si l'IA produit des résultats importants pour les personnes et les institutions, de manière cohérente, prévisible et à grande échelle.
Pour M. Puri, l'avenir de l'IA sera moins marqué par des percées réalisées du haut vers le bas que par des progrès itératifs et généralisés, grâce à la collaboration, à l'expérimentation et à l'infrastructure partagée.
Il estime notamment que les avancées les plus significatives ne viendront pas de laboratoires fermés ou de démos secrètes, mais de communautés qui grandissent au grand jour. Comme il le dit lui-même : « C’est l’un des premiers ensembles de technologies où l’innovation se fait véritablement au grand jour. »
