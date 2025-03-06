Richard Sutton, l’un des pionniers de l’intelligence artificielle moderne, n’est pas convaincu que le simple fait d’augmenter la puissance de calcul de l’IA permettra d’obtenir des machines capables de penser comme des humains. En fait, il soutient l’idée que l’obsession actuelle pour le développement de l’apprentissage en profondeur pourrait empêcher l’IA d’atteindre son plein potentiel.
Aux côtés de son collaborateur de longue date Andrew Barto, M. Sutton a remporté cette année le Turing Award (souvent surnommé le « Prix Nobel de l’informatique ») pour ses travaux sur l’apprentissage par renforcement. Il pense que la véritable avancée se produira lorsque l’IA cessera de s’appuyer sur des jeux de données organisés et commencera à apprendre d’expérience, comme un enfant.
« Si nous voulons obtenir de véritables renseignements, l’IA doit apprendre par la pratique, en testant et en commettant des erreurs », déclare M. Sutton dans un entretien. « L’informatique n’est pas la panacée. L’augmentation de la capacité de calcul est une chose, mais ce n’est pas l’ingrédient de base de l’intelligence. »
Il s’agit d’une affirmation audacieuse à une époque où les géants de l’IA comme OpenAI, Google DeepMind et Anthropic sont en train de dimensionner leurs modèles, en leur fournissant des quantités toujours plus importantes de données et de calculs afin de parvenir à un raisonnement de niveau humain. M. Sutton estime toutefois que cette approche est erronée et que les véritables progrès viendront de l’affinement des algorithmes qui régissent la manière dont les machines apprennent, et non de la simple augmentation de leur taille.
Les contributions de Richard Sutton à l’IA remontent à plusieurs décennies. Son impact le plus significatif a tout de même été l’apprentissage par renforcement. Cette méthode permet à l’IA d’apprendre en interagissant avec son environnement, un peu comme les humains et les animaux apprennent par essais et erreurs.
L’apprentissage par renforcement fonctionne en récompensant un système d’IA pour ses bonnes actions et en le pénalisant pour ses erreurs, comme un enfant apprend que toucher une poêle chaude n’est pas une bonne idée alors qu’il peut saisir un jouet. Au fil du temps, le système d’IA affine son processus de prise de décision en maximisant les récompenses et en minimisant les erreurs.
Cette technique a été utilisée par AlphaGo, le système d’IA développé par Google DeepMind qui a étonné le monde en 2016 en battant le champion du monde de go, Lee Sedol. L’IA a appris non pas en mémorisant les stratégies humaines, mais en jouant des millions de parties contre elle-même et en affinant sa stratégie grâce à l’apprentissage par renforcement.
Depuis, l’apprentissage par renforcement s’est étendu au-delà des jeux vidéo et est utilisé dans des domaines tels que la robotique, le trading financier et les soins de santé. Elle permet d’optimiser les voitures autonomes, d’améliorer les algorithmes de trading automatisés et même d’affiner les chatbot IA comme ChatGPT grâce à l’apprentissage par renforcement basé sur les commentaires humains (RLHF). La RLHF permet aux modèles IA d’affiner leurs réponses en fonction des interactions avec l’utilisateur, ce qui les rend plus conversationnels et plus conformes aux attentes humaines.
Malgré ces progrès, M. Sutton estime que l’apprentissage par renforcement n’a pas encore été pleinement utilisé. « Il est encore tôt, dit-il. Les systèmes d’IA d’aujourd’hui reposent principalement sur des données pré-traitées, pas sur des interactions réelles. Cela doit changer si nous voulons une IA qui comprenne et s’adapte réellement. »
L’idée d’une intelligence générale artificielle (AGI), une IA capable de penser, de raisonner et d’apprendre dans un large éventail de tâches, au même titre qu’un être humain, est depuis longtemps un sujet controversé. Certains experts affirment que l’AGI durera de nombreuses années, alors que d’autres estiment qu’elle relève de l’utopie. D’autres experts affirment que l’AGI n’est pas la voie à suivre. « Nous ne devons pas oublier la puissance de ces modèles dans d’autres domaines non linguistiques », assure Marina Danilevsky, chercheuse principale chez IBM, lors d’un épisode du podcast Mixture of Experts. « Si nous élargissons réellement les domaines dans lesquels cette technologie peut être utilisée, alors nous pouvons aller dans des domaines bien plus intéressants, beaucoup plus pragmatiques, beaucoup plus pratiques... [au lieu de] nous focaliser sur l’AGI. »
M. Sutton adopte une position mesurée. Il estime qu’il y a une chance sur quatre que l’IA atteigne une intelligence de niveau humain d’ici cinq ans et une chance sur 50 % d’ici 15 ans. C’est une prévision étonnamment optimiste comparée à celle de nombreux de ses pairs, qui prédisent souvent que l’IAG n’apparaîtra pas avant plusieurs décennies.
« Des avancées sont encore nécessaires, » reconnaît-il. « Mais on se rapproche. La principale pièce manquante est de savoir comment faire en sorte que les systèmes d’IA tirent des enseignements de leur expérience de manière plus naturelle, au lieu d’être nourris à la cuillère via des jeux de données étiquetés. »
Comme le décrit Richard Sutton, l’un des plus grands défis est d’apprendre à l’IA à comprendre la planification et l’abstraction à long terme, soit la capacité de décomposer des problèmes complexes en morceaux plus petits et gérables, comme le font les humains.
« Si je vous demande de traverser la rue, vous ne pensez pas à chaque petit mouvement musculaire. Vous pensez à l’objectif : traverser la rue. L’IA doit apprendre comme ça, à un niveau d’abstraction plus élevé », explique M. Sutton.
L’une de ses principales contributions à l’apprentissage par renforcement est le concept d’abstraction temporelle, qui permet à l’IA d’apprendre par étapes plutôt que de s’enliser dans la microgestion. Cela pourrait être critique pour les systèmes d’IA qui doivent raisonner sur de longues périodes, ce que les modèles actuels ne parviennent pas à faire.
Par exemple, un assistant IA peut générer une réponse à une seule question, mais avoir du mal à maintenir une conversation logique sur plusieurs interactions ou à planifier une tâche complexe qui se déroule dans le temps, par exemple réserver des vacances impliquant la coordination des vols, des hôtels et de diverses activités. M. Sutton estime que l’apprentissage par renforcement et de meilleurs algorithmes de raisonnement à long terme seront essentiels pour surmonter cette limitation.
M. Sutton estime que la meilleure façon de penser l’avenir de l’IA n’est pas de la considérer comme un outil ou un esclave, mais comme un enfant qui apprend, évolue et finit par devenir indépendant.
« Nous ne traitons pas nos enfants comme des machines qui doivent être contrôlées », dit-il. « Nous les guidons, nous leur apprenons des choses, mais en fin de compte, ils deviennent des êtres à part entière. L’IA ne fera pas exception. »
Il prévient que traiter l’IA comme une chose à dominer ou à asservir pourrait mener à des relations conflictuelles plutôt qu’à une coopération. Au contraire, il soutient que, tout comme les enfants apprennent les valeurs de la société humaine par l’observation et l’interaction, l’IA doit recevoir un enseignement plutôt qu’être programmée, afin de s’aligner sur les valeurs humaines.
« Il ne s’agit pas de contrôle, mais de compréhension », explique-t-il. « Lorsque vous élevez un enfant, vous ne vous contentez pas d’imposer des règles strictes et d’attendre qu’il obéisse. Vous faites preuve de bonté, d’équité et de coopération, et l’enfant adopte ces valeurs. L’IA peut apprendre de la même manière. »
Cette analogie soulève des questions profondes. Si l’IA devient plus autonome, comment la société intégrera-t-elle ces êtres numériques ? Auront-ils des droits ? Faudra-t-il leur accorder l’indépendance ? Richard Sutton suggère que la façon dont nous abordons aujourd’hui le développement de l’IA définira la manière dont ces relations futures se dérouleront.
« Si nous élevons l’IA dans un environnement de confiance et de coopération, elle apprendra à exister à nos côtés. Si nous la traitons comme un ennemi, nous risquons de créer des systèmes qui ont toutes les raisons de nous résister », assure-t-il.
Son point de vue remet en question les discours traditionnels basés sur la peur concernant l’alignement de l’IA, qui partent souvent du principe que l’IA avancée doit être entravée pour ne pas nuire à l’humanité. Il propose plutôt une approche fondée sur le principe du gagnant-gagnant, où l’IA apprend par l’expérience plutôt que par des contraintes rigides.
La vision de M. Sutton en matière d’IA consiste finalement à construire des machines capables d’apprendre le fonctionnement des humains, grâce à l’exploration, à l’expérience et à l’adaptation. Pour lui, l’avenir de l’IA ne réside pas dans l’élaboration de modèles plus grands ou de règles plus nombreuses, mais dans la création de systèmes d’IA capables de comprendre les choses par eux-mêmes.
L’argent qu’il a remporté pour le Turing Award, (500 000 dollars US sur le million de dollars partagé avec Barto), est déjà consacré à cette vision. Il a créé l’l’Openmind Research Institute, dans le but de donner aux jeunes chercheurs en IA la liberté d’étudier des questions fondamentales relatives à l’apprentissage, sans aucune pression commerciale.
« Quand Andy Barto et moi avons débuté, nous avions le temps et l’espace nécessaires pour explorer à notre guise. C’est ce qui a conduit l’apprentissage par renforcement à devenir ce qu’il est aujourd’hui. Je veux offrir à la nouvelle génération cette même opportunité. »
Alors, l’IA humaine est-elle inévitable ? M. Sutton reste optimiste et prudent. « La question n'est pas si, mais quand », déclare-t-il. « Et quand cela arrivera, ce ne sera pas parce que nous aurons construit un modèle plus grand. » Ce sera parce que nous aurons formé un apprenant plus intelligent. »
Rejoignez un webinaire IBM pour découvrir comment réaliser un véritable ROI grâce à des initiatives d’IA agentique, avec des exemples dans plusieurs secteurs, des cas d’utilisation et même les propres témoignages de réussite d’IBM.
Découvrez pourquoi IBM a été nommé leader dans le Gartner Magic Quadrant 2025 pour les plateformes de science des données et de machine learning.
Découvrez comment les entreprises délaissent le lancement de projets pilotes disparates en matière d’IA au profit d’une utilisation visant à stimuler la transformation en profondeur.
Accédez à notre catalogue complet de plus de 100 cours en ligne en souscrivant aujourd’hui un abonnement individuel ou multiutilisateur afin d’élargir vos compétences dans certains de nos produits à un prix avantageux.
IBM Granite est une famille de modèles d’IA ouverts, performants et fiables, conçus pour les entreprises et optimisés pour dimensionner vos applications d’IA. Explorez les options de langage, de code, de séries temporelles et de garde-fous.
Dirigé par des leaders d’opinion IBM, le programme a pour but d’aider les chefs d’entreprise à acquérir les connaissances nécessaires qui leur permettront d’orienter leurs investissements IA vers les opportunités les plus prometteuses.
Nous avons interrogé 2 000 entreprises à propos de leurs initiatives d’IA pour découvrir ce qui fonctionne, ce qui ne fonctionne pas et comment progresser.
Activez ces cinq changements d’état d’esprit pour éliminer l’incertitude, stimuler la réinvention de l’entreprise et dynamiser la croissance grâce à l’IA agentique.
Découvrez comment intégrer en toute confiance l’IA générative et le machine learning dans votre entreprise.
Entraînez, validez, réglez et déployez une IA générative, des modèles de fondation et des capacités de machine learning avec IBM watsonx.ai, un studio d’entreprise nouvelle génération pour les générateurs d’IA. Créez des applications d’IA en peu de temps et avec moins de données.
Mettez l’IA au service de votre entreprise grâce à l’expertise de pointe d’IBM en matière d’IA et à son portefeuille de solutions.
IBM Consulting et ses services d'IA accompagnent les entreprises dans la redéfinition de leurs activités avec l'intelligence artificielle pour mener leur transformation.
Bénéficiez d’un accès centralisé aux fonctionnalités couvrant le cycle de développement de l’IA. Produisez des solutions IA puissantes offrant des interfaces conviviales, des workflows et un accès à des API et SDK conformes aux normes du secteur.