L’idée d’une intelligence générale artificielle (AGI), une IA capable de penser, de raisonner et d’apprendre dans un large éventail de tâches, au même titre qu’un être humain, est depuis longtemps un sujet controversé. Certains experts affirment que l’AGI durera de nombreuses années, alors que d’autres estiment qu’elle relève de l’utopie. D’autres experts affirment que l’AGI n’est pas la voie à suivre. « Nous ne devons pas oublier la puissance de ces modèles dans d’autres domaines non linguistiques », assure Marina Danilevsky, chercheuse principale chez IBM, lors d’un épisode du podcast Mixture of Experts. « Si nous élargissons réellement les domaines dans lesquels cette technologie peut être utilisée, alors nous pouvons aller dans des domaines bien plus intéressants, beaucoup plus pragmatiques, beaucoup plus pratiques... [au lieu de] nous focaliser sur l’AGI. »

M. Sutton adopte une position mesurée. Il estime qu’il y a une chance sur quatre que l’IA atteigne une intelligence de niveau humain d’ici cinq ans et une chance sur 50 % d’ici 15 ans. C’est une prévision étonnamment optimiste comparée à celle de nombreux de ses pairs, qui prédisent souvent que l’IAG n’apparaîtra pas avant plusieurs décennies.

« Des avancées sont encore nécessaires, » reconnaît-il. « Mais on se rapproche. La principale pièce manquante est de savoir comment faire en sorte que les systèmes d’IA tirent des enseignements de leur expérience de manière plus naturelle, au lieu d’être nourris à la cuillère via des jeux de données étiquetés. »

Comme le décrit Richard Sutton, l’un des plus grands défis est d’apprendre à l’IA à comprendre la planification et l’abstraction à long terme, soit la capacité de décomposer des problèmes complexes en morceaux plus petits et gérables, comme le font les humains.

« Si je vous demande de traverser la rue, vous ne pensez pas à chaque petit mouvement musculaire. Vous pensez à l’objectif : traverser la rue. L’IA doit apprendre comme ça, à un niveau d’abstraction plus élevé », explique M. Sutton.

L’une de ses principales contributions à l’apprentissage par renforcement est le concept d’abstraction temporelle, qui permet à l’IA d’apprendre par étapes plutôt que de s’enliser dans la microgestion. Cela pourrait être critique pour les systèmes d’IA qui doivent raisonner sur de longues périodes, ce que les modèles actuels ne parviennent pas à faire.

Par exemple, un assistant IA peut générer une réponse à une seule question, mais avoir du mal à maintenir une conversation logique sur plusieurs interactions ou à planifier une tâche complexe qui se déroule dans le temps, par exemple réserver des vacances impliquant la coordination des vols, des hôtels et de diverses activités. M. Sutton estime que l’apprentissage par renforcement et de meilleurs algorithmes de raisonnement à long terme seront essentiels pour surmonter cette limitation.