Les derniers modèles o1-preview d'OpenAI s'attaquent à des problèmes complexes en les décomposant en étapes, ce qui pourrait changer la façon dont les industries abordent les défis.
Cette approche, connue sous le nom de chaîne de pensées, marque un changement important par rapport aux modèles d'IA qui produisaient souvent des réponses sans expliquer leur raisonnement. Ces avancées pourraient transformer la manière dont les entreprises et les chercheurs abordent les tâches complexes de résolution de problèmes.
« Ces modèles sont plus efficaces pour les tâches nécessitant plus de logique et de raisonnement, car il faut du temps pour réfléchir au problème », explique Chris Hay, ingénieur émérite d'IBM. « C’est comme s’ils montraient leur travail, étape par étape. »
L'approche par chaîne de pensées permet aux utilisateurs de comprendre comment l'IA parvient à ses conclusions. M. Hay a expliqué le processus : « Si vous demandez à un enfant, par exemple, combien font 25 multiplié par 10 plus cinq, il y a trois étapes à suivre. Il se peut qu'il donne une réponse imprécise. Cependant, vous lui répondez : « Non, non, tu dois décomposer le calcul... c'est comme à l'école, tu dois m'expliquer. »
Nathalie Baracaldo, chercheuse scientifique senior en sécurité IA chez IBM, a souligné l'importance de cette avancée : « La principale différence réside dans la manière dont nous pouvons comprendre comment le modèle est parvenu à une décision. Nous disposons d'explications sur les actions de l'agent qui sont très utiles pour comprendre pourquoi quelque chose s'est produit. »
Ce niveau de transparence pourrait avoir des répercussions considérables dans divers secteurs. Dans le domaine du développement de logiciels, par exemple, les modèles montrent de meilleures capacités de codage avec moins d'erreurs. M. Hay souligne que : « Ils codent mieux et hallucinent moins », faisant référence aux cas où l'IA produit des informations plausibles mais incorrectes.
Les nouveaux modèles intègrent également l’apprentissage par renforcement dans leur processus d’entraînement. M. Hay a expliqué : « Ils ont également modifié la façon dont ils sont formés dans les modèles de base. Ils expliquent comment ils utilisent l'apprentissage par renforcement... pour enseigner et entraîner ces modèles. »
L’utilisation la plus efficace de ces modèles d’IA avancés impliquera probablement un partenariat entre l’expertise humaine et les capacités des machines. « L'être humain devra toujours apporter sa contribution, approuver la planification et vérifier ces éléments », a déclaré M. Hay.
M. Hay a mis en garde contre une surestimation des capacités des modèles : « Je pense que l'on peut obtenir d'excellents résultats. Je pense que lorsque les gens entendent les mots « AGI », ils imaginent une grande tête pulsante dans les nuages... En réalité, si j'y réfléchis bien, les modèles, tels qu'ils sont, avec leur prédiction du prochain token, leurs bonnes données d'entraînement, leur planification, etc., font un travail remarquable, meilleur que celui des humains dans de nombreuses tâches. »
Le développement de ces modèles soulève des questions sur la nature de l'intelligence artificielle et sa comparaison avec la cognition humaine. Les nouveaux modèles ont démontré des capacités remarquables dans certains domaines, surpassant les humains dans des tests standardisés tels que l'examen du barreau et les SAT. Pourtant, ils ont encore du mal à accomplir des tâches que la plupart des humains trouvent intuitives.
M. Hay a souligné que les modèles peuvent avoir des difficultés avec des tâches que les humains trouvent simples : « Le modèle excelle dans des tâches spécifiques et individuelles. Cependant, il a actuellement du mal à faire la distinction entre les différentes parties d’une conversation. Cela crée de la confusion quant à sa capacité à gérer plusieurs concepts simultanément. Le modèle met trop l'accent sur le contexte, prenant souvent en compte trop d'informations non pertinentes lors du traitement des demandes. »
Mme Baracaldo a ajouté une mise en garde : « Même si ce modèle est extrêmement impressionnant, il lui arrive parfois de commettre des erreurs. » Et si vous lisez le rapport technique, parfois cela crée des solutions qu’un expert, un être humain, jugera irréalisables, mais le modèle ne connaît pas toutes les hypothèses. »
Les implications de ces avancées dépassent le secteur technologique. Dans les domaines de la recherche et de l'enseignement supérieur, ils pourraient accélérer le rythme des découvertes en facilitant l'analyse de données complexes et la formulation d'hypothèses. Dans des domaines tels que la médecine et le droit, ils peuvent servir d’outils pour renforcer l’expertise humaine, conduisant potentiellement à des diagnostics plus précis ou à des analyses juridiques plus complètes.
M. Hay a résumé la valeur pratique des nouveaux modèles pour les entreprises : « Ils sont de bien meilleurs codeurs qu'auparavant. »