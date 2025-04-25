Benchmarks, coûts d'inférence, innovation : comment l'IA remodèle notre société de référence ? Cette année, le rapport sur l'indice d'IA 2025 de Stanford a ajouté de nouveaux domaines de couverture afin de refléter le rôle croissant de l'IA dans tous les aspects de notre vie.
IBM Think a dévoilé certaines tendances clés dans ce rapport avec Vanessa Parli, directrice des programmes de recherche à l'Institut pour l'intelligence artificielle centrée sur l'humain de Stanford, et Ash Minhas, Content Manager chez IBM.
Sujet d'actualité, s'il y en a un, les benchmarks sont devenus au cœur du débat maintenant que les capacités de l'IA évoluent si rapidement qu'elles devancent de plus en plus les outils utilisés pour les mesurer.
« Chaque année, nous examinons les performances de ces algorithmes par rapport aux différents indices de référence, et chaque année, il semble qu’ils les devancent », explique Vanessa Parli, l’une des autrices du rapport, lors d’un entretien avec IBM Think. « De même, cette année, ceci se produit même avec les nouveaux critères de référence. »
Le rapport a noté qu’en 2023, les chercheurs ont introduit de nouveaux benchmarks de référence —MMMU, GPQA et SWE-bench— pour tester les limites des systèmes d’IA avancés. À peine un an plus tard, les performances ont fortement augmenté : les scores ont augmenté de 18,8, 48,9 et 67,3 points de pourcentage respectivement sur MMMU, GPQA et SWE-Bench, selon le rapport.
Ceci soulève une ambiguïté au sein de la communauté de recherche sur la signification et la valeur réelles d’une référence LLM. Mme Parli pose des questions critiques : « Est-ce que nous mesurons la bonne chose ? Ces indices de référence sont-ils compromis ? Et comment la communauté scientifique devrait-elle évaluer les modèles ? »
En pensant à l'avenir, Ash Minhas s'interroge également sur ce que sera l'avenir du benchmarking. « Où cela va-t-il s’arrêter ? », demande-t-il dans une interview accordée à IBM Think. « Le test de Turing devra-t-il constamment être un poste d’objectif en mouvement ? Le dernier examen de l’humanité est-il vraiment le dernier examen ? »
Par ailleurs, les experts mettent en garde contre le risque de surajustement, un phénomène dans lequel un modèle IA a appris à réaliser des performances exceptionnelles lors de tests de référence spécifiques, mais ne parvient pas à s'adapter à de nouvelles données inédites dans les applications du monde réel. « Sommes-nous simplement en train d’entraîner le modèle à atteindre le seuil de référence ? », ajoute-t-il. « MMMU est un bon de référence, mais est-ce parce que le modèle sait comment y répondre ? »
M. Minhas met également en garde contre le fait que l'enthousiasme et l'élan du progrès pourraient prendre le pas sur les questions d'éthique, d'équité et de partialité.
Avec les prix Nobel de physique et de chimie décernés l’an dernier à des chercheurs travaillant sur les réseaux de neurones artificiels ainsi que sur la conception et la prédiction des protéines, il est difficile de négliger l’importance du rôle croissant de l’IA dans le domaine médical. Le rapport note que le nombre de dispositifs médicaux approuvés par la FDA et compatibles avec l’IA a augmenté de façon exponentielle : en 2023, 223 ont été approuvés, contre seulement six en 2015.
« Ce domaine dans lequel l'IA améliore les découvertes scientifiques peut avoir un impact important sur notre société », explique Mme Parli.
Selon M. Minhas, cette croissance témoigne de la rapidité de l'innovation, mais soulève également des questions : « Avons-nous les bons experts et les bonnes compétences pour tester ces nouveaux appareils et produits ? »
L'IA a joué un rôle clé dans les investissements majeurs réalisés en 2024. Le nombre de startups d'IA générative nouvellement financées a presque triplé, et après des années d'adoption lente, l'adoption par les entreprises s'est considérablement accélérée en 2024, selon le rapport.
L'IA est passée des marges pour devenir un pilote central de la valeur métier. Le total des investissements des entreprises dans l’IA a atteint 252,3 milliards de dollars en 2024, l’investissement privé ayant bondi de 44,5 % et les fusions et acquisitions ayant augmenté de 12,1 % par rapport à l’année précédente. Cela se traduit par un écosystème de startups florissant aux États-Unis, où les investissements privés dans l'IA atteindront 109,1 milliards d'USD en 2024.
Au travail, l'IA est également un acteur majeur, et nombreux sont ceux qui anticipent l'impact de l'IA sur les workflows de l'entreprise
Cependant, les entreprises déplacent à un rythme différent de l'innovation. « La technologie progresse, mais les personnes et les processus ont besoin de temps pour changer », explique Minhas.
L'impact de l'IA sur le retour sur investissement reste discutable, selon lui. « On ne comprend pas encore bien les avantages économiques », déclare Minhas. « Personne ne s’accorde sur le retour sur investissement et personne ne le sait vraiment. »
Le rapport soulignait que les pays du monde entier augmentaient également leurs investissements dans les infrastructures et, bien entendu, la publication de modèles puissants en provenance de Chine montre que les avancées américaines ne doivent pas être considérées comme acquises.
« Je ne pense pas que nous puissions tenir pour acquis que les États-Unis figureront toujours en tête de ces classements, et nous devons continuer à Think aux composants de l'IA : le calcul, les talents, les données », explique Mme Parli. « Nous devrions continuer à investir si nous voulons maintenir le leadership en innovation que nous avons eu par le passé, et nous assurer d’avoir les bons ingrédients pour y parvenir. »
Néanmoins, le rapport met en évidence une autre tendance intéressante, voire contradictoire : les pays qui investissent le plus dans l’IA, comme les États-Unis, expriment plus de sceptisme à l’égard des produits et services d’IA que les pays dont le budget technologique en matière d’IA est plus limité.
Selon les chiffres publiés dans le rapport, 80 % des personnes sondées en Indonésie estiment que les produits d’IA sont plus bénéfiques que nuisibles, contre seulement 39 % aux États-Unis.
« Dans plusieurs pays, l’IA permet d’accéder à des ressources, [comme] les soins de santé, par exemple, et je pense que nous serons probablement plus optimistes quant à l’IA et aux différences culturelles, » explique Parli. « Il existe également des différences culturelles concernant des questions telles que la vie privée, la sécurité et la confidentialité des données. »
Enfin, l’IA sera plus présente dans l’espace physique.
Le rapport a révélé qu'entre 2013 et 2023, le nombre de robots industriels installés dans le monde a presque triplé, avec 541 000 installés en 2023.
« Grâce à certains outils d’IA qui permettent de dialoguer avec le robot en langage naturel et d’utiliser le mouvement, explique Parli, on peut travailler beaucoup plus étroitement avec les robots et collaborer plus facilement avec eux. » Je vois la santé comme un domaine où la robotique ira plus loin. »
