Dans la course à la maîtrise de l’IA, les choses plus grandes sont généralement meilleures. Plus de données et plus de paramètres permettent de créer des systèmes d’IA plus importants, qui sont non seulement plus puissants, mais aussi plus efficaces et plus rapides, et qui génèrent généralement moins d’erreurs que les systèmes plus petits.

Les entreprises technologiques qui font la une des journaux renforcent cette tendance. « Le système que nous venons de déployer est, en termes d’échelle, à peu près aussi gros qu’une baleine », a déclaré Kevin Scott, directeur technique de Microsoft, à propos du superordinateur qui alimente Chat GPT-5. Scott discutait de la dernière version du chatbot d’IA générative d’Open AI lors de l’événement Build organisé par l’entreprise à la fin du mois de mai. « Et il s’avère que vous pouvez créer un tas d’IA avec un superordinateur de la taille d’une baleine. »

Par ailleurs, la capitalisation boursière de Nvidia a atteint la barre des 3 000 milliards de dollars en juin. Le fabricant de puces connaît une croissance vertigineuse alors que ses puces alimentent des modèles de langage volumineux, des superordinateurs et les centres de données qui se multiplient dans le monde.

Mais les choses plus grandes sont-elles toujours meilleures ? Ceci dépend de votre point de vue. Pour les entreprises qui développent de grands modèles linguistiques, l'échelle est un avantage dans la plupart des cas. Mais alors que les entreprises cherchent à éloigner le battage médiatique des cas où l'IA peut apporter une véritable valeur ajoutée, il n'est pas sûr que des modèles de langage de plus en plus ouverts conduiront toujours à de meilleures solutions pour les entreprises.

À l’avenir, « nous n’aurons plus besoin de modèles 100 fois supérieurs à ceux que nous avons aujourd’hui pour en tirer le meilleur parti », a déclaré Kate Soule, directrice du programme de recherche en IA générative d’IBM dans un épisode récent du podcast Mixture of Experts d’IBM. De nombreuses entreprises qui obtiennent déjà un retour sur leurs investissements dans l’IA l’utilisent pour des tâches telles que la classification et la synthèse, qui n’utilisent même pas toutes les capacités des modèles linguistiques actuels.