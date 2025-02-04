Même si les progrès facilitent l’élaboration de grands modèles d’IA, un défi plus important demeure : l’énorme puissance de calcul nécessaire pour rester compétitif. Xia « Ben » Hu, professeur agrégé d’informatique à l’université Rice, reconnaît que DeepSeek constitue une étape plus efficace dans le développement de l’IA. Il note toutefois que cela ne modifie pas fondamentalement la dynamique globale du pouvoir dans les infrastructures d’IA, où l’accès à de vastes ressources informatiques permet toujours de déterminer qui mène la course.

« DeepSeek est soutenu par un grand fonds de capital-risque en Chine, et a accès à des dizaines de milliers de GPU, explique Ben Hu. Cela reste un obstacle majeur pour de nombreuses petites start-ups. »

Toutefois, le professeur prédit que l’évolution la plus importante concernera probablement l’adoption de l’IA par les entreprises. « Les secteurs traditionnels, comme le pétrole et le gaz ou l’industrie manufacturière, ont hésité à développer leurs propres solutions d’IA. Avec la baisse des coûts et l’amélioration des modèles open source, les entreprises qui dépendaient autrefois de services d’IA externes envisagent désormais de développer des modèles internes adaptés à leurs besoins spécifiques. »

Les implications vont au-delà d’un seul modèle. Avec la multiplication des projets d’IA open source, les petites start-ups peuvent désormais accéder à des outils qui nécessitaient autrefois des centres de données et des budgets considérables. David Cox explique qu’OpenAI et ses homologues projettent depuis longtemps « un air d’inévitabilité », à savoir que seuls ceux qui ont les poches bien garnies peuvent mener en matière d’IA. Mais avec l’émergence de DeepSeek et d’autres modèles, cette notion commence à se fissurer.

« Nous assistons à une évolution qui permet à un éventail beaucoup plus large d’acteurs d’être compétitifs dans ce domaine, affirme David Cox. Personne avec 5 millions de dollars ne peut déployer et construire un modèle de premier plan du jour au lendemain. Mais les start-ups bien financées et les entreprises de taille moyenne ? Absolument. »

Les chercheurs se concentrent également sur l’efficacité plutôt que sur la puissance de calcul brute. David Cox et son équipe de recherche se sont concentrés sur l’approche de Mixture of Experts, qui permet à l’IA d’être plus sélective dans la manière dont elle utilise les ressources de traitement.

« Mixture of Experts n’est qu’une pièce du puzzle ; il y en a beaucoup d’autres à venir », souligne-t-il, suggérant que l’avenir de l’IA pourrait moins dépendre de l’accès à des puces avancées et plus de façons plus intelligentes d’utiliser le matériel existant.

Prasanna Sattigeri a mis en avant l’une de ces innovations : l’essor des données synthétiques, c’est-à-dire des informations générées artificiellement qui imitent des données réelles. « Avec des modèles tels que DeepSeek, nous assistons à une évolution vers l’utilisation de données synthétiques générées par l’IA pour affiner et entraîner les modèles de manière plus efficace, a-t-il déclaré. Cela pourrait réduire considérablement les coûts et rendre une IA de haute qualité accessible à un plus grand nombre d’acteurs. »

L’accessibilité croissante du développement de l’IA soulève de nouvelles questions sur l’avenir de la concurrence. L’infrastructure et la puissance de calcul détermineront-elles toujours les vainqueurs, ou la capacité d’innover deviendra-t-elle rapidement l’actif le plus précieux ? Selon David Cox, c’est un mélange des deux.

« Vous avez toujours besoin d’une infrastructure sérieuse, de grands talents, mais les douves d’OpenAI et de Google ne sont pas aussi profondes qu’ils aimeraient le faire croire, affirme-t-il. Dans ce domaine, les secrets ne restent pas secrets. Les idées se répandent et les gens se déplacent. Nous constatons une convergence rapide. »

Ben Hu ajoute que le développement de l’IA nécessitait encore quatre composants critiques : « J’appelle cela le modèle ABCD : algorithmes, big data, calcul et distribution. Les meilleures entreprises d’IA possèdent les quatre. DeepSeek commence à se faire une place dans les deux premiers domaines, mais la puissance de calcul et la distribution restent un atout majeur pour les acteurs principaux. »