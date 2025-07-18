Lors de son lancement le 20 janvier, DeepSeek-R1, un modèle de raisonnement d’IA puissant mais économique, a électrisé la Silicon Valley et Wall Street. Pourquoi ? Car il pouvait raisonner aussi bien que les modèles de pointe comme OpenAI et Anthropic, en utilisant beaucoup moins de ressources de calcul et se montrant peu cher à entraîner et à utiliser. Le mois dernier seulement, le modèle a été téléchargé plus de 800 000 fois sur Hugging Face.
« Ça a été un déclic », se souvient Larry Li, fondateur et associé gérant de la société d’investissement AMINO Capital, basée à Palo Alto, lors d’un récent entretien avec IBM Think. Les nouvelles technologies font souvent l’objet d’une « rétro-ingénierie », explique le fondateur. « Mais personne ne s’attendait à ce que cela soit si bien fait. »
« Il s’agissait simplement de changer le récit selon lequel les États-Unis sont le seul endroit au monde où l’on peut innover », souligne Matthieu Soulé, responsable du C.Lab de Cathay Innovation, un fonds qui investit dans l’innovation en IA à travers l’UE et l’Asie, y compris la Chine.
Nombreux sont ceux qui ont prédit que le succès de DeepSeek révolutionnerait les secteurs et, plus largement, la course mondiale à l’IA. Six mois plus tard, nous avons voulu faire le point et voir si tout cela s’était vraiment passé.
Nous avons discuté avec certains des mêmes experts que nous avons interviewés dans les heures suivant la sortie de DeepSeek-R1, ainsi qu’avec plusieurs autres experts pour obtenir une vision globale.
Dans les jours qui ont suivi la sortie de DeepSeek-R1, beaucoup ont exprimé des doutes quant à savoir si l’entreprise avait précisément calculé et rapporté les coûts complets, pas seulement l’entraînement du modèle presque final, les composants qu’elle avait utilisés et de quelles entreprises ils provenaient. En d’autres termes, avait-elle vraiment fait quelque chose de révolutionnaire, ou s’agissait-il de progrès progressifs ?
Certains, comme Kaoutar El Maghraoui, chercheuse principale d’IBM, pensent que la véritable innovation réside peut-être dans ce qu’ils appellent « l’efficacité architecturale » ou la combinaison de techniques telles que « la combinaison d’experts, une stratégie d’apprentissage par renforcement, la coconception matériel-logiciel et diverses autres astuces d’optimisation. Il s’agit surtout d’une mise en œuvre intelligente et efficace de techniques déjà existantes », a-t-elle déclaré lors d’un récent entretien avec IBM Think.
Néanmoins, tous les experts s’accordent à dire que DeepSeek-R1 a bouleversé l’environnement mondial de l’IA sur plusieurs points clés. D’abord, beaucoup pensaient que les entreprises américaines d’IA disposaient d’une « avancée » ou d’une avance qu’il serait quasiment impossible de rattraper. DeepSeek a réfuté cette hypothèse en réduisant les obstacles qui empêchaient les développeurs et les petites entreprises d’accéder aux outils nécessaires pour développer leurs propres LLM.
« Les développeurs et les utilisateurs ont désormais accès au même type de fonctionnalités que l’o1 d’OpenAI pour une fraction du prix », a déclaré Abraham Daniels, chef de produit technique senior chez IBM, lors d’un entretien.
Le fait que DeepSeek ait mis ses modèles en libre accès a joué un rôle important dans l’amélioration de l’accessibilité. « Nous avons constaté un regain d’intérêt pour l’open source depuis DeepSeek et notre contribution à l’AI Alliance », a déclaré Anthony Annunziata, directeur de la stratégie ouverte en matière d’IA chez IBM et l’AI Alliance. L’AI Alliance est un réseau international d’entreprises et d’organisations œuvrant à créer une IA ouverte et sûre, fondée par IBM et Meta.
« En Europe, au Vietnam, en Inde et au Japon, vous avez toutes ces entreprises d’IA régionales qui veulent s’assurer qu’elles conservent le contrôle souverain de leur intelligence artificielle, qu’elles peuvent la façonner comme elles le souhaitent pour répondre à leurs besoins culturels, sociétaux et économiques, qui sont différents de ceux des États-Unis et d’autres pays », souligne Anthony Annunziata.
La protection de la recherche nationale en IA est une priorité absolue. « Il existe une véritable montée de la souveraineté numérique, où les gouvernements tentent de déterminer comment éviter l’influence étrangère de l’IA », révèle Kaoutar El Maghroui.
La création de LLM basés sur les langues locales motive de nombreux entrepreneurs. « L’IA se dirige vers une situation où, en tant que service public, chaque pays ou région souhaite disposer de son propre modèle de langage pour au moins avoir son mot à dire en termes d’influence sur le comportement », a déclaré Larry Li.
Le Japon, par exemple, a récemment promulgué l’AI Promotion Act pour soutenir notamment la promotion de cette technologie. Fin juin, l’AI Alliance a lancé un nouveau chapitre au Japon pour se concentrer sur deux domaines d’intérêt majeurs pour les entrepreneurs locaux : la souveraineté de l’IA et l’IA dans la fabrication. La langue joue un rôle important dans le contrôle des systèmes d’IA. Fin 2024, par exemple, un groupe de plus de 1 500 chercheurs universitaires et du secteur se sont réunis pour développer des modèles en langue japonaise solides et ouverts.
De nombreux modèles d’IA et d’entrepreneurs locaux privilégient également les intérêts économiques locaux. Dans le cas du Japon, de nombreuses entreprises qui ont rejoint l’AI Alliance, dont Mitsubishi Electric et Panasonic, développent des modèles d’IA ciblés sur des applications industrielles et de fabrication, un segment particulièrement important de l’économie du Japon.
À l’inverse, il existe aussi un appétit croissant pour les modèles locaux, révèle Daisuke Okanohara, directeur technique et cofondateur de Preferred Networks, une entreprise japonaise de matériel et de logiciels qui développe des logiciels avancés utilisant l’apprentissage profond et l’IA. En mai, Preferred Networks a lancé la deuxième version de PLaMo, un modèle compact pouvant être exécuté sur site et entraîné en japonais et en anglais.
« Ses performances ne sont globalement pas aussi compétitives que celles des modèles frontières, mais il excelle dans certaines tâches spécifiques, souligne le directeur technique lors d’une interview accordée à IBM Think. Dans les cas d’utilisation de petits modèles, tels que les modèles comportant de 8 à 30 milliards de paramètres, il surpasse CLANG, GPT-4o mini et les modèles similaires dans de nombreuses tâches en japonais. »
Le Vietnam a également connu une vague d’activités de LLM entrepreneuriales, et l’AI Alliance y a ouvert un chapitre en juin de cette année. Outre le développement d’un modèle de langage vietnamien, les entrepreneurs se concentrent sur l’utilisation de modèles d’IA pour développer de nouveaux types de puces destinées à alimenter l’IA, selon Anthony Annunziata.
Une autre raison pour laquelle DeepSeek a inspiré tant d’entrepreneurs locaux est le fait que plusieurs pays ont interdit ou restreint l’utilisation de DeepSeek-R1, en invoquant des problèmes de sécurité et de confidentialité. L’Italie, l’Australie, la Corée du Sud et le Canada ont interdit DeepSeek, et l’accès a également été restreint dans plusieurs États américains, en particulier sur les sites gouvernementaux. Cela a eu un effet d’entraînement intéressant et a motivé les entrepreneurs locaux à utiliser des outils open source afin de créer des modèles plus sécurisés pouvant être utilisés dans leurs zones géographiques spécifiques.
01.AI la dernière société technologique de Kai-Fu Lee, cofondateur et entrepreneur technologique, souhaite parcourir le marché B2B de l’IA d’entreprise, un secteur notoirement difficile en Chine, où la moitié des entreprises sont détenues par l’État et où les grandes entreprises privées peuvent tomber sous l’influence du gouvernement à mesure qu’elles se développent. Kai-Fu Lee avait déjà lancé Rhymes AI, une entreprise qui a lancé plusieurs produits à l’automne dernier, dont un moteur de recherche et Allegro, un modèle de génération de vidéos open source.
« Nous adoptons une approche pragmatique : les modèles sont vraiment suffisamment performants. Cependant, ils ne sont toujours pas faciles à utiliser pour de nombreuses entreprises, et c’est le problème que nous essayons de résoudre, a déclaré Anita Huang, cofondatrice de 01.AI, dans un entretien avec IBM Think. Nous pensons que la pièce manquante, notamment pour le marché des entreprises chinoises, est cette couche intermédiaire qui devient le modèle de langage Windows ou le modèle de langage étendu. » Actuellement, la plateforme d’entreprise utilise des modèles tels que DeepSeek et Qwen d’Alibaba.
Dans le sillage immédiat de DeepSeek, beaucoup ont prédit que le modèle avait ouvert la voie à la domination du raisonnement par chaîne de pensée. Depuis, le secteur a évolué. De nouvelles recherches ont montré que les modèles de raisonnement sont coûteux et gourmands en ressources, et qu’ils ne sont pas nécessaires pour de nombreuses tâches lorsque l’on recherche une fonctionnalité de ces modèles.
Le plus grand sujet tendance a peut-être été l’adoption de DeepSeek par les entreprises, compte tenu de ses faibles coûts de licence (il était concédé sous licence via la licence permissive MIT).
« En réalité, l’adoption par les entreprises reste très limitée, principalement en raison du manque de garanties en matière de confidentialité des données, de conformité, de gouvernance et de sécurité », révèle Kaoutar El Maghraoui.
La plupart des entreprises, du moins aux États-Unis, se contentent de fournisseurs qui proposent des solutions gérées ou vérifiables.
Donc, même si le fait que « les gens voient que les innovations viennent de sources surprenantes » est une bonne chose, pour Anthony Annunziata, l’ensemble du secteur de l’IA et le marché en général n’ont pas évolué comme certains l’avaient prédit. Au lieu de cela, « les entreprises open source ont redoublé d’efforts sur l’open source, et les grands acteurs se concentrent sur l’acquisition de talents, encore plus sur l’acquisition de concurrents ou l’affaiblissement, et ils investissent de plus en plus d’argent dans leurs modèles. »
En fin de compte, le plus grand héritage de DeepSeek est peut-être de plaider en faveur de petits modèles adaptés à l’usage, ajoute Abraham Daniels.
« DeepSeek a donné le départ de la course à l’IA et a fait des petits modèles de langage le nouveau champ de bataille. Très performants, les petits modèles de langage pourraient être entraînés plus efficacement que vos grands modèles et pourraient mieux adresser les cas d’utilisation en entreprise. »
Les agents d’IA, des systèmes d’IA autonomes capables de raisonner, de planifier et d’exécuter des tâches, ont explosé dans les entreprises en 2025 et constituent un cas d’utilisation. Les modèles plus petits sont souvent mieux adaptés aux systèmes d’IA agentique car ils sont plus efficaces, nécessitent moins de ressources et peuvent être adaptés à des tâches spécifiques.
Comme l’a indiqué Chris Hay, ingénieur émérite chez IBM, dans un récent épisode de Mixture of Experts : « Quand vous voulez exécuter des agents, vous voulez que vos modèles soient petits, rapides et légers. »
