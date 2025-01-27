DeepSeek-R1, le modèle d’IA de la startup chinoise DeepSeek, a grimpé en tête des classements des modèles les plus téléchargés et actifs sur la plateforme open source d’IA Hugging Face, quelques heures après son lancement la semaine dernière. Cela a également provoqué une onde de choc sur les marchés financiers en promptant les investisseurs à reconsidérer la valorisation des fabricants de puces comme NVIDIA et les investissements colossaux que les géants américains de l’IA réalisent pour développer leurs activités dans ce domaine.

Pourquoi tout ce buzz ? DeepSeek-R1, un « modèle de raisonnement », est un assistant numérique qui affiche des performances équivalentes à celles de l'o1 d'OpenAI sur certains benchmarks d'IA pour les tâches mathématiques et de codage. Il a été formé avec beaucoup moins de puces et son utilisation est environ 96 % moins coûteuse, selon la société.

« DeepSeek est définitivement en train de remodeler l’environnement de l’IA, en défiant les géants dotés d’ambitions open source et d’innovations de pointe », déclare Kaoutar El Maghraoui, scientifique de recherche principale et responsable chez IBM.

Parallèlement, ByteDance, le géant technologique chinois propriétaire de TikTok, a récemment annoncé son propre agent de raisonnement, UI-TARS, qui, selon lui, surpasse GPT-4o d'OpenAI, Claude d'Anthropic et Gemini de Google sur certains tests de référence. L'agent de ByteDance peut lire des interfaces graphiques, raisonner et prendre des mesures autonomes, étape par étape.

Des startups aux géants établis, les sociétés d’IA chinoises semblent combler l’écart par rapport à leurs concurrents américains, en grande partie grâce à leur volonté d’open source ou de partager le code logiciel sous-jacent avec d’autres entreprises et développeurs de logiciels. « DeepSeek a su multiplier des modèles assez puissants au sein de la communauté », déclare Abraham Daniels, chef de produit technique senior pour le modèle Granite d’IBM. DeepSeek-R1 est proposé sur Hugging Face sous une licence MIT qui autorise une utilisation commerciale sans restriction. « DeepSeek pourrait vraiment accélérer la démocratisation de l’IA », explique-t-il.

L'été dernier, la société chinoise Kuaishou a présenté un outil de génération de vidéos similaire à Sora d'OpenAI, mais accessible au public dès son lancement. Sora a été dévoilé en février dernier, mais n'a été pleinement lancé qu'en décembre et, même alors, seuls les détenteurs d'un abonnement ChatGPT Pro pouvaient accéder à toutes ses fonctionnalités. Les développeurs de Hugging Face ont également mis la main sur de nouveaux modèles open source proposés par les géants technologiques chinois Tencent et Alibaba. Alors que Meta a ouvert ses modèles Llama sous licence open source, OpenAI et Google ont adopté une approche essentiellement fermée pour le développement de leurs modèles.

Outre les avantages de l'open source, les ingénieurs de DeepSeek n'ont utilisé qu'une fraction des puces NVIDIA hautement spécialisées utilisées par leurs concurrents américains pour former leurs systèmes. Les ingénieurs de DeepSeek ont par exemple déclaré n'avoir eu besoin que de 2 000 GPU (processeurs graphiques), ou puces, pour entraîner leur modèle DeepSeek-V3, selon un article de recherche publié lors du lancement du modèle.