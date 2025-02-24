De nos jours, il semble que presque tous les géants de la technologie développent leurs propres puces en silicium personnalisées ou envisagent d’acquérir des fabricants de puces existants. Pourquoi ? Alors que le nombre de puces nécessaires pour alimenter une gamme vertigineuse d’applications d’IA explose, la production interne de puces peut réduire les coûts et améliorer les performances des systèmes d’IA, explique Shobhit Varshney, vice-président et associé principal chez IBM Consulting.
« Lorsque vous optimisez l’architecture du matériel pour qu’elle fonctionne avec l’architecture du logiciel, cela fait des merveilles, explique-t-il dans un épisode récent du podcast Mixture of Experts d’IBM. Cela réduit le coût total et la latence tout en augmentant le débit. »
En produisant leurs puces en interne, les entreprises réduisent également leur dépendance vis-à-vis du fabricant de puces NVIDIA, qui contrôle environ 70 à 95 % du marché des puces d’IA. Mais ce n’est pas tout, explique Kaoutar El Maghraoui, chercheuse principale et responsable chez IBM Research, dans une interview accordée à IBM Think. Réduire la dépendance vis-à-vis de NVIDIA ne fait que déplacer « le centre du pouvoir d’un géant à un autre », explique-t-elle.
Même si les entreprises prennent davantage le contrôle du processus de conception, dominé ces dernières années par NVIDIA, elles resteront fortement dépendantes de Taiwan Semiconductor Manufacturing Company Limited (TSMC), explique M. Varshney. TSMC fabrique la majorité des puces d’IA dans le monde pour une large gamme d’applications, des smartphones aux équipements militaires.
TSMC est le « poids lourd du secteur, explique M. Varshney. Tout le monde conçoit des puces, mais TSMC est actuellement le cœur de toute l’industrie. »
La course aux puces électroniques dans la Silicon Valley a commencé bien avant que les applications d’IA générative ne stimulent l’appétit des entreprises technologiques pour celles-ci. En 2015, le système d’IA AlphaGo de Google, alimenté par une puce conçue par Google appelée unité de traitement tensoriel (TPU), a battu un joueur professionnel humain au jeu chinois ancestral de go. Depuis, Google a dévoilé une série de puces conçues en interne pour alimenter les systèmes d’IA de ses centres de données. Plus récemment, en décembre 2024, Google a annoncé une nouvelle puce d’IA pour l’informatique quantique, baptisée Willow. Selon l’entreprise, Willow peut effectuer un calcul de référence standard en moins de 5 minutes, alors qu’il faudrait 10 septillions, soit 1025 années, à l’un des supercalculateurs les plus rapides actuels pour y parvenir.
À peu près au moment où Google lançait AlphaGo, les chercheurs d’IBM ont également commencé à s’intéresser à la construction de matériel d’IA. En 2021, IBM a ouvert son centre de matériel d’IA à Albany, dans l’État de New York, afin de créer un écosystème matériel-logiciel IA plus large. En 2022, la nouvelle puce microprocesseur Telum d’IBM a permis d’intégrer l’inférence IA à IBM Z, les mainframes qui traitent environ 70 % des transactions mondiales en valeur. Fin 2024, IBM a annoncé une nouvelle puce d’accélération Spyre, qui a apporté l’IA générative aux mainframes IBM Z pour les utilisateurs professionnels.
Parallèlement, AWS travaille sur ses propres puces informatiques pour des projets d’IA depuis au moins 2018. Avance rapide jusqu’à l’événement annuel 2024 d’AWS, où Amazon a annoncé sa dernière puce d’IA personnalisée Trainium3, qu’elle propose à ses clients en association avec les grands modèles de langage de son partenaire Anthropic. De nombreuses entreprises se sont précipitées sur les puces d’IA d’AWS, notamment Apple, qui a attiré l’attention lors de l’AWS 2024, car c’était l’un des rares moments où Apple a évoqué l’un de ses fournisseurs.
Pour ne pas être en reste, Microsoft, qui fabrique depuis des années des puces pour alimenter ses fonctions de jeu, a annoncé ses propres puces d’IA personnalisées en 2023, à peu près au moment où le géant technologique Meta a annoncé ses propres projets de puces en silicium. OpenAI est le dernier à rejoindre le groupe des fabricants de puces personnalisées, bien qu’il n’ait encore fait aucune annonce officielle. Si aucun détail n’ait été rendu public, Reuters a rapporté au début du mois qu’OpenAI finalisait la conception de ses puces et prévoyait de commencer à les fabriquer via TSMC en 2025.
Pourquoi la course aux puces s’est-elle intensifiée récemment ? Selon M. Varshney d’IBM, lorsque les entreprises peuvent personnaliser des puces en fonction de modèles de langage spécifiques pour les cas d’utilisation dont elles ont besoin, elles peuvent réduire leurs coûts, améliorer la latence ou accélérer le transfert de données d’un réseau à un autre. Il cite un exemple : historiquement, lorsque les entreprises détectaient les fraudes et examinaient les factures entrantes, elles utilisaient des techniques informatiques classiques car le volume était élevé et elles avaient besoin d’une latence très rapide. « Elles devaient également le faire un million de fois par jour, ce qui entraînait une augmentation très rapide des coûts », explique M. Varshney.
Maintenant que les entreprises peuvent optimiser leurs puces pour des modèles spécifiques, le coût des cas d’utilisation à haut volume diminue et il devient plus rentable d’employer ces solutions dans la production à grande échelle. « Du point de vue de l’entreprise, les cas d’utilisation ne changent pas, explique M. Varshney. Mais nous commençons désormais à nous intéresser aux cas à volume élevé pour lesquels le retour sur investissement était auparavant inexistant. »
Étant donné que de plus en plus d’entreprises technologiques conçoivent leurs puces en interne, comment TSMC conserve-t-elle son avantage sur la concurrence ? Tout d’abord, l’approche de l’entreprise a toujours été différente de celle des autres sociétés technologiques. Il s’agit d’une fonderie spécialisée, ce qui signifie qu’elle ne conçoit pas de puces, mais se contente de fabriquer des puces pour d’autres entreprises, explique Mme El Maghraoui d’IBM. Au fil des ans, un nombre croissant d’entreprises ont externalisé la fabrication de leurs puces à TSMC en raison du coût croissant de la fabrication d’une gamme de puces de plus en plus diversifiée.
Dans le même temps, le coût de fabrication des puces individuelles a explosé, a déclaré Dylan Patel, fondateur de SemiAnalysis, une société de recherche et d’analyse dans le domaine des semi-conducteurs, dans une récente interview podcast. TSMC s’est concentrée exclusivement sur la fabrication de puces et a grandement facilité la tâche de ses clients professionnels, explique M. Patel.
« La fabrication de semi-conducteurs est un processus très archaïque et difficile, explique-t-il. Les barrières à l’entrée sont beaucoup plus élevées [que pour la plupart des entreprises technologiques], car les rôles sont extrêmement spécialisés. » Enfin, les employés de TSMC sont très fiers de leur travail, explique M. Patel. « Ils travaillent 80 heures par semaine dans une usine, et si un problème survient, comme un tremblement de terre, ils se présentent au travail au milieu de la nuit », car ils sont les seuls à pouvoir réparer certains équipements, explique-t-il.
Une autre raison pour laquelle il est difficile de reproduire la formule TSMC est qu’ils ont investi des milliards de dollars dans l’achat de dizaines de machines de fabrication de puces hautement spécialisées créées par un autre géant des supraconducteurs, la société néerlandaise ASML.
ASML a été le pionnier de la lithographie extrême ultraviolet (EUV), qui génère essentiellement des longueurs d’onde de lumière incroyablement courtes en grandes quantités pour imprimer des motifs petits et complexes sur des micropuces. Les machines de fabrication de puces d’ASML coûtent entre 183 et 380 millions de dollars chacune. L’une des premières machines EUV au monde a été installée en 2014 au Albany Nanotech Complex, qui appartient et est exploité par NY CREATES et dont IBM Research est un partenaire principal.
Depuis lors, IBM Research et ses partenaires ont mis en place un écosystème pour développer et optimiser la lithographie EUV, ce qui a permis à IBM et à d’autres entreprises de réduire la taille des transistors à quelques nanomètres seulement, soit des dizaines de milliers de fois plus fins qu’un cheveu.
Alors qu’ASML et ses partenaires tels qu’IBM continuent à travailler sur l’impression de puces de plus en plus petites, TSMC restera dans l’équation en tant que fabricant de puces. M. Patel, de SemiAnalysis, ne voit pas l’implication de TSMC comme un problème. « Je ne pense pas que cela rompe nécessairement la dépendance, dit-il. Je pense que cela incite TSMC à s’implanter aux États-Unis. » En 2020, TSMC a annoncé son intention de construire des usines de fabrication de puces aux États-Unis. Depuis lors, le géant de la fabrication a investi 65 milliards de dollars pour développer trois usines de fabrication de puces en Arizona. Au quatrième trimestre 2024, la production de puces a commencé dans la première usine TSMC aux États-Unis.
Des experts comme Mme El Maghraoui voient un avenir prometteur pour les entreprises qui exploitent l’IA pour trouver de nouveaux matériaux pour les puces destinées à alimenter l’IA. À cette fin, les nouveaux modèles d’IBM et de Meta pourraient aider les chercheurs à découvrir de nouveaux matériaux pour la fabrication de puces qui pourraient uniformiser les règles du jeu à l’avenir.
« Lorsque nous rendons ces modèles open source, nous accélérons l’innovation, favorisons la collaboration et encourageons le développement de semi-conducteurs entièrement nouveaux », explique Mme El Maghraoui.
Par exemple, une équipe du projet de modèles de fondation pour les matériaux (FM4M) d’IBM Research utilise l’IA pour concevoir de nouvelles puces qui peuvent atteindre des performances identiques ou supérieures, mais avec une empreinte environnementale moindre, explique Jed Pitera, co-responsable de la stratégie d’IBM pour les matériaux durables. « Si je possède une usine et que je fabrique dix types de puces différents, quelle est l’empreinte totale de chaque puce ? », dit-il, en référence à l’électricité et à l’eau utilisées, ainsi qu’aux émissions générées par la fabrication d’une puce donnée.
« Lorsque nous connaissons l’empreinte totale de la puce A, nous pouvons commencer à réfléchir à la manière de modifier notre processus de fabrication afin que les puces offrent toujours les mêmes performances, mais avec un impact environnemental minimisé, explique M. Pitera. Lorsque l’empreinte environnementale diminue, le coût suit la même tendance. »
