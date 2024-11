Les accélérateurs d’IA relèvent de deux architectures différentes selon leur fonction : les accélérateurs d’IA pour les centres de données et les accélérateurs d’IA pour les frameworks d’edge computing. Les accélérateurs d’IA conçus pour les centres de données nécessitent une architecture hautement évolutive et des puces de grande dimension, telles que le Wafer-Scale Engine (WSE) conçu par Cerebras pour les systèmes d’apprentissage profond, tandis que les accélérateurs d’IA destinés aux écosystèmes d’edge computing se concentrent davantage sur l’efficacité énergétique et la capacité à fournir des résultats en temps quasi réel.

Intégration au niveau du wafer

L’intégration au niveau wafer, ou WSI, est un processus permettant de construire des réseaux de puces d’IA extrêmement grands dans une seule « super puce » afin de réduire les coûts et d’accélérer les performances des modèles de deep learning. L’intégration au niveau du wafer la plus utilisée est le réseau de puces WSE-3 produit par Cerebras et construit selon le processus 5 nm de TSMC, actuellement l’accélérateur d’IA le plus rapide au monde.

NPU

Les NPU, ou unités de traitement neuronal, sont des accélérateurs d’IA conçus pour l’apprentissage profond, les réseaux neuronaux et les exigences de traitement des données propres à ces workloads. Les NPU peuvent traiter de grandes quantités de données plus rapidement que les autres puces. Ils peuvent effectuer un large éventail de tâches d’IA associées au machine learning, telles que la reconnaissance d’images et les réseaux neuronaux à l’appui des applications d’IA et de ML populaires comme ChatGPT.

Processeurs graphiques (GPU)

Les processeurs graphiques (GPU) sont des circuits électroniques conçus pour améliorer les performances des éléments graphiques informatiques et du traitement des images. Ils sont utilisés dans de nombreux dispositifs, notamment les cartes graphiques, les cartes mères et les téléphones portables. Cependant, en raison de leurs capacités de traitement parallèle, ils sont aussi de plus en plus utilisés dans l’entraînement des modèles IA. Une méthode courante consiste à connecter de nombreux GPU à un seul système d’IA pour augmenter la puissance de traitement du système.

Réseaux de portes programmables in situ (FPGAs)

Les FPGA sont des accélérateurs d’IA hautement personnalisables qui nécessitent des connaissances spécialisées pour être reprogrammés dans un but précis. Contrairement aux autres accélérateurs d’IA, les FPGA ont un design unique qui convient à une fonction particulière, souvent liée au traitement des données en temps réel. Les FPGA sont reprogrammables au niveau matériel, ce qui permet un niveau de personnalisation bien supérieur. Les applications FPGA courantes sont notamment utilisées dans l’aérospatiale, l’Internet des objets (IdO) et les réseaux sans fil.

Circuits intégrés spécifiques à une application (ASIC)

Les ASIC sont des accélérateurs d’IA qui ont été conçus pour un usage ou un workload spécifique, comme l’apprentissage profond dans le cas de l’accélérateur ASICs WSE-3 produit par Cerebras. Contrairement aux FPGA, les ASIC ne peuvent pas être reprogrammés. Cependant, comme ils sont construits dans un but spécifique, ils surpassent généralement les autres accélérateurs à usage plus général. Le Tensor Processing Unit (TPU) de Google en est un exemple, développé pour le machine learning sur réseaux neuronaux à l’aide du logiciel TensorFlow de Google.