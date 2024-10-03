L'utilisation croissante de l'intelligence artificielle (IA) au cours des deux dernières années et demie a radicalement modifié non seulement les logiciels mais aussi le matériel. Alors que l'utilisation de l'IA continue d'évoluer, les fabricants de PC ont trouvé dans l'IA une possibilité d'améliorer les appareils des utilisateurs finaux en proposant du matériel spécifique à l'IA et en les commercialisant sous le nom de « PC IA ».
Il y a quelques années, l’IA dépendait souvent de matériel qui n'était pas spécifiquement conçu pour elle. Les processeurs graphiques en sont un exemple. Les processeurs graphiques Nvidia (GPU) sont cruciales en IA car elles gèrent efficacement le traitement parallèle, ce qui est nécessaire à l’apprentissage automatique et à l’apprentissage profond. Leur conception permet des calculs simultanés, les rendant plus efficaces que les processeurs pour la formation des modèles d’IA et les inférences.
Un autre type de matériel principal est le réseau de portes programmables in situ (FGPA) d'Intel et d'autres sociétés. Un FPGA est un circuit intégré qui peut être reprogrammé plusieurs fois. Cette flexibilité en fait un outil idéal pour les tâches liées à l'IA. Les FPGA accélèrent les tâches d’apprentissage profond et d’apprentissage automatique. Ils proposent des options de personnalisation matérielle qui imitent le comportement des processeurs graphiques ou des circuits intégrés spécifiques à une application (ASIC).
Les FPGA peuvent être intégrés à des cadres d’IA populaires comme TensorFlow et PyTorch, et ce à l’aide d’outils comme la suite Intel FPGA AI et la boîte à outils OpenVINO.
Les FPGA sont utilisés dans des secteurs comme l’automobile et la santé. Ils sont utiles dans les scénarios d’edge computing où les capacités d’IA doivent être déployées près de la source de données pour assurer une prise de décision plus rapide et une latence réduite.
Un autre type est celui des circuits intégrés à application spécifique (ASIC). Les unités de traitement des tenseurs (TPU) de Google en sont un exemple. Les TPU sont des ASIC personnalisés développés par Google pour accélérer les workloads de machine learning. Ils sont optimisés pour TensorFlow et largement utilisés dans les centres de données de Google.
Le lancement de ChatGPT par OpenAI le 30 novembre 2022 a changé le rapport du public et de l’industrie à l’IA. ChatGPT a rapidement gagné en popularité, attirant plus d’un million d’utilisateurs cinq jours après sa sortie. En janvier 2023, il comptait 100 millions d’utilisateurs, ce qui en fait l’application grand public à la croissance la plus rapide jamais enregistrée.
Plus important encore, le succès fulgurant de ChatGPT a fait pencher la balance en faveur des start-ups du secteur de l’IA. De grands géants de la tech comme Microsoft, Google et Meta ont accéléré le développement et la disponibilité publique de leurs offres, et la Silicon Valley a rapidement vu émerger des entreprises comme Anthropic et Perplexity proposant des outils d’IA.
Aujourd'hui, les fabricants de PC investissent dans des PC compatibles avec l'IA qui mettent l'accent sur l'IA hybride et l'intelligence embarquée. L’intégration de l’IA dans les ordinateurs personnels est facilitée par l’émergence de jeux de puces spécialisés d’IA, tels que les unités de traitement neuronal (NPU), qui améliorent la capacité des PC à effectuer localement des tâches d’IA.
Cette évolution devrait avoir un impact significatif sur le marché des PC. Quelque 60 % des PC livrés d’ici 2027 seront prêts pour l’IA, selon Canalys.
Les PC prêts pour l’IA sont conçus pour exécuter efficacement les workloads d’IA grâce à une combinaison de CPU, de GPU et de NPU qui leur permet de gérer des tâches telles que les modèles d’IA générative plus efficacement que les générations de PC antérieures. Cette optimisation permet aux PC prêts pour l’IA d'exécuter les applications d’IA avec un niveau de performance, d’efficacité énergétique et de confidentialité amélioré, en traitant les données localement au lieu de s’appuyer sur des solutions cloud.
Certains critiquent cette catégorie comme un stratagème marketing et soulignent que de nombreux utilisateurs finaux utilisent l’IA générative via des chatbots basés sur le cloud.
Aujourd’hui, le public pense à l’IA comme des grands modèles de langage fonctionnant dans le cloud et utilisés comme chatbot. Au fil du temps, la puissance et l’utilisation de l’IA par les utilisateurs finaux passeront de plus en plus par le biais de fonctionnalités intégrées et d’applications améliorées par l’IA.
Selon Chris Howard, responsable international de la recherche chez Gartner, l’IA impliquera également davantage de petits modèles de langage alimentant des cas d’utilisation non chatbot fonctionnant près de la périphérie plutôt que du cloud.
Le traitement par l'IA se fera de plus en plus près de l'utilisateur et de plus en plus près de la périphérie. Cela signifie que la tendance du matériel spécifique à l’IA ne fera que croître.
Un des points forts est l'introduction des PC Copilot+ de Microsoft, une nouvelle catégorie de PC Windows spécialement conçus pour l'IA. Ces PC sont dotés d'un nouveau silicium capable d'effectuer plus de 40 billions d'opérations par seconde (TOPS), d'offrir une autonomie d'une journée et d'accéder à des modèles d'IA avancés. L'architecture de ces appareils intègre une unité de traitement neuronal à haute performance en plus du processeur et du processeur graphique, ce qui améliore leurs capacités d'IA. Cette configuration permet de nouvelles expériences telles que la génération d’images par IA en temps réel, la traduction et des fonctions de recherche avancées comme la fonction « Rappel », qui enregistre et analyse l’activité des appareils pour améliorer l’interaction utilisateur avec les modèles d’IA.
Microsoft a également collaboré avec de grands partenaires fabricants d’équipement d’origine, dont Acer, ASUS, Dell, HP, Lenovo et Samsung, pour lancer ces appareils améliorés par IA sur le marché.
Apple a procédé à plusieurs modifications matérielles pour intégrer et renforcer les capacités d'IA dans ses appareils. L’intégration du silicium d’Apple, spécialement conçu pour gérer les traitements avancés de l’IA, constitue un développement important. Cela inclut l’utilisation de moteurs neuronaux spécialisés dans des appareils comme l’iPhone 15 Pro, optimisés pour des tâches d’IA telles que l’apprentissage automatique et le traitement du langage naturel. Ces moteurs neuronaux améliorent l'efficacité et la rapidité des opérations d'IA, en activant des fonctionnalités telles que la traduction en temps réel et la reconnaissance d'images.
Google a apporté plusieurs modifications à son matériel pour l'adapter à l'IA. Une des étapes importantes consiste à développer et intégrer son propre matériel pour la prise en charge des modèles d’IA comme Gemini. Cela indique que l'on est passé de l'utilisation de puces externes à l'utilisation de technologies propriétaires pour améliorer les capacités de l'IA.
Google a même réorganisé ses équipes internes pour mieux intégrer l'IA dans ses produits. Cette réorganisation a conduit à la création d'une nouvelle équipe plateformes et appareils, consolidant divers produits Google comme Pixel, Android, Chrome et ChromeOS sous une direction unique. Cette initiative vise à accélérer l’intégration de l’IA et à améliorer la synergie entre le matériel et le logiciel.
La révolution de l’IA générative a commencé en novembre 2022 et a entraîné de grands changements matériels pour s’adapter aux cas d’utilisation de l’IA gourmands en énergie. L'intégration récente de l'IA dans le matériel informatique n'est sans doute qu'un début. Nous pouvons nous attendre à ce que le matériel spécifique à l’IA se répande au-delà des PC et des téléphones et dans les appareils portables, les appareils connectés à l’Internet des objets et bien plus encore.
