Un superordinateur placé sous un bureau pourrait changer la façon dont les entreprises gèrent l'intelligence artificielle.
Lors du CES 2025 la semaine dernière, NVIDIA a annoncé le projet DIGITS, un superordinateur personnel d’IA équipé de la nouvelle puce GB10 Grace Blackwell Superchip de la société. Le système, dont le prix de départ est de 3 000 USD et qui sera lancé en mai, peut exécuter des modèles d’IA comportant jusqu’à 200 milliards de paramètres et offre une performance de modèles IA d’un pétaflop.
« L’IA sera courante dans toutes les applications pour tous les secteurs », a déclaré Jensen Huang, fondateur et PDG de NVIDIA, dans un communiquéde presse. « Avec le Project DIGITS, la Grace Blackwell Superchip arrive à des millions de développeurs, » « Placer un superordinateur IA sur les bureaux de chaque data scientist, chercheur en IA et étudiant leur permet d’engager et de façonner l’ère de l’IA. »
L’appareil de bureau offre 128 Go de mémoire unifiée et jusqu’à 4 To de stockage, ciblant les entreprises ayant besoin de traitement de données instantané sans retard cloud. Deux systèmes peuvent se connecter pour gérer des modèles allant jusqu’à 405 milliards de paramètres.
« Pensez aux applications industrielles, où, sur la chaîne de production, vous voulez que l'informatique soit juste à côté de l'endroit où se déroule la fabrication », a déclaré Shobhit Varshney, vice-président d'IBM Consulting, dans un récent épisode du podcast Mixture of Experts. « Il y a beaucoup de latence entre appeler un serveur, ou une API cloud, et recevoir des réponses. »
Les opérations sensibles à la sécurité stimulent la demande de capacités de traitement local. Varshney a décrit plusieurs scénarios où cela est essentiel. « Il est important de s’assurer que les données, surtout si elles sont liées à quelque chose de sensible, ne quittent pas vos locaux », ajoute-t-il. « Il en va de même pour les applications de défense, où vous effectuez des tâches plus tactiques sur le terrain. Vous voulez être capable de calculer toutes les images provenant de tous les drones présents à un endroit donné, parce que vous vous trouvez peut-être sur un territoire où vous n'avez même pas de connexion à un serveur. »
Le système Project DIGITS fonctionne sur le système d’exploitationNVIDIA DGX basé sur Linux, permettant aux utilisateurs de développer localement puis de déployer sur une infrastructure cloud ou de centre de données. Les installations de fabrication peuvent mettre en place « la surveillance en temps réel, la maintenance prédictive et l’optimisation des processus propulsées par l’edge computing », explique Ashok Reddy, PDG de la société de logiciels KX. Les sociétés financières disposent d'outils pour « le trading en temps réel, la gestion des risques et des informations prédictives à une vitesse sans précédent ». Dans le même temps, les établissements de santé pourraient exploiter cette technologie pour « accélérer les diagnostics, l'imagerie et le développement de médicaments grâce à des analyses avancées d'IA », explique Reddy. Le système traite instantanément « des volumes massifs de données structurées et non structurées » pour « une prise de décision en temps réel et des analyses à faible latence ».
Le professeur d’ingénierie Benjamin Lee à l’Université de Pennsylvanie a déclaré voir le superordinateur de NVIDIA comme faisant partie d’un virage plus large vers l’IAagentique, où les systèmes gèrent des tâches entières plutôt que des tâches individuelles.
« Une IA intelligente élaborera alors une stratégie et déterminera l’ensemble des tâches nécessaires pour accomplir cette tâche », explique Lee, ajoutant que cette approche « pourrait considérablement améliorer la productivité en permettant aux humains de demander de grandes tâches à un agent plutôt que de demander des tâches individuelles à un modèle. »
Varshney note que NVIDIA utilise une technologie open source issue de sa récente acquisition de Run IA pour 700 millions de dollars américains. « Ils essaient de s’assurer que l’ensemble du secteur se rapproche de cette ère de l’IA physique, de l’IA agentique et de la conduite autonome », déclare M. Varshney, « ils veulent être l’épine dorsale de chacun d’entre eux ».
Les baisses de prix se sont propagées dans toutes les gammes de produits. « L’année dernière, la série 40 de leurs puces représentait 1 600 dollars », explique M. Varshney. « Ils viennent de publier un calcul égal pour 550 USD. »
Les réductions de prix suggèrent des progrès techniques. « La conception des GPU est largement définie et ne fait pas l'objet d'une optimisation agressive en termes de performances, d'énergie et de coûts », explique M. Lee. Il est toutefois possible que NVIDIA ait atteint ce point « bien plus tôt que les autres concepteurs de puces, ce qui lui a permis d'être compétitive en termes de performances et de coûts », explique Lee.
« Les modèles peuvent être spécialisés pour des tâches spécifiques, en fournissant la même réponse avec beaucoup moins de calculs et beaucoup moins d'énergie », explique M. Lee. « Les agents pourraient alors apprendre à sélectionner le modèle spécialisé adapté à chaque tâche, chose qu’un humain aurait du mal à faire. »
Cette poussée vers l’informatique spécialisée marque un changement spectaculaire par rapport aux limitations actuelles. « Nous avons été limités par de jolis petits modèles qui fonctionnent sur des appareils mobiles », explique M. Varshney. « Ils veulent rendre l’informatique aussi accessible et démocratisée que le branchement à l’électricité, mais ils veulent devenir la superpuissance électrique mondiale. »
