Conçu pour aider les entreprises à relever l’un de leurs défis les plus urgents : l’augmentation des coûts liés à l’analytique et à l’IA à l’échelle.
Chez NVIDIA GTC, IBM, Nvidia et Nestlé ont montré ce qui est possible lorsque l’accélération GPU rencontre l’architecture open data —démontrant des Workload analytique jusqu’à 5 fois plus rapides tout en réduisant les coûts de 83 %. C’était un signal clair de ce à quoi peut ressembler l’avenir des workloads à forte intensité de données lorsque la performance et l’efficacité sont repensées ensemble.
Aujourd’hui, IBM s’appuie sur cet élan avec l’annonce officielle de l’aperçu technique privé du traitement accéléré des requêtes par GPU pour watsonx.data — conçu pour aider les entreprises à relever l’un de leurs défis les plus urgents : la hausse des coûts de l’analytique et de l’IA à l’échelle.
Alors que les entreprises continuent à développer l'IA et l'analytique dans des environnements de données distribuées de plus en plus complexes, les systèmes traditionnels basés sur le CPU peinent à suivre le rythme. Résultat : des informations plus lentes, une augmentation des coûts d’infrastructure et une pression croissante sur les équipes chargées des données pour fournir plus de valeur avec moins de ressources. L'accélération par GPU représente une nouvelle voie à suivre.
Les premiers résultats obtenus par les clients de l'aperçu technique privé démontrent le potentiel de cette approche dans le monde réel.
Ces résultats ne sont pas des améliorations progressives. Ils marquent un changement fondamental dans la manière dont les entreprises peuvent aborder les charges de travail à forte intensité de données, dans lesquels les gains de performance et les réductions de coûts ne sont plus un compromis, mais un résultat combiné. À mesure que les volumes de données augmentent et que l’adoption de l’IA s’accélère, ce type d’amélioration progressive passe rapidement de l’avantage concurrentiel à une nécessité commerciale.
IBM a également appliqué cette innovation en interne par le biais de son organisation DSI, agissant en tant que « Client zéro » pour watsonx.data accéléré par GPU. Lors des premiers déploiements, l’exécution d’IBM watsonx.data Presto C++ avec accélération GPU (comparativement à une exécution sur CPU uniquement) a permis aux équipes IBM d’obtenir des performances de requête jusqu’à 25 fois supérieures 1 tout en réduisant les coûts d’environ 80 % pour cette charge de travail grâce à un temps d’exécution réduit 2. Ces résultats démontrent non seulement l’évolutivité de l’approche, mais aussi l’engagement d’IBM à valider la technologie dans des environnements d’entreprise réels avant de la proposer aux clients. Ces Résultats sont dérivés des tests effectués par IBM sur des Workload de requêtes télémétriques sur l’infrastructure Nvidia A100 GPU, les Résultats peuvent varier en fonction de la requête, du volume de données, de l’infrastructure, de la configuration et des conditions.*
Au cœur de cette innovation se trouve un changement simple mais puissant : le transfert des opérations de requête à forte intensité de calcul, telles que les jointures, les agrégations et les filtrages, des CPU vers les GPU. En exploitant le traitement massivement parallèle, les workloads analytiques peuvent s’exécuter considérablement plus rapidement que les approches traditionnelles, tout en réduisant de manière significative l’utilisation et les coûts de l’infrastructure.
Il s’agit bien plus qu’une amélioration des performances ; il s’agit d’un changement structurel dans le fonctionnement de l’économie analytique. Des requêtes plus rapides signifient des décisions plus rapides. Des besoins de calcul réduits se traduisent directement par une réduction du coût par requête. Et avec une utilisation plus efficace des Ressources, les Entreprises peuvent faire évoluer les Workloads d’analytique et d’IA sans augmentation linéaire des coûts.
L'un des principaux obstacles à la modernisation a toujours été la complexité. De nombreuses solutions de performance nécessitent la réécriture de SQL, la migration de données ou la réarchitecture de pipelines. Avec l'accélération du GPU, ce compromis disparaît.
Cette fonctionnalité est totalement transparente pour les utilisateurs : les requêtes, les formats de données et les connecteurs existants continuent de fonctionner tels quels. Les entreprises peuvent immédiatement tirer avantage d'une exécution plus rapide des requêtes, d'une concurrence plus élevée et d'une latence plus faible sans perturber les workflows existants. Il est donc particulièrement adapté aux entreprises qui cherchent à concilier innovation et stabilité opérationnelle.
Tout aussi important, la solution est conçue pour les environnements hybrides et s'intègre parfaitement aux déploiements dans le cloud et sur site, tout en préservant la compatibilité avec l'open source Presto et une gouvernance de niveau entreprise.
Nous élargissons désormais l’accès à cette capacité via notre programme privé de prévisualisation technique, offrant à certains clients la possibilité de collaborer directement avec les équipes produit et ingénierie d’IBM, d’influencer la feuille de route et d’accéder anticipé à la performance analytique de nouvelle génération.
Si votre entreprise effectue une analyse à grande échelle, explore des charges de travail pilotées par l’IA ou cherche à améliorer la performance sans interruption, nous vous invitons à nous rejoindre.
Participez à l'aperçu technique privé de l'accélération GPU IBM watsonx.data et contribuez à façonner l'avenir de l'analytique d'entreprise :
1 *Basé sur des tests internes IBM sur des charges de travail de télémétrie comparant une infrastructure accélérée par GPU composée d’un système sur site utilisant un seul serveur avec 8 GPU Nvidia A100 à des processeurs sur watsonx.data SaaS avec Presto fonctionnant sur IBM Cloud. Sur le jeu de données complet d’environ 1,159 milliard de lignes, les requêtes de télémétrie ont été effectuées en 1,77 minute avec 4 GPU, par rapport à une base de référence antérieure d’environ 45 minutes dans l’environnement CPU. Les résultats sont basés sur des charges de travail et des configurations testées. Les performances réelles varient en fonction du type de requête, du volume de données, de l’infrastructure, de la configuration du cluster et des conditions d’exploitation.
2 * Basé sur des tests internes IBM sur des charges de Workload de télémétrie, comparant une infrastructure accélérée par GPU composée d’un système sur site utilisant un seul serveur avec 8 GPU Nvidia A100 à des processeurs sur watsonx.data SaaS avec Presto fonctionnant sur IBM Cloud. Sur l’ensemble complet de plus de 1,159 milliard de lignes, les requêtes de télémétrie ont été complétées en 1,77 minute à l’aide de 4 GPU, contre une base antérieure d’environ 45 minutes dans l’environnement CPU. Les coûts CPU étaient basés sur le coût par requête d’instance publié par IBM en utilisant la configuration d’instance SaaS watsonx.data dans IBM Cloud. Le coût GPU par requête du système testé sur site watsonx.data fonctionnant sur GPU n’était pas directement disponible et a été estimé en supposant que le coût horaire GPU est de 2 fois le coût horaire CPU. Les calculs de coût utilisent le temps d’exécution comme variable principale. Sur cette méthodologie, le coût total a été estimé à diminuer à environ 15 à 20 % du coût antérieur, ce qui implique une économie possible de 80 à 85 %. Les coûts réels varieront en fonction de la Tarification, du profil de charge de Workload, de la configuration de l’infrastructure, de l’utilisation et des conditions de fonctionnement.