Accelerated AI Processor on LinuxONE

Performance et innovation alimentées par l’IA

L’intelligence artificielle (IA) transforme les secteurs, et les entreprises ont besoin d’une infrastructure capable de gérer les workloads liés à l’IA de manière efficace et sécurisée.

IBM LinuxONE, alimenté par le processeur IBM Telum, intègre l’accélération de l’IA directement dans la puce, permettant ainsi l’inférence en temps réel de plusieurs modèles d’IA avec une latence minimale. Cette capacité avancée, combinée à l’IA prédictive et aux grands modèles de langage, permet aux entreprises d’analyser les données là où elles se trouvent, permettant ainsi des analyses plus rapides et plus approfondies pour les applications essentielles telles que la détection des fraudes, l’analyse des risques et l’imagerie médicale.

Analyses en temps réel de l’IA

L’accélérateur d’IA sur puce permet une inférence à faible latence, pour une analyse des données au fur et à mesure des transactions. La cohérence de la mémoire et l’accès direct à la structure éliminent les goulots d’étranglement pour une exécution transparente de l’IA.

Un débit d’IA plus élevé

L’utilisation d’un seul accélérateur intégré pour l’IA sur un workload OLTP sur IBM LinuxONE Emperor 5 correspond au débit de l’inférence en cours d’exécution sur un serveur x86 distant comparé avec 13 cœurs.¹

Accélération des performances de l'IA

Avec IBM LinuxONE Emperor 5, traitez jusqu'à 450 milliards d'opérations d'inférence par jour avec un temps de réponse de 1 ms à l'aide d'un modèle de détection des fraudes à la carte de crédit basé sur l'apprentissage profond.²

Évolutivité sans compromis

Avec IBM LinuxONE Emperor 5, traitez jusqu’à 5 millions d’opérations d’inférence par seconde avec un temps de réponse inférieur à 1 ms à l’aide d’un modèle de détection des fraudes à la carte de crédit basé sur l’apprentissage profond.³

IA évolutive pour workloads complexes

Carte PCIe

Carte IBM Spyre Accelerator

La carte IBM Spyre Accelerator est un accélérateur IA PCIe Gen 5x de 75 W avec 128 Go de mémoire LPDDR5, optimisé pour l’IA générative et les LLM multimodaux.⁸ Doté de 32 cœurs (+2) avec 2 Mo de mémoire tampon par cœur et une utilisation des cœurs supérieure à 55 %, Spyre est extensible par carte et par tiroir, permettant aux entreprises de gérer efficacement des inférences IA complexes sur l’ensemble de leurs applications métier.

En ajoutant les cartes IBM Spyre Accelerator à IBM LinuxONE 5, d’autres cas d’utilisation deviennent possibles, notamment l’IA générative.

Lire le blog à propos de l'accélérateur Spyre

Démonstration :détection des fraudes à l’assurance en temps réel avec une performance élevée sur IBM LinuxONE

Regarder la démo

Logiciels et solutions d'IA pour IBM LinuxONE

Série d’outils d’IA pour IBM LinuxONE

Un ensemble de frameworks d’IA optimisés pour IBM LinuxONE Integrated Accelerator for AI, pour une performance améliorée avec l’assistance IBM Elite.

IBM Synthetic Data Sets

Une famille de jeux de données générés artificiellement qui améliorent l’entraînement des modèles IA et les LLM, aidant IBM LinuxONE dans le secteur de la finance à accéder rapidement à des données riches et pertinentes pour les initiatives en matière d’IA.

Red Hat OpenShift AI

Une plateforme ouverte pour gérer le cycle de vie des modèles d'IA prédictive et d'IA générative, à l'échelle, dans des environnements cloud hybrides.

ONNX

Un format de modèle portable qui permet la compatibilité entre les cadres des exigences, permettant aux développeurs d'IA de créer des modèles une seule fois et de les déployer avec différentes exécutions, outils et compilateurs.

TensorFlow

Un puissant framework open source pour le développement, l’entraînement et l’inférence de modèles, offrant un écosystème riche optimisé pour LinuxONE.

IBM SnapML

Conçue pour l’entraînement et l’inférence de machine learning à grande vitesse, la solution utilise l’accélérateur d’IA intégré d’IBM pour améliorer les performances des modèles Random Forest, Extra Trees et Gradient Boosting.

Serveur d’inférence Triton

Un serveur de modèles open source optimisé pour Linux on Z, prenant en charge à la fois l’inférence CPU et GPU tout en utilisant SIMD et l’accélérateur intégré pour l’IA d’IBM.

Compilateur d’apprentissage profond IBM Z

Un outil qui rationalise le déploiement des modèles d’apprentissage profond sur IBM Z, permettant aux data scientists d’optimiser les modèles d’IA pour les environnements critiques.

Applications ISV

IBM collabore avec l’IBM LinuxONE Ecosystem pour aider les éditeurs de logiciels indépendants à fournir des solutions aux défis actuels en matière d’IA, de développement durable et de cybersécurité.

Découvrez deux solutions innovantes pour la finance et la santé : Clari5 Enterprise Fraud Management sur IBM LinuxONE 4 Express pour la prévention de la fraude en temps réel, et la plateforme Enso Decision Intelligence d’Exponential AI sur LinuxONE pour des solutions d’IA avancées à l’échelle.

Découvrir Clari5

Découvrir l’IA exponentielle

Passez à l’étape suivante

Pour en savoir plus, programmez dès maintenant un rendez-vous gratuit de 30 minutes avec un représentant IBM.

Découvrir IBM LinuxONE 5

Blog L’IA sur IBM LinuxONE

Découvrez comment l’IA sur IBM LinuxONE stimule la croissance et l’efficacité grâce à des informations en temps réel et des performances dédiées aux entreprises.

IBM LinuxONE 5 donne un gros coup de boost à l’IA

Consultez l’article de Cambrian-AI Research pour en savoir plus sur la technologie de LinuxONE 5 et les cas d’utilisation de l’IA qui correspondent à ce serveur de niveau entreprise.

Lancez-vous en IA avec LinuxONE

Découvrez les principaux éléments à prendre en compte lors de la planification d’un cas d’utilisation de l’IA, ce qu’il est possible de faire avec les puces Telum, ainsi que les étapes à suivre pour vous lancer.

Notes de bas de page

¹ CLAUSE DE NON-RESPONSABILITÉ : Les performances sont basées sur des tests internes IBM effectués sur du matériel IBM Systems de type machine 9175. L’application OLTP et PostgreSQL ont été déployés sur IBM Systems Hardware. La configuration de l’ensemble de la détection des fraudes aux cartes de crédit (CCFD) se compose de deux modèles (LSTM, TabFormer). Sur IBM Systems Hardware, l’exécution de l’application OLTP avec le fichier JAR compilé IBM Z Deep Learning Compiler (zDLC) et IBM Z Accelerated pour le serveur d’inférence NVIDIA Triton en local et le traitement des opérations d’inférence d’IA sur les cœurs et l’accélérateur intégré pour l’IA en comparaison avec l’exécution locale de l’application OLTP et le traitement des opérations d’inférence d’IA à distance sur un serveur x86 exécutant le serveur d’inférence NVIDIA Triton avec le backend d’exécution OpenVINO sur le processeur (avec AMX). Chaque scénario a été piloté par Apache JMeter 5.6.3 avec 64 utilisateurs parallèles. Configuration matérielle IBM Systems : 1 LPAR exécutant Ubuntu 24.04 avec 7 cœurs dédiés (SMT), 256 Go de mémoire et stockage IBM FlashSystem 9500. Les adaptateurs réseau ont été dédiés à NTECH sous Linux. Configuration de serveur x86 : 1 serveur x86 exécutant Ubuntu 24.04 avec 28 processeurs Emerald Rapids Intel Xeon Gold à 2,20 GHz avec Hyper-Threading activé, 1 To de mémoire, SSD locaux, UEFI avec profil de performance maximal activé, contrôle P-State du processeur et C-States désactivés. Les résultats peuvent varier.

^{2, 3}CLAUSE DE NON-RESPONSABILITÉ : les performances sont extrapolées à partir de tests internes IBM exécutés sur du matériel IBM Systems de type machine 9175. Le test de performances a été exécuté avec un thread effectuant des opérations d’inférence locales à l’aide d’un modèle synthétique de détection des fraudes à la carte de crédit basé sur LSTM afin d’exploiter l’accélérateur intégré pour l’IA. Une taille de lot de 160 a été utilisée. Configuration matérielle IBM Systems : 1 LPAR exécutant Red Hat Enterprise Linux 9.4 avec 6 cœurs (SMT), 128 Go de mémoire. Les résultats peuvent varier.