L’IA sur IBM LinuxONE

Une IA intégrée évolutive, économe en énergie et sécurisée
Processeur Telum II

Performance et innovation alimentées par l’IA

L’intelligence artificielle (IA) transforme les secteurs, et les entreprises ont besoin d’une infrastructure capable de gérer les workloads liés à l’IA de manière efficace et sécurisée. IBM LinuxONE, alimenté par le processeur IBM Telum, intègre l’accélération de l’IA directement dans la puce, permettant ainsi l’inférence en temps réel de plusieurs modèles d’IA avec une latence minimale. Cette capacité avancée, combinée à l’IA prédictive et aux grands modèles de langage, permet aux entreprises d’analyser les données là où elles se trouvent, permettant ainsi des analyses plus rapides et plus approfondies pour les applications essentielles telles que la détection des fraudes, l’analyse des risques et l’imagerie médicale.

Lire le blog sur l’IA sur IBM LinuxONE
Analyses en temps réel de l’IA

L’accélérateur d’IA sur puce permet une inférence à faible latence, pour une analyse des données au fur et à mesure des transactions. La cohérence de la mémoire et l’accès direct à la structure éliminent les goulots d’étranglement pour une exécution transparente de l’IA.

Un débit d’IA plus élevé

L’utilisation d’un seul accélérateur intégré pour l’IA sur un workload OLTP sur IBM LinuxONE Emperor 5 correspond au débit de l’inférence en cours d’exécution sur un serveur x86 à 13 cœurs.1

Accélération des performances de l'IA

Avec IBM LinuxONE Emperor 5, traitez jusqu'à 450 milliards d'opérations d'inférence par jour avec un temps de réponse de 1 ms à l'aide d'un modèle de détection des fraudes à la carte de crédit basé sur l'apprentissage profond.2

Évolutivité sans compromis

Avec IBM LinuxONE Emperor 5, traitez jusqu’à 5 millions d’opérations d’inférence par seconde avec un temps de réponse inférieur à 1 ms à l’aide d’un modèle de détection des fraudes à la carte de crédit basé sur l’apprentissage profond.3

Tirez parti d’une sécurité et d’une IA de pointe avec IBM LinuxONE — Rejoignez-nous le 13 mai à 10 h ET pour découvrir des témoignages de clients et des perspectives d’experts. 

S’inscrire à la diffusion sur le web

Logiciels et solutions d'IA pour IBM LinuxONE

Série d’outils d’IA pour IBM LinuxONE
Un ensemble de frameworks d’IA optimisés pour IBM LinuxONE Integrated Accelerator for AI, pour une performance améliorée avec l’assistance IBM Elite.
IBM Synthetic Data Sets
Une famille de jeux de données générés artificiellement qui améliorent l’entraînement des modèles IA et les LLM, aidant IBM LinuxONE dans le secteur de la finance à accéder rapidement à des données riches et pertinentes pour les initiatives en matière d’IA.
IBM Cloud Pak for Data
Une plateforme modulaire qui rationalise l’organisation des données et le déploiement de l’IA, aidant les entreprises à connecter les données cloisonnées dans les environnements de cloud hybride.
ONNX
Un format de modèle portable qui permet la compatibilité entre les cadres des exigences, permettant aux développeurs d'IA de créer des modèles une seule fois et de les déployer avec différentes exécutions, outils et compilateurs.
TensorFlow
Un puissant framework open source pour le développement, l’entraînement et l’inférence de modèles, offrant un écosystème riche optimisé pour LinuxONE.
IBM SnapML
Conçue pour l’entraînement et l’inférence de machine learning à grande vitesse, la solution utilise l’accélérateur d’IA intégré d’IBM pour améliorer les performances des modèles Random Forest, Extra Trees et Gradient Boosting.
Serveur d’inférence Triton
Un serveur de modèles open source optimisé pour Linux on Z, prenant en charge à la fois l’inférence CPU et GPU tout en utilisant SIMD et l’accélérateur intégré pour l’IA d’IBM.
Compilateur d’apprentissage profond IBM Z
Un outil qui rationalise le déploiement des modèles d’apprentissage profond sur IBM Z, permettant aux data scientists d’optimiser les modèles d’IA pour les environnements critiques.

Applications ISV

IBM collabore avec l’ IBM LinuxONE Ecosystem pour aider les éditeurs de logiciels indépendants à fournir des solutions aux défis actuels en matière d’IA, de développement durable et de cybersécurité.

Découvrez deux solutions innovantes pour la finance et la santé : Clari5 Enterprise Fraud Management sur IBM LinuxONE 4 Express pour la prévention de la fraude en temps réel, et la plateforme Enso Decision Intelligence d'Exponential AI sur LinuxONE pour des solutions d'IA avancées à l'échelle.

Découvrir Clari5 Découvrir l’IA exponentielle
Passez à l’étape suivante

Pour en savoir plus, programmez dès maintenant un rendez-vous gratuit de 30 minutes avec un représentant IBM.

Découvrir IBM LinuxONE 5
Notes de bas de page

1 CLAUSE DE NON-RESPONSABILITÉ : Les performances sont basées sur des tests internes IBM effectués sur du matériel IBM Systems de type machine 9175. L’application OLTP et PostgreSQL ont été déployés sur IBM Systems Hardware. La configuration de l’ensemble de la détection des fraudes aux cartes de crédit (CCFD) se compose de deux modèles (LSTM, TabFormer). Sur IBM Systems Hardware, l’exécution de l’application OLTP avec le fichier JAR compilé IBM Z Deep Learning Compiler (zDLC) et IBM Z Accelerated pour le serveur d’inférence NVIDIA Triton en local et le traitement des opérations d’inférence d’IA sur les cœurs et l’accélérateur intégré pour l’IA en comparaison avec l’exécution locale de l’application OLTP et le traitement des opérations d’inférence d’IA à distance sur un serveur x86 exécutant le serveur d’inférence NVIDIA Triton avec le backend d’exécution OpenVINO sur le processeur (avec AMX). Chaque scénario a été piloté par Apache JMeter 5.6.3 avec 64 utilisateurs parallèles. Configuration matérielle IBM Systems : 1 LPAR exécutant Ubuntu 24.04 avec 7 cœurs dédiés (SMT), 256 Go de mémoire et stockage IBM FlashSystem 9500. Les adaptateurs réseau ont été dédiés à NTECH sous Linux. Configuration de serveur x86 : 1 serveur x86 exécutant Ubuntu 24.04 avec 28 processeurs Emerald Rapids Intel Xeon Gold à 2,20 GHz avec Hyper-Threading activé, 1 To de mémoire, SSD locaux, UEFI avec profil de performance maximal activé, contrôle P-State du processeur et C-States désactivés. Les résultats peuvent varier.

2, 3 CLAUSE DE NON-RESPONSABILITÉ : les performances sont extrapolées à partir de tests internes IBM exécutés sur du matériel IBM Systems de type machine 9175. Le test de performances a été exécuté avec un thread effectuant des opérations d’inférence locales à l’aide d’un modèle synthétique de détection des fraudes à la carte de crédit basé sur LSTM afin d’exploiter l’accélérateur intégré pour l’IA. Une taille de lot de 160 a été utilisée. Configuration matérielle IBM Systems : 1 LPAR exécutant Red Hat Enterprise Linux 9.4 avec 6 cœurs (SMT), 128 Go de mémoire. Les résultats peuvent varier.