L’intelligence artificielle (IA) transforme les secteurs, et les entreprises ont besoin d’une infrastructure capable de gérer les workloads liés à l’IA de manière efficace et sécurisée. IBM LinuxONE, alimenté par le processeur IBM Telum, intègre l’accélération de l’IA directement dans la puce, permettant ainsi l’inférence en temps réel de plusieurs modèles d’IA avec une latence minimale. Cette capacité avancée, combinée à l’IA prédictive et aux grands modèles de langage, permet aux entreprises d’analyser les données là où elles se trouvent, permettant ainsi des analyses plus rapides et plus approfondies pour les applications essentielles telles que la détection des fraudes, l’analyse des risques et l’imagerie médicale.
IBM collabore avec l’ IBM LinuxONE Ecosystem pour aider les éditeurs de logiciels indépendants à fournir des solutions aux défis actuels en matière d’IA, de développement durable et de cybersécurité.
Découvrez deux solutions innovantes pour la finance et la santé : Clari5 Enterprise Fraud Management sur IBM LinuxONE 4 Express pour la prévention de la fraude en temps réel, et la plateforme Enso Decision Intelligence d'Exponential AI sur LinuxONE pour des solutions d'IA avancées à l'échelle.
1 CLAUSE DE NON-RESPONSABILITÉ : Les performances sont basées sur des tests internes IBM effectués sur du matériel IBM Systems de type machine 9175. L’application OLTP et PostgreSQL ont été déployés sur IBM Systems Hardware. La configuration de l’ensemble de la détection des fraudes aux cartes de crédit (CCFD) se compose de deux modèles (LSTM, TabFormer). Sur IBM Systems Hardware, l’exécution de l’application OLTP avec le fichier JAR compilé IBM Z Deep Learning Compiler (zDLC) et IBM Z Accelerated pour le serveur d’inférence NVIDIA Triton en local et le traitement des opérations d’inférence d’IA sur les cœurs et l’accélérateur intégré pour l’IA en comparaison avec l’exécution locale de l’application OLTP et le traitement des opérations d’inférence d’IA à distance sur un serveur x86 exécutant le serveur d’inférence NVIDIA Triton avec le backend d’exécution OpenVINO sur le processeur (avec AMX). Chaque scénario a été piloté par Apache JMeter 5.6.3 avec 64 utilisateurs parallèles. Configuration matérielle IBM Systems : 1 LPAR exécutant Ubuntu 24.04 avec 7 cœurs dédiés (SMT), 256 Go de mémoire et stockage IBM FlashSystem 9500. Les adaptateurs réseau ont été dédiés à NTECH sous Linux. Configuration de serveur x86 : 1 serveur x86 exécutant Ubuntu 24.04 avec 28 processeurs Emerald Rapids Intel Xeon Gold à 2,20 GHz avec Hyper-Threading activé, 1 To de mémoire, SSD locaux, UEFI avec profil de performance maximal activé, contrôle P-State du processeur et C-States désactivés. Les résultats peuvent varier.
2, 3 CLAUSE DE NON-RESPONSABILITÉ : les performances sont extrapolées à partir de tests internes IBM exécutés sur du matériel IBM Systems de type machine 9175. Le test de performances a été exécuté avec un thread effectuant des opérations d’inférence locales à l’aide d’un modèle synthétique de détection des fraudes à la carte de crédit basé sur LSTM afin d’exploiter l’accélérateur intégré pour l’IA. Une taille de lot de 160 a été utilisée. Configuration matérielle IBM Systems : 1 LPAR exécutant Red Hat Enterprise Linux 9.4 avec 6 cœurs (SMT), 128 Go de mémoire. Les résultats peuvent varier.