La inteligencia artificial (IA) está transformando las industrias, y las empresas requieren una infraestructura que pueda manejar las cargas de trabajo de IA de manera eficiente y segura. IBM LinuxONE, impulsado por el procesador IBM® Telum integra el aceleramiento de IA directamente en el chip, lo que permite la inferencia en tiempo real de múltiples modelos de IA con una latencia mínima. Esta capacidad avanzada, en combinación con IA predictiva y modelos de lenguaje grandes permite a las empresas analizar los datos donde residen, para ofrecer insights más rápidos y profundos para aplicaciones de misión crítica, como la detección de fraude, el análisis de riesgos y las imágenes médicas.
IBM está trabajando con ecosistema IBM LinuxONE para ayudar a los ISV a proporcionar soluciones para los desafíos actuales de IA, sustentabilidad y ciberseguridad.
Explore dos soluciones innovadoras diseñadas para instituciones financieras y de atención médica: Clari5 Enterprise Enterprise Fraud Management en IBM LinuxONE 4 Express para la prevención de fraudes en tiempo real y Enso Decision Intelligence Platform de Exponential AI en LinuxONE para soluciones avanzadas de IA a escala.
1 DESCARGO DE RESPONSABILIDAD: Descargo de responsabilidad: el resultado de rendimiento se basa en pruebas internas de IBM que se ejecutan en IBM Systems Hardware del tipo de máquina 9175. La aplicación OLTP y PostgreSQL se desplegaron en IBM Systems Hardware. La configuración de IA de Credit Card Fraud Detection (CCFD) consta de dos modelos (LSTM, TabFormer). En Hardware de sistemas de IBM, ejecutar la aplicación OLTP con jar compilado IBM Z Deep Learning Compiler (zDLC) e IBM Z Accelerated for NVIDIA Triton Inference Server localmente y procesar las operaciones de inferencia de IA en núcleos e Integrated Accelerator for AI versus ejecutar la aplicación OLTP localmente y procesar las operaciones remotas de inferencia de IA en un x86 server que ejecuta NVIDIA Triton Inference Server con backend de tiempo de ejecución OpenVINO en CPU (con AMX). Cada escenario se impulsó desde Apache JMeter 5.6.3 con 64 usuarios paralelos. Configuración de hardware de IBM Systems: 1 LPAR que ejecuta Ubuntu 24.04 con 7 núcleos dedicados (SMT), 256 GB de memoria y almacenamiento IBM FlashSystem 9500. Los adaptadores de red se dedicaron a NETH en Linux. Configuración del x86 server: 1 x86 server que ejecuta Ubuntu 24.04 con 28 CPU Emerald Rapids Intel Xeon Gold a 2,20 GHz con Hyper-Threading activado, 1 TB de memoria, SSD locales, UEFI con perfil de rendimiento máximo habilitado, control de estado de CPU P y C-States deshabilitados. Los resultados pueden variar.
2, 3 DESCARGO DE RESPONSABILIDAD: El resultado de rendimiento se extrapoló de las pruebas internas de IBM que se ejecutan en IBM Systems Hardware de tipo de máquina 9175. El punto de referencia se ejecutó con un hilo que realizaba operaciones de inferencia local con un modelo sintético Credit Card Fraud Detection basado en LSTM para explotar el acelerador integrado para IA. Se utilizó un tamaño de lote de 160. Configuración del hardware de IBM Systems: 1 LPAR ejecutando Red Hat Enterprise Linux® 9.4 con 6 núcleos (SMT), 128 GB de memoria. Los resultados pueden variar.