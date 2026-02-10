Diseñado para escalar y optimizar la inferencia de IA generativa
IBM AI Optimizer for Z ofrece inferencias de IA de alto rendimiento basadas en políticas directamente en IBM Z, diseñadas para satisfacer las exigencias de la IA generativa a escala empresarial. Impulsado por el acelerador IBM Spyre, aporta una ejecución de modelos de baja latencia, alto rendimiento y alta seguridad a la plataforma que ejecuta las cargas de trabajo más críticas del mundo.
A medida que la IA generativa reconfigura la estrategia, las organizaciones que funcionan con IBM Z se enfrentan a un mandato claro: escalar la IA de forma eficiente, segura y sin costes de infraestructura desorbitados. AI Optimizer for Z 2.1 aborda esto mediante la optimización de la inferencia donde los datos y las transacciones ya están activos (en Z), reduciendo el tiempo de obtención de valor y eliminando las ineficiencias que ralentizan la adopción de la IA.
AI Optimizer for Z está disponible en dos ediciones: Advanced Edition y Essentials Edition.
AI Optimizer for Z 2.1 Essentials Edition amplía las capacidades de automatización con una automatización perfecta de la instalación de IBM watsonx Assistant for Z 3.1 e IBM Software Hub 5.2.
Obtenga una visibilidad total de la inferencia de IA generativa en IBM Z con una observabilidad de nivel empresarial. Los paneles de control de Prometheus y Grafana integrados proporcionan conocimiento profundo sobre:
Esta transparencia ayuda a eliminar el exceso de aprovisionamiento, agilizar la planificación de la capacidad e impulsar inversiones más inteligentes en infraestructura.
AI Optimizer for Z 2.1 introduce un modelo de almacenamiento en caché por etapas para acelerar la inferencia de IA generativa:
AI Optimizer registra los modelos que se ejecutan en Spyre para su optimización. Los usuarios pueden configurar sus propias estrategias de enrutamiento o confiar en el enrutador inteligente incorporado, que tiene en cuenta el rendimiento, la disponibilidad y los patrones de uso. El etiquetado semántico permite agrupar modelos para el enrutamiento alineado con casos de uso, lo que proporciona más flexibilidad en las solicitudes de inferencia.
Los modelos implementados fuera de IBM Z o LinuxONE pueden registrarse, etiquetarse, agruparse y monitorizarse junto con los modelos en plataforma. Esto proporciona una visión operativa unificada de la inferencia de IA generativa en todos los entornos híbridos, garantizando la coherencia en el gobierno y el seguimiento del rendimiento.
AI Optimizer for Z automatiza la instalación y configuración de componentes clave de IA generativa de IBM Z, como IBM watsonx Assistant for Z, lo que garantiza una configuración rápida y fiable. Valida la infraestructura y proporciona un panel de control de estado para facilitar la monitorización. Esto reduce la complejidad y acelera el tiempo de producción.
Cuando AI Optimizer for Z se encuentra con IBM con watsonx Assistant for Z en IBM Spyre, las empresas obtienen lo mejor de ambos mundos: optimización de aplicación e inferencia en perfecta armonía. El optimizador de IA garantiza que cada consulta, inferencia y modelo de llamada se enrute, almacene en caché y se escale para lograr la máxima eficacia, mientras que el asistente ofrece una interacción conversacional natural con los clientes y los empleados. Al ejecutarse en la arquitectura de alto rendimiento y eficiencia energética de Spyre, los dos juntos permiten respuestas más rápidas, menor latencia y visibilidad de extremo a extremo, transformando las interacciones con los clientes en experiencias fluidas con IA que son más inteligentes, rápidas y diseñadas para la empresa escala.
Simplifique y transforme la forma en que los usuarios interactúan y gestionan el mainframe con IA.
Acelere la innovación en IA a escala con la infraestructura de IBM.