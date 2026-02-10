AI Optimizer for Z 

Projetado para escalar e otimizar a inferência da IA generativa

Liberação de IA no IBM Z com o AI Optimizer para Z Advanced Edition
Qua, 28 de janeiro de 2026, 9:30 EST

Visão geral

O IBM AI Optimizer for Z oferece inferência da IA de alto desempenho e orientada por políticas diretamente no IBM Z, projetada para atender às demandas da IA generativa em escala empresarial. Impulsionado pelo acelerador IBM Spyre, ele traz execução de modelo de baixa latência, alta taxa de transferência e repleta de recursos de segurança para a plataforma que executa as cargas de trabalho de missão mais crítica do mundo.

À medida que a IA generativa remodela a estratégia de negócios, as organizações que operam no IBM Z enfrentam um mandato claro: escalar a IA de forma eficiente, segura e sem custos descontrolados de infraestrutura. O AI Optimizer for Z 2.1 lida com isso otimizando a inferência onde dados e transações já estão ativos (no Z), reduzindo o time to value enquanto elimina ineficiências que retardam a adoção da IA.

O AI Optimizer for Z está disponível em duas edições: Advanced Edition e Essentials Edition.

O AI Optimizer for Z 2.1 Essentials Edition amplia os recursos de automação com a automação sem dificuldades da instalação do IBM watsonx Assistant for Z 3.1 e do IBM Software Hub 5.2.

Características principais

Monitoramento e visualizações em tempo real

Obtenha visibilidade total da inferência da IA generativa em todo o IBM Z com observabilidade de nível empresarial. Os dashboards do Prometheus e Grafana fornecem insights profundos sobre:

  • Inferência de latência e desempenho
  • Utilização de hardware e Spyre
  • Uso de modelos e atividade entre aplicações
  • Identificação de gargalos e anomalias

Essa transparência ajuda a eliminar o provisionamento excessivo, a simplificar o planejamento de capacidade e a impulsionar investimentos mais inteligentes em infraestrutura.

Cache multinível

O AI Optimizer for Z 2.1 introduz um modelo de cache em estágios para acelerar a inferência da IA generativa:

  • Nível 1: armazenamento em cache de chave-valor (KV) por implementação de modelo em várias unidades de hardware, levando à utilização otimizada do hardware.
  • Nível 2: cache compartilhado em várias implementações de modelo. O cache reduz o tempo até o primeiro token (TTFT), melhora o rendimento e também otimiza a utilização do hardware.
Inferência otimizada (para modelos no Spyre)

O AI Optimizer registra modelos em execução no Spyre para otimização. Os usuários podem configurar suas próprias estratégias de roteamento ou confiar no roteador inteligente integrado, que considera o desempenho, a disponibilidade e os padrões de uso. A marcação semântica permite o agrupamento de modelos para roteamento alinhado ao caso de uso, proporcionando, assim, mais flexibilidade nas solicitações de inferência.

Registro externo de LLM

Os modelos implementados fora do IBM Z ou LinuxONE podem ser registrados, marcados, agrupados e monitorados junto com os modelos na plataforma. Isso proporciona uma visão operacional unificada da inferência da IA generativa em ambientes híbridos, garantindo consistência na governança e no acompanhamento do desempenho.

Implementação simplificada da IA generativa para IBM Z

O AI Optimizer for Z automatiza a instalação e a configuração dos principais componentes e produtos de IA generativa do IBM Z, como o IBM watsonx Assistant for Z, garantindo uma configuração rápida e confiável. Ele valida a infraestrutura e fornece um dashboard de integridade para facilitar o monitoramento. Isso reduz a complexidade e acelera o tempo de produção

 

AI Optimizer on Z e watsonx Assistant for Z

Quando o AI Optimizer for Z encontra o IBM watsonx Assistant for Z no acelerador IBM Spyre, as empresas obtêm o melhor de dois mundos:otimização de aplicações e inferência em perfeita harmonia. O AI Optimizer garante que cada consulta, inferência e chamada de modelo seja roteada, armazenada em cache e dimensionada para máxima eficiência, enquanto o Assistant proporciona uma interação natural e conversacional com clientes e funcionários. Executados na arquitetura de alto desempenho e com eficiência energética do Spyre, os dois juntos permitem respostas mais rápidas, menor latência e visibilidade de ponta a ponta — transformando as interações com os clientes em experiências contínuas, impulsionadas por IA, mais inteligentes, rápidas e construídas para escala empresarial.
Anúncio

Liberando a inferência da IA generativa de escala empresarial - anunciando o GA do IBM AI Optimizer for Z 2.1.

Leia o artigo no blog

Recursos

Dê o próximo passo

Descubra como usar IA e aprendizado de máquina para converter dados de cada transação em insights em tempo real. 