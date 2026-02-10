Projetado para escalar e otimizar a inferência da IA generativa
O IBM AI Optimizer for Z oferece inferência da IA de alto desempenho e orientada por políticas diretamente no IBM Z, projetada para atender às demandas da IA generativa em escala empresarial. Impulsionado pelo acelerador IBM Spyre, ele traz execução de modelo de baixa latência, alta taxa de transferência e repleta de recursos de segurança para a plataforma que executa as cargas de trabalho de missão mais crítica do mundo.
À medida que a IA generativa remodela a estratégia de negócios, as organizações que operam no IBM Z enfrentam um mandato claro: escalar a IA de forma eficiente, segura e sem custos descontrolados de infraestrutura. O AI Optimizer for Z 2.1 lida com isso otimizando a inferência onde dados e transações já estão ativos (no Z), reduzindo o time to value enquanto elimina ineficiências que retardam a adoção da IA.
O AI Optimizer for Z está disponível em duas edições: Advanced Edition e Essentials Edition.
O AI Optimizer for Z 2.1 Essentials Edition amplia os recursos de automação com a automação sem dificuldades da instalação do IBM watsonx Assistant for Z 3.1 e do IBM Software Hub 5.2.
Obtenha visibilidade total da inferência da IA generativa em todo o IBM Z com observabilidade de nível empresarial. Os dashboards do Prometheus e Grafana fornecem insights profundos sobre:
Essa transparência ajuda a eliminar o provisionamento excessivo, a simplificar o planejamento de capacidade e a impulsionar investimentos mais inteligentes em infraestrutura.
O AI Optimizer for Z 2.1 introduz um modelo de cache em estágios para acelerar a inferência da IA generativa:
O AI Optimizer registra modelos em execução no Spyre para otimização. Os usuários podem configurar suas próprias estratégias de roteamento ou confiar no roteador inteligente integrado, que considera o desempenho, a disponibilidade e os padrões de uso. A marcação semântica permite o agrupamento de modelos para roteamento alinhado ao caso de uso, proporcionando, assim, mais flexibilidade nas solicitações de inferência.
Os modelos implementados fora do IBM Z ou LinuxONE podem ser registrados, marcados, agrupados e monitorados junto com os modelos na plataforma. Isso proporciona uma visão operacional unificada da inferência da IA generativa em ambientes híbridos, garantindo consistência na governança e no acompanhamento do desempenho.
O AI Optimizer for Z automatiza a instalação e a configuração dos principais componentes e produtos de IA generativa do IBM Z, como o IBM watsonx Assistant for Z, garantindo uma configuração rápida e confiável. Ele valida a infraestrutura e fornece um dashboard de integridade para facilitar o monitoramento. Isso reduz a complexidade e acelera o tempo de produção
Quando o AI Optimizer for Z encontra o IBM watsonx Assistant for Z no acelerador IBM Spyre, as empresas obtêm o melhor de dois mundos:otimização de aplicações e inferência em perfeita harmonia. O AI Optimizer garante que cada consulta, inferência e chamada de modelo seja roteada, armazenada em cache e dimensionada para máxima eficiência, enquanto o Assistant proporciona uma interação natural e conversacional com clientes e funcionários. Executados na arquitetura de alto desempenho e com eficiência energética do Spyre, os dois juntos permitem respostas mais rápidas, menor latência e visibilidade de ponta a ponta — transformando as interações com os clientes em experiências contínuas, impulsionadas por IA, mais inteligentes, rápidas e construídas para escala empresarial.
