专为扩展和优化生成式 AI 推理而设计
IBM AI Optimizer for Z 可在 IBM® Z 上实现高性能、策略驱动型 AI 推理，旨在满足企业级生成式 AI 的需求。它由 IBM® Spyre 加速器提供支持，为运行全球任务关键型工作量的平台引入低延迟、高吞吐量且高度安全的模型执行能力。
随着生成式 AI 重塑商业战略，依靠 IBM Z 运行的组织面临着一项明确的任务：高效、安全地扩展 AI，同时避免基础设施成本失控。AI Optimizer for Z 2.1 通过优化数据和交易基于 Z 实时进行的推理来解决这一问题，从而缩短实现价值的时间，同时消除阻碍 AI 应用的低效环节。
AI Optimizer for Z 设有两个版本：进阶版和基础版。
AI Optimizer for Z 2.1 基础版能够无缝自动化安装 IBM® watsonx Assistant for Z 3.1 和 IBM® Software Hub 5.2，从而扩展自动化能力。
借助企业级可观测性，全面了解 IBM Z 中的生成式 AI 推理。通过内置 Prometheus 和 Grafana 仪表板，深入洞察分析以下信息：
这一透明度有助于消除过度配置、简化容量规划并推动更明智的基础设施投资。
AI Optimizer for Z 2.1 引入分阶段缓存模型以加速生成式 AI 推理：
AI Optimizer 可注册在 Spyre 上运行的模型以执行优化。用户可以配置专属路由策略，或依赖内置智能路由器——这些路由器会考量性能、可用性和使用模式。语义标记功能支持对模型进行分组，以执行符合用例的路由，从而提高推理请求的灵活性。
部署在 IBM Z 或 LinuxONE 之外的模型可以与平台内模型共同进行注册、标记、分组和监控。这能为跨混合环境的生成式 AI 推理提供统一的运营视图，从而确保治理和性能跟踪的一致性。
AI Optimizer for Z 可自动安装和配置 IBM Z 关键生成式 AI 组件和产品（例如 IBM watsonx Assistant for Z），确保设置快速稳定。它可以验证基础设施，并提供运行状况仪表板以便进行监控。这有助于降低复杂性并加快生产时间。
当 AI Optimizer for Z 与 IBM Spyre 加速器上的 IBM watsonx Assistant for Z 相结合时，企业就能实现“两全其美”，即应用程序和推理优化的高效协同。AI Optimizer 可确保每一次查询、推理和模型调用都能路由、缓存和扩展，以最大限度提高效率，同时 Assistant 还可提供与客户和员工的自然对话式互动。这两者基于 Spyre 的高性能、高能效架构运行，共同实现更快的响应、更低的延迟和端到端可见性，将客户交互转变为更智能、更快速、更适配企业规模的人工智能驱动型无缝体验。
使用 AI 简化和转变用户与大型机交互和管理大型机的方式。
借助 IBM 基础设施，加速规模化 AI 创新。