作为 IBM z17 的一部分，IBM Spyre Accelerator 与 Telum II 处理器相结合，将改变企业在组织中利用 AI 的方式。这些开创性的能力旨在帮助您扩展企业 AI 工作量、增强安全性并加速实现业务价值。
IBM Spyre Accelerator 将于 2025 年 10 月 28 日在 IBM z17 上正式发布，预计将彻底改变组织在企业中应用 AI 的方式。这个功能强大的 AI 加速器旨在将生成式 AI 引入 IBM z17，使企业能够在 IBM Z 环境的可信范围内扩展大语言模型 (LLM) 功能。
借助 Spyre Accelerator，客户将能够在内部运营中使用大语言模型 (LLM)，并将功能集成到如 watsonx Assistant for Z 的自然语言界面中。随着客户评估和构建未来，智能体式 AI 将成为整个数据中心流程效率和现代化的关键工具。同样，在商业领域，Spyre Accelerator 的设计旨在助力未来开发更高精度的人工智能技术，从而能够实时生成资产、摄取并解析供应商或客户数据以用于市场拓展、交叉销售乃至风险评估。
将预测式与生成式 AI 技术结合的优势，在整个编码器、解码器及编码器-解码器 AI 模型的全范围内，构建企业级 AI 组合。
一位客户非常清楚核心可信环境与企业级目标的交叉点。欧洲一家大型银行的基础设施负责人表示：“对我们来说，将 Spyre Accelerator 与 IBM Z 部署在本地非常重要，因为这项工作将涉及生产代码。我们不希望生产工作量脱离我们的控制，因此这是我们最喜欢的选择。”
AI 驱动的工具可以帮助客户快速预测在繁忙交易日所需的下一步操作，或整合推荐的智能体和 API，从新应用中获得优化输出，加速业务价值的实现。根据商业价值研究院和牛津经济研究院 2024 年的一项研究，61% 的高管认为生成式 AI 对于大型机上的应用程序现代化工作至关重要。
作为持续交付的一部分，IBM watsonx Assistant for Z、AI Toolkit for IBM Z 和 IBM LinuxONE 以及 Machine Learning for IBM z/OS 等关键软件产品将使用 Spyre Accelerator 进行完全的本地部署。为了实现本地部署 LLM 支持，每个 Spyre Accelerator 包含 32 个 AI 优化的处理核心，可直接在大型机上支持大语言模型，使企业能够在本地部署运行受保护的生成式 AI 用例。该基础设施被设计为可扩展（通过 PCIe 连接的适配器），并可作为现有核心数据处理环境的一部分进行管理。这是一个重要的里程碑，使企业能够在 IBM Z 上大规模利用 AI 的同时保留数据。
IBM 的 Telum II 处理器和 Spyre Accelerator 将彻底改变大型机交易中的 AI 集成，旨在在 IBM Z 环境中提供增强的安全性、低延迟和高交易速率。实时决策已通过 IBM z17 改变了游戏规则，每天使用多个 AI 模型进行信用卡欺诈检测，可处理高达 4,500 亿次推理操作。
借助 Telum II 第二代片上 AI 加速器，企业可以同时运行多个模型，其设计旨在实现持续的低延迟和高推理吞吐量。随着应用开始构建更深层的模型以通过揭示新的、此前无法获得的洞察来提高准确性，Spyre Accelerator 为未来提供了多种大语言模型 (LLM) 选项。
一家欧洲大型企业的 IT 架构师表示：“由于 watsonx Assistant for Z 旨在回答有关 IBM Z 的问题，并在 IBM Z 上提供自动化，我们更倾向于在 IBM Z 上端到端部署它，以继续保障数据和流程的安全。”
这种强大的组合将助力组织解锁新的业务价值，使他们能够通过减少欺诈检测中的误报，每天更准确地处理数十亿次推理请求，并旨在改善客户服务机会。
IBM Z 上的 AI 加速由 Spyre Accelerator 和 Telum II 处理器提供支持，为企业加速数字化转型提供了无与伦比的机会。通过将 AI 集成到运营中，您可以改进系统管理，加快建议速度，以便最新的团队成员也能快速理解和采取行动，并确保敏感数据的安全。
现在是采取行动的时候了：采用这些创新来实现大型机应用程序的现代化、优化成本并保持竞争优势。