IBM Z 上的 Telum 处理器

集成式 AI 加速器可在 IBM Z 平台上实现近乎实时的分析和经强化的性能
Telum II 和 Spyre Accelerator 深入了解 IBM z17

推动下一代性能和 AI 技术的发展

IBM Telum 处理器是一款先进的处理器,能够为 IBM z16 的诸多功能和优势提供支持。其继任者是驱动全新 IBM z17 的 Telum II,它在原有基础上增强了性能、增加了内存容量,并改善了 AI 加速能力。它旨在帮助客户实现跨银行、金融、贸易、保险应用场景和客户交互的业务洞察分析规模化改造。

Telum II 处理器芯片 第二代

为 IBM® z17 提供支持的 Telum II

IBM Telum II 处理器提供低延迟 DPU,用于加速 IO 操作。它拥有 32 个内核,这些内核分布于 4 个互联内核集群中,可确保缓存的一致性。该芯片包含 10 个 36 MB 二级缓存1以及扩展的虚拟 3 级 (360 MB) 和 4 级 (2.8 GB) 缓存,二者容量均增大 40%,从而提升了性能2

第一代 Telum 处理器芯片 第一代

Telum 为 IBM z16 提供支持

IBM Telum 处理器是一款 7 纳米 AI 驱动型芯片,具备 8 个 5 GHz 核心、32 MB 二级缓存,以及 256 MB 虚拟三级缓存和 2 GB 虚拟四级缓存。其每个核心的缓存比前代产品增加了 1.5 倍,进而提高了每个线程的性能,有助于确保大容量事务的快速响应和实时 AI 推理。

处理器功能
加速 AI 集成技术发展

Telum 处理器包含片上 AI 加速,支持实时分析和决策,而无需其他硬件。Telum II 通过提高 4 倍的计算能力和连接的处理集群来提升 AI 性能。3

高级安全性

Telum 处理器支持先进的加密技术,包括量子安全加密方法,可保护敏感数据免受网络威胁。Telum II 增强了 A 和 Z 总线链路的安全性,确保了合规性和防护性。4

高可用性

两款 Telum 处理器均通过冗余处理器连接确保可靠性,在维修期间通过备用 IO 路径实现不间断服务,这对于任务关键型应用程序的业务连续性至关重要。

低延迟

Telum 处理器的低延迟设计可实现高速事务处理和实时分析。Telum II 将缓存提升 40%,具有 10 个二级缓存以及扩容的二级、三级和四级缓存,可改善片外带宽和延迟。5

高超的处理能力

Telum 处理器为 IBM z16 提供支持,以高性能和低延迟实现快速事务处理和分析。Telum II 为 IBM z17 提供支持,预计将达到 5.5 GHz,在提高速度的同时高效管理大量工作负载。6

能效

Telum 的节能功能通过降低 IBM z16 的电力使用和运营成本来增强可持续性。Telum II 对此进行了进一步改进,通过集中式 IO 和 DPU 设计将核心功耗降低高达 15%,从而提高效率。7

扩展未来的企业 AI 工作负载

PCIe 芯片 Spyre Accelerator

IBM Spyre Accelerator 通过一款 75W Gen 5x PCIe 连接的 AI 加速器进行交付,并配备 128 GB LPDDR5 内存。8它旨在处理更庞大、更复杂的 AI 用例,包括生成式 AI 和多模态 LLM,配备 32(+2)个核心,每个核心设有 2 MB 暂存器,且核心利用率高于 55%。通过卡片和抽屉进行扩展,客户可以利用这种有效的解决方案应对新一代 AI 挑战。

阅读有关 Spyre Accelerator 的博客
采取后续步骤

了解采用 IBM Telum 处理器的现代服务器系列。

深入了解 IBM z17 深入了解 IBM z16
脚注

1,2,3,4,5,6,7 Telum II 的所有预测均基于发布前的硬件测量和配置。

IBM Spyre Accelerator 目前处于技术预览阶段。