人工智能驱动的创新助力业务增长
将 AI 融入每笔交易(无需数据迁移),同时满足最严苛的服务级别协议 (SLA) 和响应时间要求。
在数据原生存储位置运行 AI,既保障敏感信息安全,又能满足法规要求。
利用 IBM z17,每日可处理高达 4500 亿次推理操作,实时用例响应时间低至 1 毫秒。1
将推理请求路由至任意空闲的集成式 AI 加速器,推理吞吐量相比 IBM z16 提升 7.5 倍。2
IBM® watsonx Assistant for Z 为 IBM Z 平台提供规模化部署的安全且支持 AI 的虚拟代理,以实现更智能的客户交互和智能体式工作流。
Machine Learning for IBM z/OS 支持用户在交易应用程序中部署机器学习模型,同时维护 SLA。
AI Toolkit for IBM Z 是针对 Telum 处理器而优化的一系列受支持的开源 AI 框架,同时在 IBM® z16 和 IBM z17 系统中采用片上 AI 加速。
IBM® Synthetic Data Sets 是一系列人工生成的数据集,旨在增强预测性 AI 模型训练和 LLM。
¹ 免责声明:性能结果基于 IBM 在 9175 机型系统硬件上开展的内部测试推算得出。基准测试采用单线程运行本地推理操作,通过基于 LSTM 的合成信用卡欺诈检测模型调用 Integrated Accelerator for AI。测试批量大小为 160。IBM 系统硬件配置:1个 LPAR 运行 Red Hat Enterprise Linux 9.4,配备 6 个 IFL(含 SMT 同步多线程)、128 GB 内存;另 1 个 LPAR 配置 2 个 CP、4 个 zIIP 及 256 GB 内存,运行 IBM® z/OS 3.1 并启用 z/OS Container Extensions (zCX) 功能。结果可能有所不同。
2 免责声明:性能结果基于 IBM z16 与 z17 系统上利用 IBM® Integrated Accelerator for AI 执行推理操作的内部测试。在 IBM z17 上,每个 IBM Integrated Accelerator for AI 允许抽屉内任意 CPU 将 AI 推理请求调度至同一抽屉中 8 个空闲 AI 加速器的任意一个。测试采用 8 个并行线程运行的推理操作,批量大小为 1。IBM z16 与 z17 均配置 2 个 GCP、4 个 zIIP(采用 SMT)及 256 GB 内存,运行 IBM z/OS V3R1 系统与 IBM Z 深度学习编译器 4.3.0,采用合成信用卡欺诈检测模型。结果可能有所不同。