适用于生成式 AI 工作负载且功能强大、经济高效、开放的 AI 加速器。
利用 IBM Cloud® 上的 Intel® Gaudi ® 3 AI 加速器,解锁、创新并部署新的 AI 解决方案。该解决方案旨在帮助您经济高效地进行扩展以满足企业 AI 需求,并实现高性能、灵活部署和开放式开发。
支持各种生成式 AI 推理应用程序和框架,包括大语言模型 (LLM) 和多模态模型 (MMM)。借助 IBM Cloud Virtual Server for VPC 部署快速入门。对 IBM watsonx®、Red Hat® OpenShift® Kubernetes Service 以及基于 Terraform 的自动化部署的支持计划于 2025 年上半年提供。对 Red Hat OpenShift AI 集群、IBM Cloud Kubernetes Service 以及 IBM Cloud 上的可部署架构的支持计划于 2025 年下半年推出。
了解有关 Intel Gaudi 3 技术的更多信息
在 IBM Cloud Virtual Server for VPC 上,Intel Gaudi 3 AI 加速器可与第 5 代 Intel Xeon 处理器搭配使用。
Intel Gaudi 3 AI 加速器可通过 IBM Cloud Virtual Server for VPC 云实例进行部署。IBM Cloud VPC 专为实现软件定义的网络内的高弹性和安全性而设计,客户可在其中构建隔离的私有云,同时维持基本的公有云优点。Intel Gaudi 3 云实例还支持 Red Hat Enterprise Linux AI 映像,因而非常适合拥有高度专业化软件堆栈的客户或是需要完全控制底层服务器的客户。
IBM Cloud 上的 Intel® Gaudi® 3 AI 加速器专为处理高性能 AI 工作负载而设计,它配备有 64 个张量处理器核心 (TPC) 和 8 个矩阵乘法引擎 (MME),从而有助于加快深度神经网络计算。IBM Cloud 上的 Intel® Gaudi® 3 AI 加速器还配备 128 GB 的 HBM2E 内存,并提供高达 3.7 TB/s 的内存带宽,同时支持附带 24x200 GbE 端口的行业标准以太网连接,从而可提供 9.6 Tbps 的双向带宽以实现可扩展的系统互连。
Intel® Gaudi® 3 AI 加速器提供广泛的 AI 应用支持,其中包括推理、3D 生成、文本生成、分类、视频生成、情感、翻译、图像生成、摘要和问答,并重点关注多模态、大语言模型 (LLM) 和检索增强生成 (RAG)。
IBM Cloud 上的 Intel ®Gaudi® 3 AI 加速器配备 128 GB 的 HBM2E 内存和高达 3.7 TB/s 的内存带宽,有助于确保快速数据吞吐量,从而减少瓶颈并让开发人员更快、更高效地处理海量数据集。
在 IBM Cloud Virtual Private Cloud (VPC) 上,IBM Cloud 上的 Intel® Gaudi® 3 AI 加速器安装在 IBM Cloud Virtual Servers 中。IBM Cloud VPC 是一种高度弹性和安全的软件定义网络 (SDN),您可在其上构建隔离的私有云,同时维持基本的公有云优点。IBM Cloud VPC 上的 Intel® Gaudi® 3 虚拟服务器配置文件是一种由 vCPU、RAM 和存储空间构成的预配置组合,它可快速启动虚拟服务器实例。
IBM Cloud 上的 Intel® Gaudi® 3 AI 加速器
支持各种主流框架,
其中包括 PyTorch、ONNX 和 DeepSpeed。Hugging Face 提供了 40 多万个模型,且经过优化以便与
Optimum Habana 软件库搭配使用。完整的 Intel® Gaudi®
软件套件与框架支持旨在简化迁移,
以便开发人员只需修改最少的代码即可集成现有模型。