IBM Cloud 上的 AMD Instinct MI300X GPU

旨在为生成式 AI 工作负载和 HPC 应用程序提供领先的性能
适用于 AI 的 IBM Cloud 基础架构
AMD Instinct MI300X GPU 配备 192 GB HBM3 显存

这款强大的 GPU 可为任意规模的数据中心提供领先的性能。此类 GPU 具备出众的计算性能、超大内存密度和高带宽内存,甚至还可为特殊数据格式提供支持,因而非常适合为要求最严苛的 AI 与 HPC 工作负载提供支持。

对 IBM watsonx®、Red Hat® OpenShift® Kubernetes Service 以及基于 Terraform 的自动化部署的支持计划于 2025 年上半年提供。对 Red Hat OpenShift AI 集群、IBM Cloud® Kubernetes Service 以及 IBM Cloud 上的可部署架构的支持则计划于 2025 年下半年提供。

优势
基于纯色背景呈现的图表与图形插图
大规模降低 TCO

192GB HBM3 显存以更高性价比支持生成式 AI 运算,可部署更多或更大型 AI 模型,从而有效减少所需 GPU 数量。

代表文档和流程整合的云图标插图
卓越的 AI 和 HPC 性能

该 GPU 针对 FP8、FP16、BF16 与 INT8 精度的矩阵和张量运算进行了优化,从而可平衡性能和准确性。

在不同部分和功能中显示各种颜色的应用程序插图
开放式开发

AMD-ROCm 开放式软件包含一系列编程模型、工具、编译器、库和运行时。通过支持行业领导者部署的 API,开发人员可以轻松移植开发代码。

IBM Cloud 上的 MI300X 实例
IBM Cloud 上的实例具有以下规格
  • 208 个 vCPU
  • 1792 GB 内存
  • 8 x 3.2 TB 的实例存储空间
  • 8 个 AMD Instinct MI300X GPU
根据您的基础设施和软件要求进行部署

在 IBM Cloud® Virtual Server for VPC 上,AMD Instinct MI300X GPU 可与第 4 代 Intel Xeon® 处理器搭配使用。

适用于 AI 的 IBM Cloud 基础架构
在 IBM Cloud Virtual Private Cloud (VPC) 上配置独立服务器

AMD Instinct MI300X GPU 可通过用于 VPC 云实例的 IBM Cloud Virtual Server for VPC 进行部署。IBM Cloud VPC 是为软件定义网络 (SDN) 内的高弹性和安全性而设计的,客户可以在其中构建隔离的私有云,并获得基本的公有云优点。AMD Instinct MI300X GPU 云实例还支持 Red Hat Enterprise Linux AI 映像,非常适合拥有高度专业化软件堆栈的客户或需要完全控制底层服务器的客户。

配置、定价和报价
资源
代表地球的抽象插图
IBM watsonx.ai 演示
参观 watsonx.ai®开发者工作室。构建提示,试用基础模型并创建 ML 模型。
观看有关 Red Hat OpenShift AI on IBM Cloud 的短视频。
带有圆圈且蓝白相间的设计。
IBM Cloud VPC 文档
了解有关 IBM Cloud Virtual Private Cloud 的更多信息。浏览配置指南、教程等。
相关产品
Watsonx(含子品牌徽标)
IBM watsonx
深入了解全套 AI 产品组合,这些产品可加快生成式 AI 在核心工作流程中的影响,从而提高生产力。
一名开发人员在笔记本电脑上使用混合云技术(包括 Red Hat OpenShift、Kubernetes 和 IBM Cloud)进行工作的插图。
Red Hat AI on IBM Cloud
借助 Red Hat AI InstructLab™、Red Hat OpenShift AI 和 Red Hat Enterprise Linux® AI,将任务关键型 AI 应用程序和计划推向市场。
创业搭档查看笔记本电脑讨论发展战略。
IBM Cloud Kubernetes Service
选择经过认证的托管 Kubernetes 解决方案,它专为在 IBM Cloud 上创建计算主机集群以部署容器化应用程序而构建。IBM 可管理主实例,从而使您摆脱主机操作系统、运行时与版本更新流程。
专业的 IT 程序员在数据中心工作,使用一台带有三个显示器的台式电脑。
IBM Cloud 上的可部署架构
加速创新,提高效率,保持安全性与合规性,同时优化成本。
标有图标和数字的编号流程图。
IBM Cloud 上的检索增强生成 (RAG) 模式
利用支持的 IBM Cloud 与 watsonx 服务来自动部署 RAG,并将您的企业数据嵌入生成式 AI 解决方案。
服务器机房内的通道
IBM Cloud Virtual Servers for VPC
使用高度可扩展的单租户和多租户虚拟机,您可以快速启动它们以实现最大程度的网络隔离和控制。
开始使用

深入了解 IBM Cloud 上的 AMD MI300X GPU 实例。

 

配置和价格 查看文档