图形处理单元(又称为图形处理器或 GPU)是一种旨在加速各种设备上的计算机图形和图像处理的电子电路。这些设备包括视频卡、系统板、移动设备和个人计算机 (PC)。
GPU 可快速执行数学计算,从而减少计算机运行多个程序所需的时间。GPU 的这一特性使其成为机器学习 (ML)、人工智能 (AI) 和区块链等新兴和未来科技发展的重要推动力。
在上世纪 90 年代 GPU 发明之前,PC 和电子游戏控制器中的图形控制器依靠计算机的中央处理单元 (CPU) 来执行任务。自上世纪 50 年代初以来,CPU 一直是计算机中最重要的处理器,可执行运行程序所需的所有指令,例如逻辑、控制和输入/输出 (I/O)。
然而,随着上世纪 90 年代个人游戏和计算机辅助设计 (CAD) 的出现,业界需要一种更快、更有效的方式迅速组合像素。
2007 年,Nvidia 构建了 CUDA™(计算统一设备架构),这是一种软件平台和应用程序编程接口 (API),该软件平台支持开发人员直接访问 GPU 的并行计算能力,因此 GPU 技术得以应用于比以前更广泛的领域。
二十一世纪前 10 年,GPU 技术取得了飞跃性发展,其中最重要的也许是光线追踪(通过追踪来自相机的光线方向生成计算机图像)和张量核心(旨在实现深度学习)。
因为这些进步,GPU 在 AI 加速和深度学习处理器中发挥了重要作用,并有助于加快 AI 和 ML 应用程序的开发。如今,除了为游戏机和剪辑软件提供支持之外,GPU 还为对许多企业至关重要的尖端计算功能提供动力。
GPU 有自己的快速存取存储器 (RAM) – 一种电子存储器,用于存储芯片可以根据需要访问和修改的代码和数据。高级 GPU 通常具有专门构建的 RAM,用于保存图形编辑、游戏或 AI/ML 用例等计算密集型任务所需的大量数据。
两种热门的 GPU 内存是第六版图形用双倍数据速率同步动态随机访问存储器 (GDDR6) 和新一代 GDDR6X。GDDR6X 每个传输位的功耗比 GDDR6 低 15%,但由于其速度更快,因此总体功耗也更高。iGPU 可以集成到计算机的 CPU 中,也可以插入 CPU 旁的插槽中,并通过 PCI Express 端口连接。
CPU 和 GPU 在设计上具有相似性,例如都拥有用于处理任务的众多核心和晶体管,但 CPU 在功能上比 GPU 更具通用性。GPU 往往专注于单一的特定计算任务,例如图形处理或机器学习。
CPU 是计算机系统或设备的心脏和大脑。CPU 从程序或软件应用程序接收有关任务的一般指令或请求。GPU 执行的任务更具体,通常涉及高分辨率图像和视频的快速处理。GPU 通过不断执行图形渲染或其他计算密集型功能所需的复杂数学计算来完成任务。
最大区别之一是,CPU 倾向于使用较少的核心并以线性顺序执行任务,而 GPU 拥有数百甚至数千个核心,支持并行处理,因此处理速度快如闪电。
第一批 GPU 是为了加速 3D 图形渲染而构建,能够让电影和视频游戏场景看起来更加逼真和引人入胜。第一款 GPU 芯片是 Nvidia 的 GeForce,于 1999 年发布,随后迅速进入快速增长期,由于其高速并行处理能力,GPU 功能得以扩展到其他领域。
并行处理或并行计算是一种依靠两个或更多处理器来完成整体计算任务的不同子集的计算方式。
在 GPU 出现之前,老一代计算机一次只能运行一个程序,通常需要数小时才能完成一项任务。GPU 的并行处理功能可以同时执行许多计算或任务,因此比老式计算机中的 CPU 更快速、更高效。
GPU 分为三种类型:
独立 GPU 或 dGPU,是独立于设备 CPU 的图形处理器,CPU 负责接收和处理信息,以便计算机能够正常工作。独立 GPU 通常用于具有特殊要求的高级应用,如剪辑、内容创建或高端游戏。它们是不同的芯片,配备用于分离电路板的连接器,并使用快捷插槽连接到 CPU。
使用最广泛的其中一款独立 GPU 是 Intel Arc 品牌,专为 PC 游戏行业打造。
集成 GPU 或 iGPU 内置于计算机或设备的基础架构中,通常位于 CPU 旁边。集成 GPU 设计由英特尔于 2010 年代推出。随后,MSI、ASUS 和 Nvidia 等厂商也意识到 GPU 与 CPU 相结合的强大优势(不需要用户自行通过 PCI Express 插槽添加 GPU),因此集成 GPU 变得越来越受欢迎。如今,集成 GPU 仍然是笔记本电脑用户、游戏玩家和其他在 PC 上运行计算密集型程序的用户的热门选择。
虚拟 GPU (vGPU) 具有与独立或集成 GPU 相同的功能,但没有硬件。虚拟 GPU 只是为云实例构建的软件版本的 GPU,可用于运行相同的工作负载。此外,由于没有硬件,虚拟 GPU 比实体产品更简单、维护成本更低。
云 GPU 是指通过云服务提供商 (CSP) 访问虚拟 GPU。近年来,受云计算加速发展和基于 AI/ML 的应用程序日益普及的推动,基于云的 GPU 服务市场不断增长。根据《财富商业洞察》的报告,2023 年 GPU 即服务 (GPUaaS) 市场的价值为 32.3 亿美元,预计在 2024 年增至 43.1 亿美元,并于 2032 年升至 498.4 亿美元。1
许多 CSP(包括 Google Cloud Platform、Amazon Web Services (AWS)、Microsoft 和 IBM Cloud)都提供按需访问可扩展 GPU 服务,以优化工作负载性能。CSP 在数据中心中提供按即用即付的虚拟化 GPU 资源。他们通常使用 Nvidia、AMD 和 Intel 等顶级 GPU 制造商提供的 GPU 硬件为基于云的基础设施提供支持。
基于云的 GPU 产品通常带有预配置,并且可以轻松部署。这些功能可帮助组织避免与物理 GPU 相关的前期成本和维护。此外,随着企业希望整合生成式 AI 工作负载以执行高级计算任务(例如,内容创建、图像生成),基于云的 GPU 提供的可扩展性和成本效益对企业业务至关重要。
GPU 基准测试提供在各种条件下评估 GPU 性能的流程。这些专业软件工具允许用户(例如游戏玩家、3D 艺术家、系统开发人员)深入了解他们的 GPU 并解决性能问题,例如瓶颈、延迟以及与其他软件和硬件的兼容性。
GPU 基准测试有两种主要类型:综合基准测试和真实世界基准测试。综合基准测试测试 GPU 在标准化环境中的原始性能。真实世界基准测试测试 GPU 在特定应用程序中的性能。
GPU 基准测试工具着眼于速度、帧速率和内存带宽等性能指标。此外,它们还关注热效率和功耗,以帮助用户根据特定需求实现最佳性能。一些 GPU 基准测试平台还包括测量固态硬盘 (SSD)与 GPU 交互效果的测试。
随着 GPU 不断发展,技术进步使其可编程能力得到了提升,并逐渐挖掘出更多功能。具体来说,GPU 能够将任务分配给多个处理器执行,这种并行处理能力使其成为众多应用不可或缺的工具,例如 PC 游戏、高性能计算 (HPC)、3D 渲染工作站、数据中心计算等。
以下是 GPU 技术的一些最重要的现代应用:
可以说,没有 GPU 计算,AI 及其众多应用就无从谈起。GPU 能够比传统 CPU 更快速、更高效地解决高度技术性问题,因此不可或缺。GPU 是许多超级计算机的关键组件,对 AI 超级计算机来说尤其如此。
GPU 为许多领先的 AI 应用提供支持,例如 IBM 的云原生 AI 超级计算机 Vela,这些应用需要高速处理能力才能在越来越大的数据集上进行训练。AI 模型在数据中心 GPU 上训练和运行,通常由开展科学研究或其他计算密集型任务的企业运营。
机器学习 (ML) 是 AI 的一个重要分支,它使用数据和算法来模仿人类的学习方式。深度学习 (DL) 是机器学习的一个子集,它利用神经网络来模拟人脑的决策过程。GPU 技术对于这两个领域的技术进步至关重要。
在 ML 和 DL 领域,GPU 赋予模型处理海量数据集,并以与人类类似的方式进行推理的能力。得益于其强大的并行计算能力,GPU 在内存和优化方面具有显著优势。此外,用于 ML 和 DL 的 GPU 比 CPU 使用的资源更少,但性能和精度并未降低。
区块链是一种用于记录业务网络中的交易和追踪资产的分类账系统,它严重依赖 GPU 技术,尤其是在“工作证明”这一环节中。在许多广泛使用的区块链中,例如加密货币,工作证明步骤对于交易验证至关重要,是交易得以添加到区块链中的必要条件。
游戏行业在上世纪 90 年代首次利用 GPU 的强大功能,以更高的速度和图形准确性改善了整体游戏体验。如今,个人游戏已成为高度计算密集型领域,因其具有超逼真的场景、实时交互以及广阔、身临其境的游戏世界。
虚拟现实 (VR)、更高刷新率和更高分辨率屏幕等游戏趋势均有赖于 GPU 在要求越来越高的计算环境中快速提供图形。用于游戏的 GPU 包括 AMD Radeon、Intel Arc 和 Nvidia GeForce RTX。
长期以来,漫长的渲染时间一直困扰着消费级和专业级编辑软件用户。GPU 自问世以来,稳步减少了 Final Cut Pro 和 Adobe Premiere 等视频编辑产品所需的处理时间和计算资源。
如今,具备并行处理能力和内置 AI 的 GPU 大大提升了从专业编辑套件到智能手机应用等各种应用的编辑功能。
处理、性能和图形质量的改进,让 GPU 成为内容创作行业转型的重要推动力量。如今,拥有顶级显卡和高速互联网的内容创作者可以生成逼真的内容,通过 AI 和机器学习对其进行增强,然后以前所未有的速度对其进行编辑并流式传输给现场观众。所有这一切在很大程度上要归功于 GPU 技术的进步。
在 HPC 系统中,GPU 使用并行处理能力来加速计算密集型任务,例如药物发现、能源生产和天体物理学等领域中的复杂数学计算和大型数据分析。
许多行业对 GPU 都有很高的需求,为的是增强复杂专业应用程序的使用体验和训练能力,包括产品演示、CAD 绘图以及医学成像和地震或地球物理空间成像等应用领域。 GPU 借助三维动画、AI 和 ML、高级渲染以及超逼真的虚拟现实 (VR) 和增强现实 (AR) 体验,在高级可视化(例如消防员、宇航员、教师等专业人员培训)方面发挥着至关重要的作用。
此外,工程师和气候科学家利用 GPU 支持的仿真应用程序来预测各种复杂现象,如天气状况、流体流动、天体运行以及车辆在特定条件下的行为方式。Nvidia RTX 是最强大的 GPU 之一,可用于科学可视化和能源勘探。
随着 AI 和生成式 AI 应用的激增,值得研究其他两种专用处理设备以及它们与 GPUS 的比较情况。当今的企业业务根据自身的特定需求使用所有三种类型的处理器(CPU、GPU 和 FPGA)。
神经处理单元 (NPU) 是一种专门用于模仿人脑处理功能的计算机微处理器。NPU 也称为 AI 加速器、AI 芯片或深度学习处理器,是一种旨在加速 AI 神经网络、深度学习和机器学习的硬件加速器。
NPU 和 GPU 都可以增强系统的 CPU,但它们之间存在显著差异。GPU 包含数千个核心,以实现图形渲染和游戏所需的快速、精确的计算任务。NPU 旨在加速 AI 和生成式 AI 工作负载,实时确定数据流和内存层次结构的优先级,同时具有低功耗和延迟。
高性能 GPU 非常适合深度学习或 AI 应用程序,因其可在多个核心中处理大量计算,且拥有大量可用内存。现场可编程门阵列 (FPGAs) 是多种类型的集成电路,可针对不同的功能重新编程。与 GPU 相比,FPGA 具备灵活性和成本效益,因此可为需要低延迟的深度学习应用程序(例如医学成像和边缘计算)提供更好的性能。
所有链接均为 IBM 外部链接。
1 《财富商业洞察:GPU 即服务市场规模、份额和行业分析》 ,《财富商业洞察》,2024 年 12 月 9 日
IBM Cloud Virtual Server for VPC 是基于 IBM Cloud Virtual Private Cloud 构建的 Intel x86、IBM Z 和 IBM LinuxONE 虚拟服务器系列。
IBM Cloud 专用服务器提供可扩展的 Web 托管解决方案,具有无限的免费回程流量和广泛的自定义选项。
利用 IBM 的云咨询服务发掘新功能并提升业务敏捷性。了解如何通过混合云战略和专家合作共同制定解决方案、加快数字化转型并优化性能。