与通用中央处理单元 (CPU) 或图形处理单元 (GPU) 不同,NPU 专为加速人工智能任务和工作负载而设计,例如计算由标量、向量和张量数学组成的神经网络层。
NPU 也被称为 AI 芯片或 AI 加速器,通常用于组合多个处理器(例如 CPU 和 GPU)的异构计算架构中。大型数据中心可以使用直接连接到系统主板的独立 NPU;然而,大多数消费类应用(如智能手机、移动设备和笔记本电脑)则将 NPU 与其他协处理器集成在单个半导体微芯片上,该芯片被称为片上系统 (SoC)。
通过集成专用 NPU,制造商能够提供在设备上运行的生成式人工智能应用,这些应用能够以相对低的功耗和高吞吐量实时处理人工智能任务、AI 工作负载以及机器学习算法。
神经处理单元 (NPU) 基于大脑的神经网络,通过在电路层模拟人类神经元和突触的行为来工作。这使得可以处理深度学习指令集,其中一条指令即可完成一组虚拟神经元的处理。
与传统处理器不同,NPU 并非用于精确计算。相比之下,NPU 是为特定问题解决功能专门设计的,并且能够随着时间不断改进,从不同类型的数据和输入中学习。整合 NPU 的 AI 系统可以利用机器学习,更快地提供定制解决方案,而无需更多的手动编程。
作为一项突出功能,NPU 提供卓越的并行处理能力,并且能够通过简化的高容量内核加速 AI 运营,这些内核无需执行多种类型的任务。NPU 包含用于乘法和加法、激活函数、二维数据操作以及解压缩的专用模块。专用的乘法和加法模块用于执行与神经网络应用处理相关的操作,例如计算矩阵乘法与加法、卷积、点积以及其他功能。
传统处理器需要数千条指令来完成此类神经元操作,而 NPU 或许只需要一条指令就能完成类似的操作。NPU 还会通过突触权重将存储与计算集成在一起,突触权重是一种分配给网络节点的流动计算变量,用于表示“正确”或“期望”结果的概率,并能随时间进行调整或“学习”,从而提高操作效率。
随着 NPU 技术的不断发展,测试显示某些 NPU 的性能比同等功耗的 GPU 高出 100 倍以上。
神经处理单元 (NPU) 的设计目的不是为了取代传统的 CPU 和 GPU。然而,NPU 的架构在两种处理器的设计基础上进行了改进,提供了无与伦比且更高效的并行计算和机器学习能力。NPU 能够提升一般操作性能(尽管最适合处理某些特定类型的通用任务),当与 CPU 和 GPU 结合使用时,相比传统系统,NPU 提供了若干显著优势。
主要优势如下:
在经典计算机科学领域,中央处理器 (CPU) 被视为计算机的“大脑”。CPU 承担大多数传统计算任务,并支持广泛的应用场景。虽然有许多不同的类型,但通常所有 CPU 都按线性顺序执行操作,按照请求传入的顺序响应请求。
从 20 世纪 50 年代到 90 年代,CPU 承担了几乎所有计算机处理任务,负责执行程序指令、控制系统运行及管理输入/输出操作。
高性能应用的持续需求使得历代 CPU 设计不断逼近硬件极限,频繁引发系统严重卡顿甚至崩溃。但是,随着 20 世纪 80 年代个人电脑游戏和计算机辅助设计 (CAD) 的兴起,行业对渲染计算机图形提出了更快、更高效的解决方案的需求。
图形处理单元 (GPU) 最初是为了将繁重的图像处理任务从主 CPU 中卸载出来而创建的。虽然 CPU 通常使用较少的核心来执行线性操作,但 GPU 拥有数百到数千个核心,能够进行并行处理,将大型任务拆分为可以由多个处理器和/或核心同时解决的小问题的过程。
GPU 最初是为满足视频和图像处理需求而开发的,其并行处理功能使这种硬件非常适合其他要求苛刻的计算应用,例如区块链相关任务和 AI。虽然 GPU 不是唯一能够执行并行处理或并行计算的处理器类型,但它们非常适合并行处理。然而,GPU 并非没有局限性,通常在执行更高负荷的操作时需要消耗极其昂贵的电力。使用 GPU,性能的提高会带来更高的能源成本。
NPU 和其他人工智能加速器提供了更高效的替代方案。专为 AI 运算设计的 NPU 结合并改进了 GPU 的高级并行性,提供高性能和更低的功耗(以及更小的占地面积带来的额外好处)。
作为一项新兴技术,许多领先的计算机和硬件制造商(包括 Microsoft、Intel、Nvidia、Qualcomm 和 Samsung)都提供独立的神经处理单元 (NPU) 或集成变体,例如 Apple 神经引擎。
将 NPU 整合到消费级电子产品中带来了广泛的好处,例如提升图像识别能力,并优化支持 AI 的摄像头,以便在视频通话中更好地虚化背景。NPU 的一些其他应用包括以下方面。
凭借卓越的并行处理和自我学习功能,NPU 非常适合 IoT 设备,例如可穿戴设备、语音助手和智能家电。
人工智能和机器学习对寻求优化能源资源的数据中心来说是一个重大助力。高性能且节能的 NPU 为数据中心提供了巨大价值,使其在云计算方面实现更好的资源管理。
无人机或自动驾驶汽车和卡车等自主车辆得益于 NPU 的实时处理能力,使其能够根据多媒体传感器输入更快、更准确地进行路线修正。凭借无与伦比的并行处理能力,NPU 可以帮助自主车辆解读和处理快速变化的输入,例如道路标志、交通模式,甚至意外障碍物。
NPU 擅长处理需要机器学习和计算机视觉的任务,为机器人行业的发展提供关键支持。从家庭助手到自动化手术工具,人工智能机器人依靠神经网络处理器 (NPU) 来发展检测、学习和对环境做出反应的能力。
使用开源框架和工具,将 AI 和机器学习应用于 IBM® zSystems 大型机上最有价值的企业数据。
IBM 提供 AI 基础设施解决方案并通过混合设计战略来加快对整个企业产生的影响。
通过 IBM Consulting 发掘企业数据的价值,建立以洞察分析为导向的组织,实现业务优势。