与通用中央处理单元 (CPU) 或图形处理单元 (GPU) 不同，NPU 专为加速人工智能任务和工作负载而设计，例如计算由标量、向量和张量数学组成的神经网络层。

NPU 也被称为 AI 芯片或 AI 加速器，通常用于组合多个处理器（例如 CPU 和 GPU）的异构计算架构中。大型数据中心可以使用直接连接到系统主板的独立 NPU；然而，大多数消费类应用（如智能手机、移动设备和笔记本电脑）则将 NPU 与其他协处理器集成在单个半导体微芯片上，该芯片被称为片上系统 (SoC)。

通过集成专用 NPU，制造商能够提供在设备上运行的生成式人工智能应用，这些应用能够以相对低的功耗和高吞吐量实时处理人工智能任务、AI 工作负载以及机器学习算法。