Gli acceleratori AI sono suddivisi in due architetture in base alla loro funzione: acceleratori AI per data center e acceleratori AI per framework di edge computing. Gli acceleratori AI per data center richiedono un'architettura altamente scalabile e chip di grandi dimensioni, come il Wafer-Scale Engine (WSE), costruito da Cerebras per i sistemi di deep learning, mentre gli acceleratori AI costruiti per gli ecosistemi di edge computing si concentrano maggiormente sull'efficienza energetica e sulla capacità di fornire risultati quasi in tempo reale.

Wafer-scale integration

La Wafer-scale integration, o WSI, è un processo per creare reti di chip AI estremamente grandi in un unico "super" chip per ridurre i costi e accelerare le prestazioni dei modelli di deep learning. La wafer-scale integration più popolare è la rete di chip WSE-3 prodotta da Cerebras e costruita con il processo a 5 nm di TSMC, attualmente l'acceleratore AI più veloce al mondo.

NPU

Le NPU, o unità di elaborazione neurale, sono acceleratori AI per il deep learning e le reti neurali, nonché per i requisiti di elaborazione dei dati specifici di questi workload. Le NPU possono elaborare grandi quantità di dati più velocemente di altri chip. Possono eseguire un'ampia gamma di attività AI associate al machine learning, come il riconoscimento delle immagini e le reti neurali alla base di popolari applicazioni di AI e ML come ChatGPT.

GPU

Le GPU, circuiti elettronici costruiti per migliorare le prestazioni della computer grafica e dell'elaborazione delle immagini, sono utilizzate in una varietà di dispositivi, tra cui schede video, schede madri e telefoni cellulari. Tuttavia, grazie alle loro capacità di elaborazione parallela, vengono sempre più utilizzati anche nell'addestramento dei modelli AI. Un metodo popolare consiste nel collegare molte GPU a un singolo sistema di AI per aumentare la potenza di elaborazione del sistema.

Field programmable gate array (FPGA)

Gli FPGA sono acceleratori AI altamente personalizzabili che richiedono conoscenze avanzate per essere riprogrammati per uno scopo specifico. A differenza di altri acceleratori AI, gli FPGA hanno un design unico che si adatta a una funzione specifica, che spesso ha a che fare con l'elaborazione dei dati in tempo reale. Gli FPGA sono riprogrammabili a livello hardware, consentendo un livello di personalizzazione molto più elevato. Le applicazioni FPGA più comuni includono il settore aerospaziale, l'Internet of Things (IoT) e le reti wireless.

Circuiti integrati per applicazioni specifiche (ASIC)

Gli ASIC sono acceleratori AI progettati pensando a uno scopo o a un workload specifico, come il deep learning nel caso dell'acceleratore ASIC WSE-3 prodotto da Cerebras. A differenza degli FPGA, gli ASIC non possono essere riprogrammati, ma poiché sono costruiti con un unico scopo, in genere sono superiori agli acceleratori più generici. Un esempio di questi è la Tensor Processing Unit (TPU) di Google, sviluppata per il machine learning delle reti neurali utilizzando il software TensorFlow di Google.