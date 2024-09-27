Nel mondo dell'informatica classica, l'unità di elaborazione centrale (CPU) è considerata il "cervello" del computer. La CPU elabora la maggior parte delle attività informatiche tradizionali ed è responsabile di un'ampia gamma di potenziali applicazioni. Sebbene ne esistano molti tipi diversi, generalmente tutte le CPU eseguono le operazioni in ordine lineare, rispondendo alle richieste nell'ordine in cui arrivano.

Dagli anni '50 agli anni '90, le CPU hanno subito il peso di praticamente tutte le elaborazioni informatiche, l'esecuzione di istruzioni per eseguire programmi, controllare i sistemi e gestire gli input/output (I/O).

Le applicazioni esigenti hanno spinto generazione dopo generazione di progetti di CPU ai limiti delle possibilità dell'hardware, spesso causando rallentamenti significativi o addirittura guasti del sistema. Ma con l'avvento dei giochi per personal computer e della progettazione assistita (CAD) negli anni '80, il settore aveva bisogno di una soluzione più veloce ed efficiente per il rendering della grafica computerizzata.

L'unità di elaborazione grafica (GPU) è stata inizialmente creata per scaricare le impegnative attività di elaborazione delle immagini dalla CPU principale. Mentre le GPU tendono a utilizzare meno core per eseguire operazioni lineari, le GPU hanno le caratteristiche di centinaia o migliaia di core con la capacità di eseguire l'elaborazione parallela, un processo in cui le attività di grandi dimensioni vengono suddivise in problemi più piccoli che possono essere risolti contemporaneamente da più processori e/o core.

Inizialmente sviluppato per gestire le esigenze di elaborazione di video e immagini, le funzionalità di elaborazione parallela delle GPU hanno reso l'hardware particolarmente adatto ad altre applicazioni informatiche impegnative, come attività relative alla blockchain e AI. Sebbene le GPU non siano l'unico tipo di processore in grado di eseguire l'elaborazione parallela o il calcolo parallelo, sono adatte per il parallelismo. Tuttavia, anche le GPU hanno dei limiti e, in genere, richiedono un consumo di energia estremamente costoso per eseguire operazioni più impegnative. Con le GPU, un aumento delle prestazioni comporta un aumento dei costi energetici.

Le NPU e altri acceleratori AI offrono alternative più efficienti. Incorporando e migliorando il parallelismo avanzato delle GPU, le NPU specificamente progettate per le operazioni di AI forniscono prestazioni elevate con un consumo energetico inferiore (e il vantaggio aggiuntivo di un'impronta ridotta).