Dalam dunia ilmu komputer klasik, unit pemrosesan pusat (CPU) dianggap sebagai “otak” komputer. CPU memproses sebagian besar tugas komputasi tradisional dan bertanggung jawab atas berbagai aplikasi potensial. Meskipun ada banyak jenis yang berbeda, umumnya semua CPU melakukan operasi dalam urutan linier, menanggapi permintaan sesuai dengan urutan kedatangan permintaan tersebut.

Dari tahun 1950-an hingga 1990-an, CPU menanggung beban hampir semua pemrosesan komputer, mengeksekusi instruksi untuk menjalankan program, sistem kontrol, dan mengelola input/output (I/O).

Aplikasi yang menuntut secara teratur mendorong generasi demi generasi desain CPU ke batas perangkat kerasnya, yang sering kali menyebabkan perlambatan yang signifikan atau bahkan kegagalan sistem. Namun, dengan munculnya permainan komputer pribadi dan desain berbantuan komputer (CAD) pada tahun 1980-an, industri ini memerlukan solusi yang lebih cepat dan lebih efisien untuk merender grafik komputer.

Unit pemrosesan grafis (GPU) awalnya dibuat untuk melepaskan tugas pemrosesan gambar yang menuntut dari CPU utama. Meskipun cenderung menggunakan lebih sedikit inti untuk melakukan operasi linier, GPU memiliki ratusan hingga ribuan inti dengan kemampuan untuk melakukan pemrosesan paralel, sebuah proses di mana tugas-tugas besar dipecah menjadi masalah lebih kecil yang dapat diselesaikan secara bersamaan oleh beberapa prosesor dan/atau inti.

Awalnya dikembangkan untuk menangani kebutuhan pemrosesan video dan gambar, kemampuan pemrosesan paralel GPU telah membuat perangkat keras yang sepenuhnya cocok untuk aplikasi komputasi menuntut lainnya, seperti tugas terkait blockchaindan AI. Meskipun GPU bukan satu-satunya jenis prosesor yang mampu melakukan pemrosesan paralel atau komputasi paralel, mereka sangat cocok untuk paralelisme. Namun, GPU bukannya tanpa keterbatasan dan biasanya membutuhkan konsumsi daya yang sangat mahal untuk menjalankan operasi yang lebih sulit. Peningkatan kinerja GPU disertai peningkatan biaya energi.

NPU dan akselerator AI lainnya menawarkan alternatif yang lebih efisien. Menggabungkan dan meningkatkan paralelisme GPU yang canggih, NPU yang dirancang khusus untuk operasi AI memberikan kinerja tinggi dengan konsumsi daya yang lebih rendah (dan bonus tambahan berupa jejak fisik yang lebih kecil).