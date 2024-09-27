No mundo da ciência da computação clássica, a unidade central de processamento (CPU) é considerada o “cérebro” do computador. A CPU processa a maioria das tarefas de computação tradicionais e é responsável por uma ampla gama de aplicações em potencial. Embora existam muitos tipos diferentes, geralmente todas as CPUs executam operações em ordem linear, respondendo às solicitações na ordem em que chegam.

Entre as décadas de 1950 e 1990, as CPUs suportaram o peso de praticamente todo o processamento computacional, executando instruções para executar programas, sistemas de controle e gerenciar a entrada/saída (E/S).

Aplicações exigentes regularmente levaram geração após geração de designs de CPU ao limite de seu hardware, muitas vezes causando lentidão significativa ou até mesmo falhas no sistema. Porém, com o advento dos jogos de computador pessoal e do design auxiliado por computador (CAD) na década de 1980, o setor precisava de uma solução mais rápida e eficiente para a renderização de gráficos de computador.

A unidade de processamento gráfico (GPU) foi criada inicialmente para descarregar tarefas exigentes de processamento de imagem da CPU principal. Enquanto as GPUs tendem a usar menos núcleos para realizar operações lineares, as GPUs têm a funcionalidade de centenas a milhares de núcleos com a capacidade de realizar processamento paralelo, um processo no qual tarefas grandes são divididas em problemas menores que podem ser resolvidos simultaneamente por vários processadores e/ou núcleos.

Inicialmente desenvolvido para lidar com as necessidades de processamento de vídeo e imagem, os recursos de processamento paralelo das GPUs tornaram o hardware especialmente adequado para outras aplicações de computação exigentes, como tarefas relacionadas a blockchain e IA. Embora as GPUs não sejam o único tipo de processador capaz de realizar processamento paralelo ou computação paralela, elas são adequadas para paralelismo. No entanto, as GPUs não estão isentas de limitações e normalmente exigem um consumo de energia extremamente caro para executar operações mais exigentes. Com as GPUs, o aumento do desempenho acarreta um aumento no custo de energia.

NPUs e outros aceleradores de IA oferecem alternativas mais eficientes. Incorporando e melhorando o paralelismo avançado das GPUs, as NPUs projetadas especificamente para operações de IA fornecem alto desempenho com menor consumo de energia (e o bônus adicional de uma pegada de carbono menor).