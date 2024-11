Os aceleradores de IA são divididos em duas arquiteturas com base em sua função: aceleradores de IA para data centers e aceleradores de IA para frameworks de edge computing. Os aceleradores de IA do data center exigem uma arquitetura altamente escalável e chips grandes, como o Wafer-Scale Engine (WSE), construído pela Cerebras para sistemas de deep learning, enquanto os aceleradores de IA desenvolvidos para ecossistemas de edge computing se concentram mais na eficiência energética e na capacidade de entregar quase resultados em tempo real.

Integração em escala de wafer

A integração em escala de wafer, ou WSI, é um processo para construir redes de chips de IA extremamente grandes em um único "super" chip para reduzir custos e acelerar o desempenho de modelos de deep learning. A integração em escala de wafer mais popular é a rede de chip WSE-3 produzida pela Cerebras e construída pelo processo de 5 nm da TSMC, atualmente o acelerador de IA mais rápido do mundo.

NPUs

As NPUs, ou unidades de processamento neural, são aceleradores de IA para deep learning e neural networks e os requisitos de processamento de dados exclusivos dessas cargas de trabalho. Os NPUs podem processar grandes quantidades de dados mais rapidamente do que outros chips. Eles podem executar uma ampla variedade de tarefas de IA associadas ao aprendizado de máquina, como reconhecimento de imagens e as neural networks por trás de aplicações populares de IA e ML, como o ChatGPT.

GPUs

As GPUs — circuitos eletrônicos construídos para aprimorar o desempenho de computação gráfica e processamento de imagens — são usadas em uma variedade de dispositivos, incluindo placas de vídeo, placas-mãe e telefones celulares. No entanto, devido aos seus recursos de processamento paralelo, eles também estão sendo cada vez mais usados no treinamento de modelos de IA. Um método popular é conectar muitas GPUs a um único sistema de IA para aumentar o poder de processamento desse sistema.

Matrizes de portas programáveis em campo (FPGAs)

Os FPGAs são aceleradores de IA altamente personalizáveis que dependem de conhecimento especializado para serem reprogramados para uma finalidade específica. Diferentemente de outros aceleradores de IA, os FPGAs têm um design exclusivo que se adapta a uma função específica, geralmente relacionada ao processamento de dados em tempo real. Os FPGAs são reprogramáveis em um nível de hardware, permitindo um nível muito mais alto de personalização. As aplicações comuns de FPGA incluem aeroespacial, Internet das Coisas (IoT) e redes sem fio.

Circuitos integrados específicos de aplicações (ASICs)

ASICs são aceleradores de IA que foram projetados com um propósito ou carga de trabalho específica em mente, como o deep learning no caso do acelerador ASICs WSE-3 produzido pela Cerebras. Ao contrário dos FPGAs, os ASICs não podem ser reprogramados, mas como são construídos com um propósito único, eles geralmente superam outros aceleradores de uso mais geral. Um exemplo disso é a Unidade de Processamento de Tensor (TPU) do Google, desenvolvida para aprendizado de máquina de Neural Networks usando o software TensorFlow do Google.