O aumento no uso da inteligência artificial (IA) nos últimos dois anos e meio mudou drasticamente não só o software, mas também o hardware. À medida que o uso da IA continua evoluindo, os fabricantes de PCs encontraram na IA uma oportunidade de melhorar os dispositivos do usuário final, oferecendo hardware específico para IA e comercializando-os como “PCs com IA”.
Há alguns anos, a IA geralmente dependia de hardwares que não eram explicitamente projetados para ela. Um exemplo são os processadores gráficos. As Graphics Processing Units (GPUs) da Nvidia são fundamentais na IA porque lidam com o processamento paralelo de forma eficiente, o que é necessário para aprendizado de máquina e deep learning. Seu design permite cálculos simultâneos, tornando-os mais eficazes do que as CPUs para treinamento e inferência de modelos de IA.
Outro tipo de hardware principal é o Field-Programmable Gate Array (FPGA) da Intel e outras empresas. Um FPGA é um circuito integrado (CI) que pode ser reprogramado várias vezes. Essa flexibilidade o torna ideal para tarefas de IA. FPGAs aceleram tarefas de deep learning e aprendizado de máquina. Eles oferecem opções de personalização de hardware que imitam o comportamento de GPUs ou ASICs.
Os FPGAs podem ser integrados a frameworks populares de IA, como TensorFlow e PyTorch, usando ferramentas como o Intel FPGA IA Suite e o toolkit OpenVINO.
Os FPGAs são usados nos setores automotivo, de saúde, entre outros. Eles são úteis em cenários de edge computing em que os recursos de IA devem ser implementados próximos à fonte de dados para tomadas de decisão mais rápidas e latência reduzida.
E ainda um outro tipo são os Application-Specific Integrated Circuits (ASICs). Um exemplo são as Tensor Processing Units (TPUs) do Google. As TPUs são ASICs personalizadas desenvolvidas pelo Google para acelerar as cargas de trabalho de aprendizado de máquina. São otimizadas para TensorFlow e amplamente utilizadas nos data centers do Google.
O lançamento do ChatGPT pela OpenAI, em 30 de novembro de 2022, mudou a relação do público e do setores com a IA. O ChatGPT rapidamente ganhou imensa popularidade, atraindo mais de um milhão de usuários em cinco dias após o lançamento. Em janeiro de 2023, alcançou 100 milhões de usuários, tornando-se a aplicação de consumo que mais cresce de todos os tempos.
Mais importante ainda, o grande sucesso do ChatGPT na cultura geral mudou o financiamento de risco em favor de startups de IA. Grandes gigantes da tecnologia como Microsoft, Google e Meta aceleraram o desenvolvimento e a disponibilidade pública de suas ofertas, e o Vale do Silício viu rapidamente o surgimento de empresas como a Anthropic e a Perplexity oferecendo ferramentas de IA.
Atualmente, os fabricantes de PCs estão investindo em PCs com capacidade de IA que enfatizam a IA híbrida e a inteligência integrada ao dispositivo. A integração da IA em computadores pessoais é facilitada pelo surgimento de chipsets de IA especializados, como neural processing units (NPUs), que aprimoram a capacidade dos PCs de executar tarefas de IA localmente.
Espera-se que essa mudança afete significativamente o mercado de PCs. De acordo com a Canalys, cerca de 60% dos PCs comercializados até 2027 serão compatíveis com IA.
Os PCs com IA são projetados para executar com eficiência cargas de trabalho de IA usando uma combinação de CPUs, GPUs e NPUs, permitindo que eles lidem com tarefas como modelos de IA generativa de forma mais eficaz do que as gerações anteriores de PCs. Essa otimização permite que os PCs com IA executem aplicações de IA com melhor desempenho, eficiência de energia e privacidade, processando dados localmente, em vez de depender de soluções baseadas na nuvem.
Alguns criticam essa categoria como um artifício de marketing e apontam que muitos usuários finais utilizam IA generativa por meio de chatbots baseados na nuvem.
Atualmente, o público pensa em IA como large language models (LLMs) rodando na nuvem e usados como chatbots. Com o tempo, o poder e o uso da IA pelos usuários finais ocorrerão cada vez mais por meio de funcionalidades integradas e aplicações aprimorada por IA.
Segundo Chris Howard, chefe global de pesquisa da Gartner, a IA também envolverá mais small language models (SLMs) que darão suporte a casos de uso que não sejam chatbots, executados próximos à edge, em vez da nuvem.
O processamento de IA acontecerá cada vez mais perto do usuário e da edge. E isso significa que a tendência de hardware específico para IA só irá crescer.
Um destaque é a introdução dos PCs Copilot+ da Microsoft, uma nova categoria de PCs com Windows especificamente projetados para IA. Esses PCs contam com um chip capaz de realizar mais de 40 trilhões de operações por segundo (TOPS), proporcionando bateria para o dia todo e acesso a modelos avançados de IA. A arquitetura desses dispositivos integra uma NPU de alto desempenho juntamente com a CPU e a GPU, aprimorando seus recursos de IA. Essa configuração permite novas experiências, como geração de imagens de IA em tempo real, tradução de idiomas e funcionalidades de pesquisa avançada, como o recurso "Recall", que registra e analisa a atividade do dispositivo para melhorar a interação do usuário com os modelos de IA.
A Microsoft também colaborou com os principais parceiros OEM, incluindo Acer, ASUS, Dell, HP, Lenovo e Samsung, para levar esses dispositivos aprimorados por IA ao mercado.
A Apple fez várias mudanças de hardware para acomodar e capacitar recursos de IA em seus dispositivos. Um desenvolvimento significativo é a integração do chip da Apple, projetado especificamente para lidar com o processamento avançado de IA. Isso inclui o uso de motores neurais especializados em dispositivos como o iPhone 15 Pro, otimizados para tarefas de IA como aprendizado de máquina e processamento de linguagem natural. Esses mecanismos neurais melhoram a eficiência e a velocidade das operações de IA, viabilizando funcionalidades como tradução de idiomas em tempo real e reconhecimento de imagens.
O Google fez várias alterações em seu hardware para acomodar a IA. Uma das etapas significativas inclui o desenvolvimento e a integração de seu próprio hardware para oferecer suporte a modelos de IA como o Gemini. Isso indica uma mudança de dependência de chips externos para o uso de tecnologia proprietária para aprimorar os recursos de IA.
O Google até reorganizou suas equipes internas para integrar melhor a IA em seus produtos. Essa reorganização levou à criação de uma nova equipe de plataformas e dispositivos, consolidando vários produtos do Google, como Pixel, Android, Chrome e ChromeOS, sob uma única liderança. Essa mudança visa acelerar a integração da IA e melhorar a sinergia entre hardware e software.
A popular revolução da IA generativa começou em novembro de 2022 e resultou em grandes mudanças de hardware para acomodar casos de uso de IA que consomem muita energia. A recente integração da IA em hardware é, sem dúvida, apenas o começo. Podemos esperar que o hardware específico de IA passe dos PCs e telefones para dispositivos vestíveis, dispositivos da Internet das Coisas e muito mais.
