A corrida pelos chips no Vale do Silício já estava em andamento muito antes de as aplicações da IA generativa impulsionarem o apetite das empresas de tecnologia por eles. Em 2015, o sistema de IA do Google AlphaGo equipado com um chip projetado pelo Google, conhecido como unidade de processamento tensorial (TPU), derrotou um jogador humano profissional no antigo jogo chinês Go. Desde então, o Google apresentou uma série de chips projetados internamente para alimentar os sistemas de IA em seu data center. Mais recentemente, em dezembro de 2024, o Google anunciou um novo chip de IA para computação quântica chamado Willow. A empresa afirma que o Willow consegue concluir um cálculo benchmark padrão em menos de 5 minutos – um cálculo que levaria 10 septilhões ou 1025 de anos para um dos supercomputadores mais rápidos da atualidade.

Quase ao mesmo tempo em que o Google lançava o AlphaGo, pesquisadores da IBM também começaram a investigar a criação de hardware de IA. Em 2021, Ia BM inaugurou seu Centro de Hardware de IA em Albany, Nova York, para criar um ecossistema mais amplo de hardware e software de IA e, em 2022, o novo chip de microprocessador Telum da IBM trouxe a inferência de IA para IBM® Z, o mainframe que processava aproximadamente 70% das transações mundiais em valor. No final de 2024, a IBM anunciou um novo chip acelerador Spyre, que trouxe a IA generativa para os mainframes do IBM Z para os usuários corporativos.

Entretanto, a AWS vem trabalhando em seus próprios chips de computador para projetos de IA desde pelo menos 2018.. E no evento anual da AWS de 2024, a Amazon anunciou seu mais recente chip de IA personalizado, o Trainium3, que está sendo disponibilizado aos clientes em conjunto com os grandes modelos de linguagem da parceira Anthropic. Muitas empresas já passaram a usar os chips de IA da AWS, incluindo a Apple, o que chamou atenção na AWS 2024, já que foi um raro momento em que a Apple falou sobre um de seus fornecedores.

Para não ficar atrás, a Microsoft, que fabrica chips para alimentar suas funções de jogos há anos, anunciou seus próprios chips de IA personalizados em 2023, aproximadamente na mesma época, a gigante da tecnologia Meta anunciou seus próprios planos para chips de silício. A OpenAI é a mais recente a entrar na onda dos chips personalizados, embora ainda não tenha feito nenhum anúncio oficial. Embora nenhum detalhe tenha sido divulgado publicamente, a Reuters informou no início deste mês que a OpenAI estava finalizando os designs dos chips, com planos de começar a fabricá-los através da TSMC em 2025.

Por que a corrida pelos chips se intensificou recentemente? Varshney, da IBM, afirma que, quando as empresas conseguem personalizar chips para modelos de linguagem específicos de acordo com suas necessidades, elas podem reduzir custos, melhorar a latência ou acelerar a migração de dados de uma rede para outra. Ele cita um exemplo: historicamente, quando as empresas faziam detecção de fraude e examinavam as faturas recebidas, utilizavam técnicas clássicas de computação porque o volume era alto e elas precisavam de um processamento muito rápido. "Elas também tinham que fazer isso um milhão de vezes por dia, então o custo aumentaria muito rapidamente", diz Varshney.

Agora que as empresas podem otimizar seus chips para modelos específicos, o custo de produção em larga escala diminui, tornando mais rentável o uso dessas soluções em escala industrial. "Portanto, do ponto de vista empresarial, o caso de uso não muda", diz Varshney. "Mas agora começamos a ir atrás dos de alto volume, onde antes o ROI não existia."