Atualmente, parece que quase todas as gigantes da tecnologia estão desenvolvendo seus próprios chips de silício personalizados ou de olho em fabricantes de chips já existentes para aquisição. Por quê? À medida que o número de chips necessários para impulsionar uma gama vertiginosa de aplicações de IA aumenta exponencialmente, a produção interna de chips pode reduzir custos e melhorar o desempenho dos sistemas de IA, afirma Shobhit Varshney, vice-presidente e sócio sênior da IBM Consulting.
"Quando você otimiza a arquitetura do hardware para funcionar com a arquitetura do software, a mágica acontece", disse ele em um episódio recente do podcast Mixture of Experts da IBM. "Isso reduz o custo total e a latência, ao mesmo tempo que aumenta a taxa de transferência."
Ao produzirem chips internamente, as empresas também reduzem sua dependência da fabricante de chips NVIDIA, que controla entre 70% e 95% do mercado de chips de IA. Mas não é só isso, afirma Kaoutar El Maghraoui, cientista de pesquisa principal e gerente da IBM Research, em entrevista ao IBM Think. Reduzir a dependência da NVIDIA, na prática, só faz "o centro de poder mudar de um gigante para outro", diz ela.
Mesmo com as empresas assumindo um maior controle do processo de projeto, que a NVIDIA dominou nos últimos anos, elas ainda dependerão muito da Taiwan Semiconductor Manufacturing Company Limited (TSMC), afirma Varshney. A TSMC fabrica a maioria dos chips IA globalmente para uma ampla gama de aplicações, desde smartphones até equipamentos militares.
A TSMC "é a gigante do setor", diz Varshney. "Todo mundo projeta chips, mas a TSMC é, hoje, o coração de todo o setor."
A corrida pelos chips no Vale do Silício já estava em andamento muito antes de as aplicações da IA generativa impulsionarem o apetite das empresas de tecnologia por eles. Em 2015, o sistema de IA do Google AlphaGo equipado com um chip projetado pelo Google, conhecido como unidade de processamento tensorial (TPU), derrotou um jogador humano profissional no antigo jogo chinês Go. Desde então, o Google apresentou uma série de chips projetados internamente para alimentar os sistemas de IA em seu data center. Mais recentemente, em dezembro de 2024, o Google anunciou um novo chip de IA para computação quântica chamado Willow. A empresa afirma que o Willow consegue concluir um cálculo benchmark padrão em menos de 5 minutos – um cálculo que levaria 10 septilhões ou 1025 de anos para um dos supercomputadores mais rápidos da atualidade.
Quase ao mesmo tempo em que o Google lançava o AlphaGo, pesquisadores da IBM também começaram a investigar a criação de hardware de IA. Em 2021, Ia BM inaugurou seu Centro de Hardware de IA em Albany, Nova York, para criar um ecossistema mais amplo de hardware e software de IA e, em 2022, o novo chip de microprocessador Telum da IBM trouxe a inferência de IA para IBM® Z, o mainframe que processava aproximadamente 70% das transações mundiais em valor. No final de 2024, a IBM anunciou um novo chip acelerador Spyre, que trouxe a IA generativa para os mainframes do IBM Z para os usuários corporativos.
Entretanto, a AWS vem trabalhando em seus próprios chips de computador para projetos de IA desde pelo menos 2018.. E no evento anual da AWS de 2024, a Amazon anunciou seu mais recente chip de IA personalizado, o Trainium3, que está sendo disponibilizado aos clientes em conjunto com os grandes modelos de linguagem da parceira Anthropic. Muitas empresas já passaram a usar os chips de IA da AWS, incluindo a Apple, o que chamou atenção na AWS 2024, já que foi um raro momento em que a Apple falou sobre um de seus fornecedores.
Para não ficar atrás, a Microsoft, que fabrica chips para alimentar suas funções de jogos há anos, anunciou seus próprios chips de IA personalizados em 2023, aproximadamente na mesma época, a gigante da tecnologia Meta anunciou seus próprios planos para chips de silício. A OpenAI é a mais recente a entrar na onda dos chips personalizados, embora ainda não tenha feito nenhum anúncio oficial. Embora nenhum detalhe tenha sido divulgado publicamente, a Reuters informou no início deste mês que a OpenAI estava finalizando os designs dos chips, com planos de começar a fabricá-los através da TSMC em 2025.
Por que a corrida pelos chips se intensificou recentemente? Varshney, da IBM, afirma que, quando as empresas conseguem personalizar chips para modelos de linguagem específicos de acordo com suas necessidades, elas podem reduzir custos, melhorar a latência ou acelerar a migração de dados de uma rede para outra. Ele cita um exemplo: historicamente, quando as empresas faziam detecção de fraude e examinavam as faturas recebidas, utilizavam técnicas clássicas de computação porque o volume era alto e elas precisavam de um processamento muito rápido. "Elas também tinham que fazer isso um milhão de vezes por dia, então o custo aumentaria muito rapidamente", diz Varshney.
Agora que as empresas podem otimizar seus chips para modelos específicos, o custo de produção em larga escala diminui, tornando mais rentável o uso dessas soluções em escala industrial. "Portanto, do ponto de vista empresarial, o caso de uso não muda", diz Varshney. "Mas agora começamos a ir atrás dos de alto volume, onde antes o ROI não existia."
Considerando que cada vez mais empresas de tecnologia estão projetando chips internamente, como a TSMC mantém sua vantagem sobre os concorrentes? Para começar, a abordagem da empresa desde o início tem sido diferente da de outras empresas de tecnologia. Eles são uma fundição dedicada, o que significa que não projetam nenhum chip, apenas fabricam chips para outras empresas, explica El Maghraoui, da IBM. Ao longo dos anos, um número crescente de empresas terceirizou a fabricação de seus chips para a TSMC devido ao custo crescente de produção de uma gama cada vez mais diversificada de chips.
Ao mesmo tempo, o custo de fabricação de chips individuais disparou, afirmou Dylan Patel, fundador da SemiAnalysis, uma empresa de pesquisa e análise de semicondutores, em uma recente entrevista para um podcast. A TSMC tem se concentrado intensamente na fabricação de chips e facilitou muito o processo para seus clientes corporativos, afirma Patel.
"A fabricação de semicondutores é muito antiquada e difícil", explica ele. "A barreira de entrada é muito maior [do que na maioria das empresas de tecnologia], já que as funções são superespecializadas." Por fim, os funcionários da TSMC sentem muito orgulho do seu trabalho, afirma Patel. "Eles trabalharão 80 horas por semana em uma fábrica e, se algo der errado, como um terremoto, eles aparecerão no meio da noite", porque são os únicos que podem consertar uma determinada peça de equipamento, diz ele.
Outra razão pela qual é difícil replicar a fórmula da TSMC é que eles investiram bilhões de dólares na compra de dezenas de máquinas de fabricação de chips avançadas altamente especializadas criadas por outra gigante de supercondutores, a empresa holandesa ASML.
A ASML foi pioneira na litografia ultravioleta extrema (EUV), que basicamente gera comprimentos de onda de luz incrivelmente curtos em grandes quantidades para imprimir desenhos pequenos e complexos em microchips. As máquinas de fabricação de chips da ASML custam entre 183 milhões e 380 milhões de dólares cada. Uma das primeiras máquinas EUV do mundo foi instalada em 2014 no Albany Nanotech Complex, que pertence e é operado pela NY CREATES e do qual a IBM Research é uma parceira fundamental.
Desde então, a IBM Research e seus parceiros criaram um ecossistema para desenvolver e otimizar a litografia EUV, o que permitiu a IBM e a outras empresas reduzir o tamanho dos transistores para apenas alguns nanômetros, dezenas de milhares de vezes mais finos que um fio de cabelo.
Embora a ASML e parceiros como a IBM continuem trabalhando na impressão de chips cada vez menores, a TSMC permanecerá na equação como fabricante de chips. Patel, da SemiAnalysis, não vê o envolvimento da TSMC como um problema. “Não acho que isso necessariamente quebre a dependência”, diz ele. “Acho que o segredo é convencer a TSMC a abrir fábricas nos EUA.” A TSMC anunciou em 2020 que abriria fábricas de chips nos EUA e, desde então, a gigante da manufatura investiu USD 65 bilhões no desenvolvimento de três fábricas de chips no Arizona. No quarto trimestre de 2024, a produção de chips começou na primeira fábrica de chips da TSMC nos Estados Unidos.
Especialistas como El Maghraoui veem um grande potencial para as empresas no uso de IA para descobrir novos materiais para os chips que vão impulsionar a própria IA. Para esse fim, novos modelos da IBM e da Meta podem ajudar os pesquisadores a descobrir novos materiais para a fabricação de chips, o que poderia equilibrar a competição no futuro.
“Ao disponibilizarmos esses modelos em código aberto, aceleramos a inovação, fomentamos a colaboração e promovemos o desenvolvimento de semicondutores totalmente novos”, afirma El Maghraoui.
Por exemplo, uma equipe do projeto de modelos de base da IBM para materiais (FM4M está usando IA para projetar novos chips que podem atingir o mesmo desempenho ou superior, mas com uma pegada de carbono ambiental menor, diz Jed Pitera, co-líder de estratégia de materiais sustentáveis da IBM . “Se eu tiver uma fábrica e estiver produzindo dez tipos diferentes de chips, qual será a pegada de carbono total de cada chip?”, diz ele, referindo-se à energia e à água utilizadas, bem como às emissões geradas na produção de um determinado chip.
“Quando soubermos a pegada de carbono total do chip A, podemos começar a pensar em mudar a forma como fabricamos os chips, para que ainda alcancem o mesmo desempenho, mas com um impacto ambiental minimizado”, diz Pitera. “Quando a pegada ambiental diminui, o custo vai na mesma direção.”
