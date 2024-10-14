Na pressa de adotar a IA generativa, as empresas estão se deparando com um obstáculo inesperado: o aumento dos custos de computação que ameaçam atrapalhar os esforços de inovação e transformação de negócios.
Os principais players da IA também estão sentindo a pressão econômica. A OpenAI está relatando um crescimento explosivo de receita, com ganhos mensais atingindo US$ 300 milhões em agosto de 2024. No início de outubro, a empresa anunciou que havia arrecadado US$ 6,6 bilhões em uma nova rodada de financiamento, com uma avaliação de US$ 157 bilhões, um esforço para acompanhar seus custos crescentes e planos ambiciosos de crescimento.
Um novo relatório do Institute for Business Value (IBV) da IBM traça um panorama severo dos desafios econômicos que os executivos enfrentam à medida que navegam pela revolução da IA. O relatório, intitulado “The CEO’s guide to generative AI: Cost of compute”, revela que espera-se que o custo médio da computação aumente 89% entre 2023 e 2025. Um surpreendente 70% dos executivos entrevistados pela IBM citaram a IA generativa como uma motivação crítica dessa elevação. E o impacto já está sendo sentido em todos os setores, com cada executivo relatando o cancelamento ou adiamento de pelo menos uma iniciativa de IA generativa devido a preocupações com custos.
"No momento, muitas organizações estão experimentando, então esses custos não estão necessariamente aumentando tanto quanto aumentarão quando começarem a escalar a IA", diz Jacob Dencik, Diretor de Pesquisa do IBV. "O custo da computação, muitas vezes refletido nos custos da nuvem, será uma questão-chave a ser considerada, pois pode ser uma barreira para eles escalarem a IA com sucesso."
A economia da IA está emergindo como um fator crítico na determinação do seu verdadeiro impacto nos negócios. Como Dencik aponta, "Mesmo que algo seja tecnicamente viável para fazer com IA, se o caso de negócios não se empilha devido ao custo de computação ou ao custo de treinamento desses modelos, então não veremos o impacto de IA na atividade de negócios que muitas pessoas preveem.”
Adnan Masood, Arquiteto Chefe de IA da UST, enquadra esse desafio em termos rígidos: "Estamos entrando em um ponto de inflexão estratégica, onde a inovação, antes vista como uma necessidade competitiva, agora acarreta um risco financeiro substancial." Ele acrescenta: "A longa jornada para o domínio da IA não é para os fracos de coração. Estamos de olho em um futuro no qual as empresas devem fazer apostas estratégicas para continuar ultrapassando os limites da IA ou correr o risco de ficarem para trás na corrida armamentista da IA."
Muitas organizações estão recorrendo a arquiteturas de nuvem híbrida para combater o aumento dos custos. "A nuvem híbrida se torna um mecanismo para garantir que você possa gerenciar seus custos de computação", diz Dencik. "Usar uma plataforma de nuvem híbrida que inclui um plano de controle comum e recursos de operações financeiras oferece a visibilidade necessária para executar dados, cargas de trabalho e aplicações nos ambientes de menor custo. Isso permitirá que você veja onde os custos estão sendo gerados e como otimizar."
Especialistas dizem que o caminho a seguir vai além da simples redução de custos. “Você pode usar a IA generativa para melhorar sua eficiência de programação; a maneira como você programa uma aplicação pode torná-la mais ou menos intensiva em energia em seu uso. Algumas estimativas sugerem que você pode reduzir o consumo de energia do uso de uma aplicação em até 50% mudando para uma linguagem de programação melhor e um código mais eficiente."
As organizações também estão usando a IA generativa para otimizar os layouts do data center e melhorar o projeto dos servidores. "Existem várias maneiras de a IA generativa ajudar na eficiência da sua computação e na eficiência dos seus recursos de computação", diz Dencik. “Pode ser parte da solução, em vez de apenas a fonte do problema.”
Masood sugere estratégias adicionais: "Existem maneiras criativas de lidar com esses desafios, como roteamento de LLM ou direcionamento inteligente de solicitações recebidas para o grande modelo de linguagem mais adequado com base em fatores como complexidade, custo e desempenho, garantindo utilização eficiente de recursos e resultados ótimos." Ele também menciona “reduzir o custo de execução de LLMs, diminuindo seu tamanho e tornando-os mais rápidos. Usar a quantização para reduzir a memória necessária para o modelo e o ajuste fino eficiente para acelerar o treinamento significa custos de hardware mais baixos e tempos de processamento mais rápidos, tornando esses modelos mais acessíveis para implementar e usar.”
A crescente complexidade dos modelos de IA é outro fator que aumenta os custos. Dencik recomenda uma abordagem estratégica: "Você não precisa usar grandes modelos de linguagem para tudo", diz ele. "Um pequeno modelo treinado com dados de alta qualidade pode ser mais eficiente e alcançar os mesmos resultados (ou melhores), dependendo da tarefa em questão. Selecionar o modelo apropriado é fundamental, enquanto reutilizar e ajustar modelos existentes pode ser melhor do que criar novos modelos para cada nova tarefa para a qual você deseja usar a IA.”
Ele defende uma abordagem multimodal e multimodelos para a implementação de IA: "Para ser economicamente viável, você deve permitir que sua organização avance em direção a um uso multimodal e multimodelos de IA e ter uma plataforma que permita fazer isso dentro da organização", afirma. "Embora isso possa parecer mais complexo, é uma maneira de sua organização aproveitar ao máximo a IA da maneira mais econômica."
As preocupações com a sustentabilidade também estão influenciando o custo total de propriedade dos sistemas de IA. Embora os custos de energia possam estar em grande parte ocultos nas despesas com nuvem, em vez de aparecerem diretamente nas contas de consumo, há uma crescente consciência sobre o impacto ambiental da IA generativa. "Não é apenas um custo econômico; é um custo ambiental associado ao uso da IA", afirma Dencik. Ele aponta para práticas emergentes como "operações verdes", que visam otimizar o uso da nuvem para reduzir o impacto ambiental.
Enquanto as empresas enfrentam esses desafios, aprender a gerenciar efetivamente o custo da computação pode se tornar um diferencial importante no mercado. O relatório conclui que “o CEO que melhor gerencia esses custos será capaz de administrar os negócios como uma máquina de alto desempenho, reduzindo o arrasto e usando a tecnologia mais recente para superar a concorrência”.
