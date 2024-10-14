Especialistas dizem que o caminho a seguir vai além da simples redução de custos. “Você pode usar a IA generativa para melhorar sua eficiência de programação; a maneira como você programa uma aplicação pode torná-la mais ou menos intensiva em energia em seu uso. Algumas estimativas sugerem que você pode reduzir o consumo de energia do uso de uma aplicação em até 50% mudando para uma linguagem de programação melhor e um código mais eficiente."

As organizações também estão usando a IA generativa para otimizar os layouts do data center e melhorar o projeto dos servidores. "Existem várias maneiras de a IA generativa ajudar na eficiência da sua computação e na eficiência dos seus recursos de computação", diz Dencik. “Pode ser parte da solução, em vez de apenas a fonte do problema.”

Masood sugere estratégias adicionais: "Existem maneiras criativas de lidar com esses desafios, como roteamento de LLM ou direcionamento inteligente de solicitações recebidas para o grande modelo de linguagem mais adequado com base em fatores como complexidade, custo e desempenho, garantindo utilização eficiente de recursos e resultados ótimos." Ele também menciona “reduzir o custo de execução de LLMs, diminuindo seu tamanho e tornando-os mais rápidos. Usar a quantização para reduzir a memória necessária para o modelo e o ajuste fino eficiente para acelerar o treinamento significa custos de hardware mais baixos e tempos de processamento mais rápidos, tornando esses modelos mais acessíveis para implementar e usar.”

A crescente complexidade dos modelos de IA é outro fator que aumenta os custos. Dencik recomenda uma abordagem estratégica: "Você não precisa usar grandes modelos de linguagem para tudo", diz ele. "Um pequeno modelo treinado com dados de alta qualidade pode ser mais eficiente e alcançar os mesmos resultados (ou melhores), dependendo da tarefa em questão. Selecionar o modelo apropriado é fundamental, enquanto reutilizar e ajustar modelos existentes pode ser melhor do que criar novos modelos para cada nova tarefa para a qual você deseja usar a IA.”

Ele defende uma abordagem multimodal e multimodelos para a implementação de IA: "Para ser economicamente viável, você deve permitir que sua organização avance em direção a um uso multimodal e multimodelos de IA e ter uma plataforma que permita fazer isso dentro da organização", afirma. "Embora isso possa parecer mais complexo, é uma maneira de sua organização aproveitar ao máximo a IA da maneira mais econômica."

As preocupações com a sustentabilidade também estão influenciando o custo total de propriedade dos sistemas de IA. Embora os custos de energia possam estar em grande parte ocultos nas despesas com nuvem, em vez de aparecerem diretamente nas contas de consumo, há uma crescente consciência sobre o impacto ambiental da IA generativa. "Não é apenas um custo econômico; é um custo ambiental associado ao uso da IA", afirma Dencik. Ele aponta para práticas emergentes como "operações verdes", que visam otimizar o uso da nuvem para reduzir o impacto ambiental.

Enquanto as empresas enfrentam esses desafios, aprender a gerenciar efetivamente o custo da computação pode se tornar um diferencial importante no mercado. O relatório conclui que “o CEO que melhor gerencia esses custos será capaz de administrar os negócios como uma máquina de alto desempenho, reduzindo o arrasto e usando a tecnologia mais recente para superar a concorrência”.