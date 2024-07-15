Na corrida pelo domínio da IA, quanto maior geralmente é melhor. Mais dados e mais parâmetros criam sistemas de IA maiores, que não são apenas mais poderosos, mas também mais eficientes e mais rápidos, e geralmente criam menos erros do que sistemas menores.

As empresas de tecnologia que aproveitam as manchetes reforçam essa tendência. “O sistema que acabamos de implementar é, em escala, do tamanho de uma baleia”, disse o CTO da Microsoft, Kevin Scott, sobre o supercomputador que alimenta o Chat GPT-5. Scott estava discutindo a última versão do chatbot IA da Open AI no recente evento Build da empresa no final de maio. “E acontece que você pode construir um monte de IA com um supercomputador do tamanho de uma baleia.”

Enquanto isso, a capitalização de mercado da Nvidia atingiu a marca de USD 3 trilhões em junho. O fabricante de chips vem crescendo em um ritmo vertiginoso à medida que seus chips impulsionam modelos de linguagem cada vez maiores, supercomputadores e os data centers que se expandem rapidamente em todo o mundo.

Mas será que maior é sempre melhor? Isso depende da sua perspectiva. Para empresas que desenvolvem grandes modelos de linguagem, a escala é uma vantagem na maioria dos casos. Mas enquanto as empresas procuram separar o hype de onde a IA pode agregar valor real, não é claro que modelos de linguagem cada vez maiores sempre levarão a soluções melhores para os negócios.

No futuro, “não precisaremos de modelos 100 vezes mais complexos do que os atuais para extrair a maior parte do valor”, afirmou Kate Soule, diretora de programas de pesquisa em IA generativa da IBM, em um episódio recente do podcast Mixture of Experts da IBM. Muitas empresas que já estão obtendo retorno sobre seus investimentos em IA o estão utilizando para tarefas como classificação e sumarização, que nem sequer utilizam a capacidade total dos modelos de linguagem atuais.