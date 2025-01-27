O DeepSeek-R1, modelo de IA da startup chinesa DeepSeek, disparou para o topo da lista dos modelos mais baixados e ativos na plataforma de código aberto de IA Hugging Face poucas horas após seu lançamento na semana passada. Isso também causou um grande impacto nos mercados financeiros, levando os investidores a reconsiderar as avaliações de fabricantes de chips como a NVIDIA e os investimentos colossais que as gigantes americanas de IA estão fazendo para escalar seus negócios de IA.

Por que tanto alvoroço? O DeepSeek-R1, um chamado "modelo de raciocínio", é um assistente digital que apresenta desempenho equivalente ao o1 da OpenAI em determinados benchmarks de IA para tarefas de matemática e programação, foi treinado com muito menos chips e é aproximadamente 96% mais barato de usar, segundo a empresa.

"DeepSeek está remodelando definitivamente o cenário da IA, desafiando gigantes com ambição de código aberto e inovações", diz Kaoutar El Maghraoui, uma Cientista de Pesquisa e Gerente da IBM AI Hardware.

Enquanto isso, a ByteDance, gigante chinesa de tecnologia proprietária do TikTok, anunciou recentemente seu próprio agente de raciocínio, IU-TARS, que, segundo a empresa, supera o GPT-4o da OpenAI, o Claude da Anthropic e o Gemini do Google em determinados benchmarks. O agente do ByteDance pode ler interfaces gráficas, raciocinar e tomar ações autônomas passo a passo.

Desde startups a gigantes consolidados, as empresas chinesas de IA parecem estar reduzindo a diferença em relação às suas rivais americanas, em grande parte graças à sua disposição em código aberto ou Compartilhe o código-fonte do software subjacente com outras empresas e desenvolvedores de software. "A DeepSeek conseguiu proliferar alguns modelos bastante poderosos em toda a comunidade", diz Abraham Daniels, Gerente Sênior de Produto Técnico do modelo Granite da IBM. O DeepSeek-R1 é oferecido no Hugging Face sob uma licença MIT que permite uso comercial irrestrito. "O DeepSeek pode realmente acelerar a democratização da IA", diz ele.

No verão passado, a empresa chinesa Kuaishou revelou uma ferramenta de geração de vídeo que era como o Sora da OpenAI, mas disponível para o público imediatamente. Sora foi apresentado em fevereiro passado, mas só foi lançado completamente em dezembro e, mesmo assim, apenas aqueles com uma assinatura ChatGPT Pro puderam acessar todas as suas funcionalidades. Os desenvolvedores do Hugging Face também adotaram novos modelos de código aberto dos gigantes chineses da tecnologia Tencent e Alibaba. Embora a Meta tenha disponibilizado seus Llama em código aberto, tanto a OpenAI quanto o Google adotaram uma abordagem predominantemente de código fechado para o desenvolvimento de seus modelos.

Além da dádiva do código aberto, os engenheiros da DeepSeek também usaram apenas uma fração dos chips NVIDIA altamente especializados usados pelos concorrentes americanos para treinar seus sistemas. Os engenheiros da DeepSeek, por exemplo, disseram que precisavam de apenas 2.000 GPUs (unidades de processamento gráfico), ou chips, para treinar seu modelo DeepSeek-V3, de acordo com um artigo de pesquisa que publicaram com o lançamento do modelo.