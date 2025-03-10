Uma nova classe de modelos de IA está desafiando o domínio dos sistemas do tipo GPT, prometendo alternativas mais rápidas, baratas e potencialmente mais poderosas.

A Inception Labs, uma startup fundada por pesquisadores de Stanford, lançou recentemente o Mercury, um modelo de linguagem baseado em difusão (dLLM) que refina frases inteiras de uma só vez, em vez de prever palavras individualmente. Ao contrário dos grandes modelos de linguagem (LLMs) tradicionais, que usam uma abordagem autorregressiva, gerando uma palavra de cada vez, com base no texto anterior, os modelos de difusão aprimoram o texto iterativamente, por meio de refinamento.

"Os dLLMs expandem a fronteira de possibilidades", diz Stefano Ermon, professor de ciência da computação da Universidade de Stanford e cofundador da Inception Labs, ao IBM Think. "O Mercury oferece uma velocidade e uma eficiência incomparáveis e, ao aproveitar mais capacidade de computação em tempo de teste, os dLLMs também vão estabelecer um novo patamar de qualidade e elevar a satisfação geral dos clientes em aplicações de edge e corporativas."

O engenheiro de pesquisa da IBM, Benjamin Hoover, já percebe para onde as coisas estão caminhando: "É só uma questão de dois ou três anos até que a maioria das pessoas comece a usar modelos de difusão", diz ele. “Quando vi o modelo da Inception Labs, percebi: 'Isso vai acontecer mais cedo do que tarde'."