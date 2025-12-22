Em 2026, os modelos de IA mais inteligentes podem não ser os maiores.

Essa é a aposta que está sendo feita agora por laboratórios, investidores e pesquisadores que passaram o último ano vendo suas hipóteses ruírem. Os próximos 12 meses serão definidos não pela corrida para desenvolver sistemas maiores, mas pela busca frenética por sistemas mais inteligentes, modelos que pensam antes de falar e que fazem mais com menos.

"Você pode obter um pequeno modelo de linguagem funcionando no mesmo nível, ou até melhor, do que modelos muito maiores", disse Kush Varshney, membro da IBM, ao IBM Think em uma entrevista.

Há um ano, isso teria soado como heresia. Durante uma década, a IA operou segundo um catecismo extremamente simples: mais dados, mais parâmetros, mais poder computacional e mais inteligência. Os laboratórios competiam para anunciar a contagem de parâmetros como fisiculturistas exibindo seus músculos em frente ao espelho. As corridas de treinamento consumiram a produção elétrica de cidades pequenas. Toda a empreitada tinha ares de corrida por terras, só que o território reivindicado era medido em teraflops.

Então chegou janeiro de 2025. Uma empresa chamada DeepSeek, com sede na China, divulgou um modelo que fez com que as ações da Nvidia caíssem 17% em um único dia. A inteligência algorítmica pode substituir a força computacional bruta. Não era preciso uma catedral. Só era preciso um blueprint melhor.

Os principais laboratórios americanos reagiram rapidamente. Em poucos meses, eles migram do desenvolvimento de sistemas cada vez maiores para o desenvolvimento de sistemas que param e raciocinam antes de responder. Seyed Emadi, professor associado de operações na Universidade da Carolina do Norte Kenan-Flagler, foi direto ao ponto em uma entrevista ao IBM Think: "Se eu tivesse que resumir 2025 em termos de IA, diria que paramos de criar modelos maiores e começamos a criá-los mais inteligentes."

Essa mudança agora molda o que vem a seguir. O consenso entre os pesquisadores é impressionante, quase assustador. Ao ser questionado sobre o desenvolvimento mais significativo do ano passado, Misha Belkin, professor de aprendizado de máquina na UC San Diego, apontou para "a ascensão dos modelos de pensamento e do escalonamento do tempo de inferência" e, em entrevista, chamou isso de base para 2026. Rada Mihalcea, diretora do Laboratório de Inteligência Artificial da Universidade de Michigan, ofereceu uma visão complementar: "avanços em sistemas multiagentes, bem como uma compreensão mais profunda das... fragilidades" definiriam o caminho a seguir, disse ela ao IBM Think.

Essa mudança representa uma reformulação do que significa inteligência em silício. A abordagem antiga tratava isso como algo que se incorporava durante o treinamento, como o tempero em um ensopado. Após a conclusão, o modelo era congelado. A nova abordagem trata a inteligência como algo que pode emergir durante o tempo de execução, dando ao modelo mais tempo para raciocinar, chamado de tempo de computação de inferência.

As implicações ainda estão sendo analisadas. Gabriel Poesia, um pesquisador que estuda o raciocínio da IA na Universidade de Stanford, observou que os modelos se tornaram melhores em "pensar por períodos mais longos" e "usar sem dificuldades ferramentas durante longos períodos de reflexão". Em termos simples: as máquinas aprenderam a pensar antes de falar.

Os modelos antigos funcionavam como reflexos: entrava o input, saía a previsão, sem pausa para reflexão. Os novos deliberam. Faça uma pergunta difícil e o modelo ficará analisando-a, às vezes por minutos, verificando sua lógica e voltando atrás em casos de impasse. É muito parecido com o pensamento. Se isso é pensamento, em qualquer sentido significativo, continua sendo uma das grandes perguntas sem resposta.