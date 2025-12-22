Em 2026, os modelos de IA mais inteligentes podem não ser os maiores.
Essa é a aposta que está sendo feita agora por laboratórios, investidores e pesquisadores que passaram o último ano vendo suas hipóteses ruírem. Os próximos 12 meses serão definidos não pela corrida para desenvolver sistemas maiores, mas pela busca frenética por sistemas mais inteligentes, modelos que pensam antes de falar e que fazem mais com menos.
"Você pode obter um pequeno modelo de linguagem funcionando no mesmo nível, ou até melhor, do que modelos muito maiores", disse Kush Varshney, membro da IBM, ao IBM Think em uma entrevista.
Há um ano, isso teria soado como heresia. Durante uma década, a IA operou segundo um catecismo extremamente simples: mais dados, mais parâmetros, mais poder computacional e mais inteligência. Os laboratórios competiam para anunciar a contagem de parâmetros como fisiculturistas exibindo seus músculos em frente ao espelho. As corridas de treinamento consumiram a produção elétrica de cidades pequenas. Toda a empreitada tinha ares de corrida por terras, só que o território reivindicado era medido em teraflops.
Então chegou janeiro de 2025. Uma empresa chamada DeepSeek, com sede na China, divulgou um modelo que fez com que as ações da Nvidia caíssem 17% em um único dia. A inteligência algorítmica pode substituir a força computacional bruta. Não era preciso uma catedral. Só era preciso um blueprint melhor.
Os principais laboratórios americanos reagiram rapidamente. Em poucos meses, eles migram do desenvolvimento de sistemas cada vez maiores para o desenvolvimento de sistemas que param e raciocinam antes de responder. Seyed Emadi, professor associado de operações na Universidade da Carolina do Norte Kenan-Flagler, foi direto ao ponto em uma entrevista ao IBM Think: "Se eu tivesse que resumir 2025 em termos de IA, diria que paramos de criar modelos maiores e começamos a criá-los mais inteligentes."
Essa mudança agora molda o que vem a seguir. O consenso entre os pesquisadores é impressionante, quase assustador. Ao ser questionado sobre o desenvolvimento mais significativo do ano passado, Misha Belkin, professor de aprendizado de máquina na UC San Diego, apontou para "a ascensão dos modelos de pensamento e do escalonamento do tempo de inferência" e, em entrevista, chamou isso de base para 2026. Rada Mihalcea, diretora do Laboratório de Inteligência Artificial da Universidade de Michigan, ofereceu uma visão complementar: "avanços em sistemas multiagentes, bem como uma compreensão mais profunda das... fragilidades" definiriam o caminho a seguir, disse ela ao IBM Think.
Essa mudança representa uma reformulação do que significa inteligência em silício. A abordagem antiga tratava isso como algo que se incorporava durante o treinamento, como o tempero em um ensopado. Após a conclusão, o modelo era congelado. A nova abordagem trata a inteligência como algo que pode emergir durante o tempo de execução, dando ao modelo mais tempo para raciocinar, chamado de tempo de computação de inferência.
As implicações ainda estão sendo analisadas. Gabriel Poesia, um pesquisador que estuda o raciocínio da IA na Universidade de Stanford, observou que os modelos se tornaram melhores em "pensar por períodos mais longos" e "usar sem dificuldades ferramentas durante longos períodos de reflexão". Em termos simples: as máquinas aprenderam a pensar antes de falar.
Os modelos antigos funcionavam como reflexos: entrava o input, saía a previsão, sem pausa para reflexão. Os novos deliberam. Faça uma pergunta difícil e o modelo ficará analisando-a, às vezes por minutos, verificando sua lógica e voltando atrás em casos de impasse. É muito parecido com o pensamento. Se isso é pensamento, em qualquer sentido significativo, continua sendo uma das grandes perguntas sem resposta.
Se os modelos de pensamento representaram a história intelectual de 2025, a bomba comercial foi mais brutal: a IA de fronteira revelou-se muito mais barata do que qualquer um imaginava. A economia, que parecia tão imutável quanto a gravidade, revelou-se mais parecida com a moda. Essa revelação remodelará a concorrência em 2026.
O lançamento do DeepSeek em janeiro caiu como uma bomba. O modelo reproduziu os sistemas ocidentais usando cerca de um décimo do poder computacional necessário para o treinamento. "Isso impulsionou as coisas", disse Varshney. "Agora há mais um concorrente, e todos precisam melhorar seu desempenho."
A arquitetura do modelo passou por suas próprias mudanças discretas. O novo padrão em alta, uma mistura de especialistas, direciona a entrada para sub-redes especializadas em vez de ativar todos os parâmetros para cada consulta. Pense nisso como consultar o especialista certo, em vez de pedir a um único médico que saiba tudo. Andrew Chin, professor de Direito na UNC que estuda políticas de tecnologia, explicou a lógica econômica ao IBM Think: "Modelos densos incorrem em custos computacionais aproximadamente iguais para cada token", disse ele. "Os sistemas esparsos encaminham os tokens apenas por meio de um subconjunto de parâmetros." A implicação para as empresas é significativa: "A escala passa a ser algo a ser gerenciado e não meramente maximizado."
A democratização vai além da arquitetura, chegando ao ajuste fino. Christelle Scharff, professora de Ciência da Computação na Universidade Pace, disse ao IBM Think que testemunhou "uma clara mudança em direção ao LoRa e ao ajuste fino leve, permitindo que modelos poderosos sejam adaptados com recursos computacionais limitados". Pesquisadores com orçamentos modestos agora podem personalizar modelos que seriam inacessíveis há um ano. Os portões estão se abrindo.
Os ganhos de eficiência também incluem o design do sistema. Kandyce Brennan, professora assistente da Escola de Enfermagem da UNC que trabalha com IA na área da saúde, disse ao IBM Think que abordagens como o planejador DiscIPL do MIT, onde "um grande modelo planeja e coordena... muitos modelos pequenos", alcançam resultados com "um custo computacional muito menor." A eficiência também reduz o consumo de energia e o impacto ambiental.
"As limitações de dados e as preocupações com a energia tornaram-se um verdadeiro desafio", disse Mihalcea, "o que impulsionou a pesquisa na direção de modelos menores". Essas restrições só aumentarão.
O que as empresas realmente precisam, na verdade, não é da capacidade de fazer tudo, disse Varshney. Ele deu um exemplo fantasioso: você poderia pedir a uma modelo para comentar sobre os direitos civis na Lua, e ele produziria algo fluente. "Mas a maioria das tarefas empresariais não são assim", disse ele. "Elas são mais direcionadas." A teologia da escala está dando lugar ao pragmatismo da adequação ao propósito.
Os avanços têm sido reais. Assim como os limites. Apesar de sua recém-adquirida capacidade de deliberação, os modelos de IA ainda são capazes de um tipo específico de erro: o erro convicto, cometido com a serena segurança de um guia turístico que se perdeu e entrou no museu errado.
Poesia identificou os principais problemas: "Dois grandes desafios continuam sendo a confiabilidade e a criatividade. Mesmo tendo sucesso em 99,9% das vezes não é suficiente", disse ele. A matemática é implacável. Um sistema que falha uma vez a cada mil tentativas falhará mil vezes ao processar um milhão de consultas. Na medicina, no direito ou nas finanças, essas probabilidades não são aceitáveis.
A criatividade é outro problema. "Para tarefas de final aberto... até mesmo modelos de empresas diferentes tendem a apresentar resultados semelhantes", observou poesia. Os modelos se tornaram extremamente bons em encontrar respostas corretas. Eles permanecem estranhamente uniformes quando solicitados a serem originais.
Os modelos de raciocínio têm seus próprios pontos cegos. Varshney observou que "em tarefas onde existe a possibilidade de verificar etapas intermediárias... esses fluxos mais longos ajudam. Mas existem inúmeras coisas em que não há etapas intermediárias verificáveis."
Um benchmark chamado ARC-AGI-2 ilustra a lacuna. O teste apresenta problemas que os humanos consideram fáceis, mas que a IA acha extraordinariamente difíceis. "Até mesmo modelos de pensamento de última geração têm pontuações bem abaixo do desempenho humano", disse Emadi. "Os modelos podem raciocinar melhor do que antes, mas ainda podem estar confiantemente errados."
A alucinação, que é o termo educado da área para a invenção, mudou na forma como se manifesta, mas ainda permanece. Mohammad Hossein Jarrahi, professor da UNC que estuda a interação humano-inteligência artificial, disse ao IBM Think que "a alucinação mudou de caráter, mas não desapareceu completamente". A tendência de gerar informações que soam plausíveis, mas que são fatualmente incorretas, permanece teimosamente persistente.
Alguns pesquisadores se preocupam com a trajetória mais ampla. Todd Cherner, que dirige um programa educacional de Tecnologia na Universidade da Carolina do Norte, disse ao IBM Think que "os recursos avançados dos agentes de IA são instigantes". Acho que o futuro está caminhando para a AGI mais rápido do que as pessoas imaginam. Devemos fazer bom uso do que temos antes de realmente promover a AGI."
O princípio fundamental da computação ainda se aplica. "Entra lixo, sai lixo", disse Nathalie Volkheimer, especialista em Engajamento do Usuário da RENCI, ao IBM Think. "Estamos nos concentrando na máquina que faz a salsicha, e não na salsicha em si. Mas, no fim das contas, comemos o que fazemos."
Boletim informativo do setor
Receba insights selecionados sobre as notícias mais importantes (e intrigantes) sobre IA. Inscreva-se no nosso boletim informativo semanal Think. Consulte a Declaração de privacidade da IBM.
Sua assinatura será entregue em inglês. Você encontrará um link para cancelar a assinatura em cada boletim informativo. Você pode gerenciar suas assinaturas ou cancelar a assinatura aqui. Consulte nossa Declaração de privacidade da IBM para obter mais informações.
Um avanço menos divulgado: a expansão das janelas de contexto, ou seja, a quantidade de informação que um modelo pode armazenar na memória de trabalho. "Observamos um contexto muito melhor em escala de repositório, até cerca de um milhão de tokens", disse Jarrahi. Um milhão de tokens equivalem a vários romances. Os modelos agora podem manter um entendimento coerente em interações muito mais longas, o que é extremamente importante para a análise de documentos jurídicos, desenvolvimento de software e síntese de pesquisa, disse ele.
A funcionalidade de citação também foi aprimorada, com "funcionalidades de base integradas que podem apontar para passagens específicas", acrescentou Jarrahi. Quando um modelo consegue demonstrar seu funcionamento, os usuários podem verificá-lo em vez de aceitá-lo pela confiança. Confie, mas verifique. Ou melhor: não confie e, definitivamente, verifique.
Mas a verificação só leva você até certo ponto. Aude Oliva, diretora do MIT- IBM Watson AI Lab, disse ao IBM Think que "o futuro da colaboração entre IA e humanos é o diálogo. Um sistema agêntico artificial deve possuir algum grau de teoria da mente. Compreender o funcionamento interno de um sistema de IA... constitui a base da confiança." A teoria da mente (a capacidade de entender que os outros têm perspectivas diferentes) é fundamental para a interação humana. Sua ausência na IA cria um atrito que nenhum recurso, por maior que seja, consegue superar.
As métricas para o sucesso estão mudando. "O campo está inexoravelmente caminhando em direção a modelos avaliados menos pela fluência pura e mais pela rastreabilidade, calibração e robustez interacional", disse Jarrahi. As métricas de glamour estão dando lugar às métricas de confiabilidade. Sai o flash. Entra a previsibilidade.
"O tema dominante tem sido a questão dos recursos em função das restrições", disse Chin. "Em vez de tratar a escala como um fim em si mesma, os esforços mais importantes se concentram em fazer com que os sistemas funcionem de forma previsível dentro de limites reais." O progresso parece menos um projeto ambicioso e mais um problema de engenharia.
Três restrições moldarão o que as organizações podem fazer com a IA em 2026, disseram vários especialistas ao IBM Think. A primeira é econômica, a segunda é física e a terceira é regulatória.
Comece pelo dinheiro. "A economia da inferência atuará cada vez mais como um teto rígido", disse Chin. "Muitos avanços recentes em raciocínio dependem de um aumento substancial na capacidade computacional por consulta." Um modelo que leva minutos para pensar não pode ser implementado onde são necessárias respostas em tempo real em escapa, observou ele.
As limitações físicas são igualmente assustadoras. "A previsão é de que o consumo global de eletricidade por data centers mais que dobre até 2030", disse Emadi. "A restrição do próximo ano para muitas organizações não será a disponibilidade de chips, mas sim os gigawatts necessários para conectá-los à rede elétrica." O setor passou anos obcecado por chips. O gargalo está mudando para as usinas de energia.
"As demandas computacionais e, portanto, os custos ambientais, permanecem altas", acrescentou Brennan, "o que levanta importantes questões éticas sobre sustentabilidade". A pegada de carbono da IA tornou-se impossível de ignorar.
Depois, há a regulamentação. "As pressões da governança por design moldarão o desenvolvimento do modelo mais diretamente", disse Chin. "Para muitas implementações, o requisito não é apenas alto desempenho, mas também um comportamento auditável e limitado". A era da caixa-preta pode estar chegando ao fim.
A crescente lacuna entre o setor e o meio acadêmico preocupa alguns observadores. "As universidades precisam redirecionar o foco para a IA fundamental", disse Scharff, "e investir em ideias que moldarão a área daqui a 10 ou 20 anos". Os modelos mais abrangentes estão cada vez mais fora do alcance dos acadêmicos, levantando questões incômodas sobre de onde virá a próxima geração de ideias.
Um desenvolvimento passou despercebido: o surgimento da IA soberana. "Em muitos países, as pessoas estão desenvolvendo seus próprios modelos", disse Varshney. Isso é importante porque os dados de treinamento são mais responsivos culturalmente e mudam o controle econômico para mais perto de casa, observou ele.
Para 2026, Varshney espera uma experimentação contínua em vez de avanços revolucionários. "Nem tudo precisa ser exatamente um transformador", disse ele. Mihalcea apresentou uma previsão semelhante: "uma combinação especializada menor de modelos especialistas, aproveitando sistemas multiagentes". Ao ser questionado se grandes avanços estão por vir, Varshney se mostrou cauteloso. "Sempre existe uma chance... de outro momento ChatGPT", disse ele. "Mas não espero que isso aconteça." A resposta honesta é que ninguém sabe.
Os profissionais já estão se adaptando a esse novo cenário. Jayashankar Swaminathan, professor de operações globais na UNC Kenan-Flagler, disse ao IBM Think que "os maiores avanços estão em torno de... recursos de agentes autônomos, onde a IA agora é capaz de realizar várias tarefas em uma ordem simples. O segunda diz respeito ao raciocínio da lógica por trás da tomada de decisão."
No setor de saúde, a transformação já está em andamento. Maureen Baker, professora clínica associada da Escola de Enfermagem da UNC, disse ao IBM Think que "os modelos de IA estão avançando em um ritmo incrível". Mas ela distinguiu o recurso da implementação: "O pensamento crítico, o raciocínio clínico e julgamento devem permanecer na em primeiro plano." Sua abordagem é pragmática: "Busco vitórias fáceis com o mínimo de risco."
O ecossistema está se diferenciando. David Sachs, professor de Tecnologia da Informação na Pace University, disse ao IBM Think que "parecem estar surgindo dois tipos de modelos: o modelo amplo, que permite fazer tudo, e os modelos mais específicos, como o Julius ou o Perplexity". Assim como o software evoluiu de aplicações monolíticas para ferramentas especializadas, a IA está se fragmentando em nichos.
"O uso efetivo desses sistemas... é moldado... pelo planejamento de fluxos de trabalho simbióticos", disse Jarrahi. Os humanos trazem discernimento, criatividade e responsabilidade. A IA traz velocidade, consistência e a capacidade de processar grandes quantidades de informação. As organizações que descobrirem como combiná-los terão uma vantagem.
"A IA de vanguarda está deixando para trás uma era definida pela escala bruta", disse Chin, "e caminhando em direção a uma era definida por procedimentos, restrições e compensações operacionais." As tecnologias amadurecem quando os engenheiros começam a otimizar os limites do mundo real. Nesse sentido, a IA está finalmente amadurecendo.
Mas Varshney está pensando em algo mais profundo do que a tecnologia. "Quais serão as tarefas que serão delegadas aos sistemas de IA e quais os humanos continuarão fazendo?" perguntou ele. "Isso acontece porque os humanos encontram significado… ao fazer certas coisas? O que significa ser humano, em muitos aspectos?
O IBM Granite é nossa família de modelos de IA abertos, de alto desempenho e confiáveis, personalizados para a empresa e otimizados para escalar suas aplicações de IA. Explore as opções de linguagens, código, séries temporais e proteções.
As empresas reconhecem que não podem escalar a IA generativa com modelos de base nos quais não podem confiar. Baixe o trecho para saber por que a IBM, com os emblemáticos "modelos Granite" , é nomeada Strong Performer.
Saiba como incentivar sempre as equipes a melhorar o desempenho do modelo e superar a concorrência utilizando as técnicas e infraestrutura mais recentes de IA.
Explore o valor dos modelos de base de nível empresarial que trazem confiança, desempenho e benefícios econômicos para todos os setores.
Saiba como incorporar IA generativa, aprendizado de máquina e modelos de base em suas operações de negócios para melhorar o desempenho.
Assista à demonstração com uma comparação dos modelos da IBM com outros modelos em vários casos de uso.
Explore a biblioteca de modelos de base da IBM no portfólio do watsonx para escalar a IA generativa em sua empresa com confiança.
Use a IA a serviço de sua empresa com a experiência e o portfólio de soluções líder do setor da IBM à sua disposição.
Reinvente os fluxos de trabalho e operações críticos adicionando IA para maximizar experiências, tomadas de decisão em tempo real e valor de negócios.
Explore a biblioteca da IBM de modelos de base no portfólio do IBM® watsonx para escalar a IA generativa para os seus negócios com confiança.