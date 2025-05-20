Saber como os grandes modelos de linguagem funcionam é essencial para entender por que eles às vezes fazem coisas erradas. Os LLMs preveem a próxima palavra em uma frase com base em padrões que aprenderam com grandes quantidades de texto. Eles não estão extraindo fatos de um banco de dados, mas fazendo suposições fundamentadas. Isso pode levar a respostas que parecem precisas, mas são falsas, especialmente quando o tópico não é claro, é incomum ou além daquilo em que o modelo foi treinado.

As alucinações são difíceis de eliminar porque não são bugs no sistema; elas são uma funcionalidade inerente de como esses modelos probabilísticos funcionam. Quando nenhum padrão sólido está disponível nos dados de treinamento, ou quando um prompt é muito vago ou aberto, o modelo pode inventar algo que soa plausível.

Há também uma questão mais filosófica em jogo. Quando um modelo de IA inventa algo, isso está falhando ou criando?

Puri observa que, à medida que os modelos se tornam mais poderosos em seu raciocínio, eles também podem exibir um comportamento mais “criativo” que beira a alucinação. "Alguém poderia argumentar que a criatividade envolve algum tipo de alucinação", diz ele. "Você imagina o inimaginável. Mas, em aplicações corporativas, isso é um ponto fraco, não um ponto forte.”

O IBM Researcher Payel Das está entre aqueles que tentam resolver o problema, repensando como os modelos lidam com as informações. “É o paradoxo do progresso”, diz Das ao IBM Think em uma entrevista. "Esses modelos estão melhorando no raciocínio, mas não necessariamente na memória. Elas podem resolver problemas mais difíceis, mas ainda erram no básico.”

Sua equipe na IBM tem desenvolvido o Larimar, um sistema de aumento de memória projetado para dar aos modelos uma forma de memória editável e de curto prazo. A ideia é permitir que os modelos revisem ou esqueçam os fatos conforme necessário, sem treinar novamente todo o sistema; uma flexibilidade em tempo real que os LLMs atuais em grande parte não têm.

“Os modelos de hoje são estáticos e frágeis”, diz ela. "Você não pode ensiná-los algo no meio de uma conversa ou atualizar seu entendimento sem retreiná-los completamente. O Larimar é um passo em direção a torná-los mais flexíveis.”

Outras abordagens baseadas em memória também estão se mostrando promissoras. O MemReasoner, desenvolvido por pesquisadores da Microsoft, concentra-se em ajudar os modelos a raciocinar de forma mais eficaz em longas sequências, selecionando e conectando informações relevantes de partes anteriores de uma conversa. O projeto CAMELoT da própria IBM foi criado para ajudar os modelos a permanecerem coerentes ao trabalhar com grandes volumes de texto ou interações estendidas.

Fora do laboratório, empresas como a Vectara estão desenvolvendo ferramentas práticas para lidar com alucinações. Os “agentes guardiões” do Vectara monitoram as produções da IA em tempo real e reescrevem os erros antes de chegarem aos usuários. Das afirma que embora nenhuma correção única resolva o problema, combinar estratégias de memória e revisão é um forte passo à frente.

“Nunca eliminaremos todos os erros”, afirma Das. “Assim como as pessoas cometem erros. No entanto, podemos criar modelos que são melhores em aprender, adaptar-se e corrigir-se. E isso faz uma enorme diferença.”