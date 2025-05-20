Embora os grandes modelos de linguagem (LLMs) estejam ficando mais afiados com as palavras, às vezes ficam mais nebulosos com os fatos.
Esses erros, conhecidos como alucinações, não são bugs inofensivos. Eles apontam para um problema central na forma como os sistemas de IA geram linguagem. Em vez de recuperar fatos de uma base de dados, os modelos predizem o que soa correto com base em padrões presentes nos dados de treinamento. Essa suposição pode levar a cotações falsas, políticas inventadas e alegações falsas feitas com confiança. Os pesquisadores agora estão trabalhando em novas maneiras de tornar esses sistemas mais confiáveis, ensinando-os a responder e quando pausar, revisar ou esquecer.
“O que realmente está quebrado é essa resposta não determinística”, afirma Ruchir Puri, Chief Scientist da IBM, em entrevista ao IBM Think. “A mesma pergunta, com a mesma intenção, pode produzir respostas diferentes dependendo de como é formulada. Isso é profundamente problemático se você depende desses modelos para algo sério.”
Os resultados do benchmark mais recentes da OpenAI destacam o problema. O modelo o3 supostamente alucinou 33% do tempo em PersonQA, um conjunto de dados que testa a precisão dos fatos sobre figuras públicas. O modelo o4-mini se saiu pior, inventando informações em quase 8 em cada 10 respostas a prompts de conhecimentos gerais. Estes não são sistemas obscuros, eles estão sendo testados para tarefas como pesquisa jurídica, consultas de saúde e suporte à decisão executiva.
Alguns especialistas dizem que os dados descrevem um quadro incompleto e que as alucinações não estão aumentando de forma generalizada.
"Estamos vendo ganhos reais", diz Ja-Naé Duane, cientista de dados e co-autor de SuperShifts: Transforming How We Live, Learn and Work in the Age of Intelligence, em entrevista ao IBM Think em uma entrevista, acrescentando que o Gemini 2.0 Flash agora produz alucinações em menos de 1% dos casos de teste, em comparação com 22% em 2021. "Então, sim, temos um longo caminho a percorrer, mas estamos absolutamente indo na direção certa."
Duane enfatizou que as alucinações não necessariamente pioraram, mas que se tornaram mais visíveis.
"As apostas são maiores agora", diz ela. "Estamos colocando esses modelos em fluxos de trabalho jurídicos, ambientes médicos e ferramentas empresariais. Um erro que antes passava despercebido em um chatbot agora é uma responsabilidade grave."
Enquanto sistemas de última geração como o Gemini 2.0 Flash reduziram drasticamente as taxas de alucinação, outros, especialmente os modelos construídos para raciocínio complexo, ainda enfrentam dificuldades. "Esses modelos focados em raciocínio estão sendo impulsionados para resolver problemas mais difíceis", explica Duane. "Isso significa que muitas vezes eles estão operando mais perto do que podem fazer de forma confiável, o que aumenta o risco de gerar respostas que parecem certas, mas não estão."
Ela argumenta que resolver o problema exige mais do que escala. "Não se trata mais apenas de construir modelos maiores", diz ela. "Precisamos de arquiteturas que entendam não apenas o que dizer, mas por que isso é importante e como permanecer fundamentado na verdade quando for importante."
Duane acredita que o progresso real virá da combinação de modelos melhores com sistemas projetados para suportá-los, com memória, validadores e agentes trabalhando em conjunto. "Estamos entrando em uma fase em que a inteligência do modelo é apenas uma peça do quebra-cabeça", afirma ela. "Gestão de contexto, aprendizado em tempo real e ferramentas adaptativas serão igualmente importantes."
Saber como os grandes modelos de linguagem funcionam é essencial para entender por que eles às vezes fazem coisas erradas. Os LLMs preveem a próxima palavra em uma frase com base em padrões que aprenderam com grandes quantidades de texto. Eles não estão extraindo fatos de um banco de dados, mas fazendo suposições fundamentadas. Isso pode levar a respostas que parecem precisas, mas são falsas, especialmente quando o tópico não é claro, é incomum ou além daquilo em que o modelo foi treinado.
As alucinações são difíceis de eliminar porque não são bugs no sistema; elas são uma funcionalidade inerente de como esses modelos probabilísticos funcionam. Quando nenhum padrão sólido está disponível nos dados de treinamento, ou quando um prompt é muito vago ou aberto, o modelo pode inventar algo que soa plausível.
Há também uma questão mais filosófica em jogo. Quando um modelo de IA inventa algo, isso está falhando ou criando?
Puri observa que, à medida que os modelos se tornam mais poderosos em seu raciocínio, eles também podem exibir um comportamento mais “criativo” que beira a alucinação. "Alguém poderia argumentar que a criatividade envolve algum tipo de alucinação", diz ele. "Você imagina o inimaginável. Mas, em aplicações corporativas, isso é um ponto fraco, não um ponto forte.”
O IBM Researcher Payel Das está entre aqueles que tentam resolver o problema, repensando como os modelos lidam com as informações. “É o paradoxo do progresso”, diz Das ao IBM Think em uma entrevista. "Esses modelos estão melhorando no raciocínio, mas não necessariamente na memória. Elas podem resolver problemas mais difíceis, mas ainda erram no básico.”
Sua equipe na IBM tem desenvolvido o Larimar, um sistema de aumento de memória projetado para dar aos modelos uma forma de memória editável e de curto prazo. A ideia é permitir que os modelos revisem ou esqueçam os fatos conforme necessário, sem treinar novamente todo o sistema; uma flexibilidade em tempo real que os LLMs atuais em grande parte não têm.
“Os modelos de hoje são estáticos e frágeis”, diz ela. "Você não pode ensiná-los algo no meio de uma conversa ou atualizar seu entendimento sem retreiná-los completamente. O Larimar é um passo em direção a torná-los mais flexíveis.”
Outras abordagens baseadas em memória também estão se mostrando promissoras. O MemReasoner, desenvolvido por pesquisadores da Microsoft, concentra-se em ajudar os modelos a raciocinar de forma mais eficaz em longas sequências, selecionando e conectando informações relevantes de partes anteriores de uma conversa. O projeto CAMELoT da própria IBM foi criado para ajudar os modelos a permanecerem coerentes ao trabalhar com grandes volumes de texto ou interações estendidas.
Fora do laboratório, empresas como a Vectara estão desenvolvendo ferramentas práticas para lidar com alucinações. Os “agentes guardiões” do Vectara monitoram as produções da IA em tempo real e reescrevem os erros antes de chegarem aos usuários. Das afirma que embora nenhuma correção única resolva o problema, combinar estratégias de memória e revisão é um forte passo à frente.
“Nunca eliminaremos todos os erros”, afirma Das. “Assim como as pessoas cometem erros. No entanto, podemos criar modelos que são melhores em aprender, adaptar-se e corrigir-se. E isso faz uma enorme diferença.”
Aprenda sobre os principais benefícios adquiridos com a governança de IA automatizada para a IA generativa atual e os modelos tradicionais de aprendizado de máquina.
Conheça os novos desafios da IA generativa, a necessidade de governar modelos de IA e ML e as etapas para criar um framework de IA confiável, transparente e explicável.
Entenda a importância de estabelecer um processo de avaliação defensável e de categorizar consistentemente cada caso de uso no nível de risco apropriado.
Leia sobre a condução de práticas éticas e de conformidade com um portfólio de produtos de IA para modelos de IA generativa.
Entrevistamos duas mil organizações a respeito de suas iniciativas de IA para descobrir o que está funcionando, o que não está e como se preparar.
Governe modelos de IA generativa de qualquer lugar e implemente na nuvem ou no local com o IBM® watsonx.governance.
Veja como a governança de IA pode ajudar a aumentar a confiança dos seus funcionários na IA, acelerar a adoção e a inovação e melhorar a confiança dos clientes.
Prepare-se para a Lei de IA da UE e estabeleça uma abordagem de governança de IA responsável com a ajuda da IBM® Consulting.
Direcione, gerencie e monitore sua IA com um único portfólio para acelerar a IA responsável, transparente e explicável.