Aunque los grandes modelos de lenguaje (LLMs) se vuelven más precisos con las palabras, a veces se vuelven más difusos con los hechos.
Estos errores, conocidos como alucinaciones, no son errores inofensivos. Señalan un problema central en la forma en que los sistemas de IA generan lenguaje. En lugar de extraer datos de una base de datos, los modelos predicen lo que suena bien en función de los patrones de sus datos de entrenamiento. Esas conjeturas pueden dar lugar a cotizaciones falsas, políticas inventadas y afirmaciones falsas presentadas con total seguridad. Los investigadores ahora están trabajando en nuevas formas de hacer que estos sistemas sean más confiables, enseñándoles cómo responder y cuándo pausar, revisar u olvidar.
" Lo que realmente está roto es esta respuesta no determinista, " Ruchir Puri, científico jefe de IBM, le dice a IBM Think en una entrevista. "La misma pregunta, con la misma intención, puede producir diferentes respuestas dependiendo de cómo se formule. Eso es profundamente problemático si confías en estos modelos para algo serio".
Los últimos resultados de referencia de OpenAI destacan el problema. Según se informa, el modelo o3 tuvo 33% de alucinaciones en PersonQA, un conjunto de datos que evalúa la precisión factual sobre figuras públicas. Al modelo o4-mini le fue peor, inventando información en casi 8 de cada 10 respuestas a las instrucciones de conocimiento general. No se trata de sistemas desconocidos, sino que se están probando para tareas como la investigación jurídica, las consultas sobre atención médica y el apoyo a la toma de decisiones ejecutivas.
Algunos expertos dicen que los datos pintan una imagen incompleta y que las alucinaciones no están aumentando en todos los ámbitos.
"Estamos viendo ganancias reales", dice a IBM Think en una entrevista Ja-Naé Duane, científica de datos y coautora de SuperShifts: Transforming How We Live, Learn and Work in the Age of Intelligence, y agrega que Gemini 2.0 Flash ahora produce alucinaciones en menos del 1 % de los casos de prueba, en comparación con el 22 % en 2021. "Así que sí, tenemos un largo camino por recorrer, pero vamos absolutamente en la dirección correcta".
Duane enfatizó que las alucinaciones no necesariamente han empeorado, sino que se han vuelto más visibles.
“Ahora hay más en juego”, afirma. “Estamos poniendo estos modelos en flujos de trabajo legales, entornos médicos y herramientas empresariales. Un error que antes pasaba desapercibido en un chatbot ahora es una responsabilidad grave”.
Si bien los sistemas de última generación como Gemini 2.0 Flash han reducido drásticamente las tasas de alucinaciones, otros, especialmente los modelos creados para el razonamiento complejo, siguen teniendo dificultades. "Estos modelos centrados en el razonamiento están siendo impulsados para resolver problemas más difíciles", explica Duane. "Eso significa que a menudo operan más cerca del límite de lo que pueden hacer de manera confiable, lo que aumenta el riesgo de generar respuestas que suenan bien pero no lo son".
Ella argumenta que resolver el problema requiere más que escala. “Ya no se trata solo de construir modelos más grandes”, dice ella. “Necesitamos arquitecturas que entiendan no solo qué decir, sino también por qué es importante y cómo mantenerse firmes en la verdad cuando cuenta”.
Duane cree que el verdadero progreso vendrá de emparejar mejores modelos con sistemas diseñados para respaldarlos, memoria, validadores y agentes trabajando en conjunto. “Estamos entrando en una fase donde la inteligencia modelo es solo una pieza del rompecabezas”, afirma. “La administración del contexto, el aprendizaje en tiempo real y las herramientas adaptativas serán igualmente importantes”.
Saber cómo funcionan los modelos de lenguaje grandes es esencial para comprender por qué a veces se equivocan. Los LLM predicen la siguiente palabra de una oración en función de los patrones que han aprendido de grandes cantidades de texto. No están sacando hechos de una base de datos, sino haciendo conjeturas fundamentadas. Esto puede llevar a respuestas que suenan precisas pero son falsas, especialmente cuando el tema no está claro, es poco común o va más allá de lo que se entrenó al modelo.
Las alucinaciones son difíciles de eliminar porque no son errores en el sistema; son una característica inherente de cómo funcionan estos modelos probabilísticos. Cuando no hay un patrón sólido disponible en los datos de entrenamiento, o cuando una instrucción es demasiado vaga o abierta, el modelo puede inventar algo que suene plausible.
También hay una cuestión más filosófica en juego. Cuando un modelo de IA inventa algo, ¿está fallando o creando?
Puri señala que a medida que los modelos se vuelven más poderosos en su razonamiento, también pueden exhibir un comportamiento más "creativo" que raya en la alucinación. “Se podría argumentar que la creatividad implica algún tipo de alucinación”, dice. “Uno imagina lo inimaginable. Pero en las aplicaciones empresariales, eso es una desventaja, no una fortaleza”.
El investigador de IBM Payel Das se encuentra entre los que intentan abordar el tema replanteando cómo los modelos manejan la información. “Es la paradoja del progreso”, dice Das a IBM Think en una entrevista. “Estos modelos están mejorando en el razonamiento, pero no necesariamente en la memoria. Pueden resolver problemas más difíciles, pero aún así se equivocan en lo básico”.
Su equipo en IBM estuvo desarrollando Larimar, un sistema de aumento de memoria diseñado para dar a los modelos una forma de memoria a corto plazo editable. La idea es dejar que los modelos revisen u olviden los hechos según sea necesario, sin volver a entrenar todo el sistema; una flexibilidad en tiempo real de la que carecen en gran medida los LLM actuales.
“Los modelos de hoy son estáticos y frágiles”, dice. “No se les puede enseñar algo en medio de una conversación o actualizar su comprensión sin volver a capacitarlos por completo. Larimar es un paso para hacerlos más flexibles”.
Otros enfoques basados en la memoria también son prometedores. MemReasoner, desarrollado por investigadores de Microsoft, se centra en ayudar a los modelos a razonar de manera más eficaz en secuencias largas mediante la selección y conexión de información relevante de partes anteriores de una conversación. El proyecto CAMELoT de IBM está diseñado para ayudar a los modelos a mantener la coherencia cuando trabajan con grandes volúmenes de texto o interacciones prolongadas.
Fuera del laboratorio, compañías como Vectara están construyendo herramientas prácticas para combatir las alucinaciones. Los “agentes guardianes” de Vectara monitorean los resultados de la IA en tiempo real y reescriben los errores antes de que lleguen a los usuarios. Das dice que, si bien ningún arreglo resolverá el problema, la combinación de estrategias de memoria y revisión es un gran paso adelante.
“Nunca eliminaremos todos los errores”, afirma Das. “Así como la gente comete errores. Pero podemos hacer modelos que sean mejores para aprender, adaptarse y corregirse a sí mismos. Y eso marca una gran diferencia”.
