Aunque los modelos de lenguaje de gran tamaño (LLM) se vuelven más precisos con las palabras, a veces se vuelven más difusos con los hechos.
Estos errores, conocidos como alucinaciones, no son insectos inofensivos. Señalan un problema central en la forma en que los sistemas de IA generan lenguaje. En lugar de extraer datos de una base de datos, los modelos predicen lo que suena bien en función de los patrones de sus datos de entrenamiento. Esas conjeturas pueden llevar a citas falsas, políticas inventadas y afirmaciones falsas presentadas con confianza. Los investigadores están trabajando ahora en nuevas formas de hacer que estos sistemas sean más fiables, enseñándoles cómo responder y cuándo pausar, revisar u olvidar.
"Lo que realmente está roto es esta respuesta no determinista", explica Ruchir Puri, científico jefe de IBM, a IBM Think en una entrevista. "La misma pregunta, con la misma intención, puede producir respuestas diferentes dependiendo de cómo se formule. Eso es profundamente problemático si confías en estos modelos para algo serio".
Los últimos resultados de referencia de OpenAI ponen de relieve el problema. Al parecer, el modelo o3 alucinó el 33 % de las veces en PersonQA, un conjunto de datos que pone a prueba la exactitud de los hechos sobre personajes públicos. El modelo o4-mini lo hizo peor, inventando información en casi 8 de cada 10 respuestas a las instrucciones de conocimiento general. No se trata de sistemas oscuros, sino que se están probando para tareas como la investigación jurídica, las consultas sanitarias y el apoyo a la toma de decisiones ejecutivas.
Algunos expertos afirman que los datos pintan un cuadro incompleto y que las alucinaciones no están aumentando de forma generalizada.
"Estamos viendo avances reales", afirma Ja-Naé Duane, científica de datos y coautora de SuperShifts: Transforming How We Live, Learn and Work in the Age of Intelligence, en una entrevista con IBM Think, y añade que Gemini 2.0 Flash ahora produce alucinaciones en menos del 1 % de los casos de prueba, en comparación con el 22 % en 2021. "Así que sí, tenemos un largo camino por recorrer, pero vamos absolutamente en la dirección correcta".
Duane hizo hincapié en que las alucinaciones no necesariamente han empeorado, sino que se han hecho más visibles.
“Ahora hay más en juego”, afirma. "Estamos integrando estos modelos en flujos de trabajo legales, entornos médicos y herramientas empresariales. Un error que antes pasaba desapercibido en un chatbot ahora es una responsabilidad grave".
Si bien los sistemas más modernos, como Gemini 2.0 Flash, han reducido drásticamente las tasas de alucinaciones, otros, especialmente los modelos diseñados para un razonamiento complejo, siguen teniendo problemas. "Estos modelos centrados en el razonamiento están siendo impulsados para resolver problemas más difíciles", explica Duane. "Eso significa que a menudo operan más cerca del límite de lo que pueden hacer de manera confiable, lo que aumenta el riesgo de generar respuestas que suenan bien pero no lo son".
Sostiene que resolver el problema requiere algo más que escala. “Ya no se trata solo de construir modelos más grandes”, afirma. "Necesitamos arquitecturas que entiendan no solo qué decir, sino por qué es importante y cómo mantenerse firmes en la verdad cuando cuenta".
Duane cree que el verdadero progreso vendrá de combinar mejores modelos con sistemas diseñados para apoyarlos, la memoria, los validadores y los agentes que trabajen en conjunto. “Estamos entrando en una fase en la que la inteligencia del modelo es solo una pieza del rompecabezas”, afirma. “La gestión del contexto, el aprendizaje en tiempo real y las herramientas adaptativas serán igualmente importantes”.
Saber cómo funcionan los grandes modelos lingüísticos es esencial para entender por qué a veces se equivocan. Los LLM predicen la siguiente palabra de una frase basándose en patrones que han aprendido de grandes cantidades de texto. No están sacando hechos de una base de datos, sino haciendo conjeturas fundamentadas. Esto puede dar lugar a respuestas que parecen precisas pero son falsas, especialmente cuando el tema no está claro, es poco común o va más allá de lo que se ha entrenado el modelo.
Las alucinaciones son difíciles de eliminar porque no son fallos del sistema; son una característica inherente al funcionamiento de estos modelos probabilísticos. Cuando no hay un patrón sólido disponible en los datos de entrenamiento, o cuando una instrucción es demasiado vaga o abierta, el modelo puede inventar algo que suene plausible.
También hay una cuestión más filosófica en juego. Cuando un modelo de IA inventa algo, ¿está fallando o creando?
Puri señala que, a medida que los modelos se vuelven más potentes en su razonamiento, también pueden mostrar un comportamiento más "creativo" que roza la alucinación. "Se podría argumentar que la creatividad implica algún tipo de alucinación", dice. “Uno imagina lo inimaginable. Pero en aplicaciones empresariales, eso es una desventaja, no un punto fuerte".
El investigador de IBM Payel Das se encuentra entre los que intentan abordar el tema replanteándose cómo los modelos manejan la información. "Es la paradoja del progreso", dice Das a IBM Think en una entrevista. "Estos modelos están mejorando en el razonamiento, pero no necesariamente en la memoria. Pueden resolver problemas más difíciles, pero aun así se equivocan en lo básico”.
Su equipo en IBM ha estado desarrollando Larimar, un sistema de aumento de memoria diseñado para dar a los modelos una forma de memoria a corto plazo editable. La idea es dejar que los modelos revisen u olviden los hechos según sea necesario, sin volver a entrenar todo el sistema; una flexibilidad en tiempo real de la que carecen en gran medida los LLM actuales.
“Los modelos de hoy son estáticos y frágiles”, afirma. "No se les puede enseñar algo en mitad de una conversación o actualizar su comprensión sin volver a entrenarlos por completo. Larimar es un paso para hacerlos más flexibles".
Otros enfoques basados en la memoria también se muestran prometedores. MemReasoner, desarrollado por investigadores de Microsoft, se centra en ayudar a los modelos a razonar de forma más eficaz a lo largo de secuencias largas seleccionando y conectando información relevante de partes anteriores de una conversación. El propio proyecto CAMELoT de IBM está diseñado para ayudar a los modelos a mantener la coherencia cuando se trabaja con grandes volúmenes de texto o interacciones extensas.
Fuera del laboratorio, empresas como Vectara están construyendo herramientas prácticas para combatir las alucinaciones. Los "agentes guardianes" de Vectara monitorizan los resultados de la IA en tiempo real y reescriben errores antes de que lleguen a los usuarios. Das afirma que, aunque ninguna corrección única resolverá el problema, combinar estrategias de memoria y revisión es un gran avance.
"Nunca eliminaremos todos los errores", afirma Das. “Al igual que las personas cometen errores. Pero podemos crear modelos que aprendan, se adapten y se corrijan mejor por sí mismos. Y eso hace una gran diferencia”.
Descubra los beneficios clave que se obtienen con el gobierno automatizado de la IA tanto para la IA generativa actual como para los modelos tradicionales de machine learning.
Conozca los nuevos retos de la IA generativa, la necesidad de gobernar los modelos de IA y ML y los pasos para crear un marco de IA fiable, transparente y explicable.
Entienda la importancia de establecer un proceso de evaluación defendible y de categorizar sistemáticamente cada caso de uso en el nivel de riesgo adecuado.
Lea sobre cómo impulsar prácticas éticas y conformes con la normativa con una cartera de productos de IA para modelos de IA generativa.
Hemos encuestado a 2000 organizaciones sobre sus iniciativas de IA para descubrir qué funciona, qué no y cómo puede adelantarse.
Gobierne modelos de IA generativa desde cualquier lugar e impleméntelos en la nube o en las instalaciones con IBM watsonx.governance.
Vea cómo el gobierno de la IA puede ayudar a aumentar la confianza de sus empleados en la misma, acelerar la adopción y la innovación y mejorar la confianza de los clientes.
Prepárese para la Ley de IA de la UE y establezca un enfoque de gobierno de la IA responsable con la ayuda de IBM Consulting.
Dirija, gestione y monitorice su IA con una única cartera para acelerar una IA responsable, transparente y explicable.