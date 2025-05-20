Saber cómo funcionan los grandes modelos lingüísticos es esencial para entender por qué a veces se equivocan. Los LLM predicen la siguiente palabra de una frase basándose en patrones que han aprendido de grandes cantidades de texto. No están sacando hechos de una base de datos, sino haciendo conjeturas fundamentadas. Esto puede dar lugar a respuestas que parecen precisas pero son falsas, especialmente cuando el tema no está claro, es poco común o va más allá de lo que se ha entrenado el modelo.

Las alucinaciones son difíciles de eliminar porque no son fallos del sistema; son una característica inherente al funcionamiento de estos modelos probabilísticos. Cuando no hay un patrón sólido disponible en los datos de entrenamiento, o cuando una instrucción es demasiado vaga o abierta, el modelo puede inventar algo que suene plausible.

También hay una cuestión más filosófica en juego. Cuando un modelo de IA inventa algo, ¿está fallando o creando?

Puri señala que, a medida que los modelos se vuelven más potentes en su razonamiento, también pueden mostrar un comportamiento más "creativo" que roza la alucinación. "Se podría argumentar que la creatividad implica algún tipo de alucinación", dice. “Uno imagina lo inimaginable. Pero en aplicaciones empresariales, eso es una desventaja, no un punto fuerte".

El investigador de IBM Payel Das se encuentra entre los que intentan abordar el tema replanteándose cómo los modelos manejan la información. "Es la paradoja del progreso", dice Das a IBM Think en una entrevista. "Estos modelos están mejorando en el razonamiento, pero no necesariamente en la memoria. Pueden resolver problemas más difíciles, pero aun así se equivocan en lo básico”.

Su equipo en IBM ha estado desarrollando Larimar, un sistema de aumento de memoria diseñado para dar a los modelos una forma de memoria a corto plazo editable. La idea es dejar que los modelos revisen u olviden los hechos según sea necesario, sin volver a entrenar todo el sistema; una flexibilidad en tiempo real de la que carecen en gran medida los LLM actuales.

“Los modelos de hoy son estáticos y frágiles”, afirma. "No se les puede enseñar algo en mitad de una conversación o actualizar su comprensión sin volver a entrenarlos por completo. Larimar es un paso para hacerlos más flexibles".

Otros enfoques basados en la memoria también se muestran prometedores. MemReasoner, desarrollado por investigadores de Microsoft, se centra en ayudar a los modelos a razonar de forma más eficaz a lo largo de secuencias largas seleccionando y conectando información relevante de partes anteriores de una conversación. El propio proyecto CAMELoT de IBM está diseñado para ayudar a los modelos a mantener la coherencia cuando se trabaja con grandes volúmenes de texto o interacciones extensas.

Fuera del laboratorio, empresas como Vectara están construyendo herramientas prácticas para combatir las alucinaciones. Los "agentes guardianes" de Vectara monitorizan los resultados de la IA en tiempo real y reescriben errores antes de que lleguen a los usuarios. Das afirma que, aunque ninguna corrección única resolverá el problema, combinar estrategias de memoria y revisión es un gran avance.

"Nunca eliminaremos todos los errores", afirma Das. “Al igual que las personas cometen errores. Pero podemos crear modelos que aprendan, se adapten y se corrijan mejor por sí mismos. Y eso hace una gran diferencia”.