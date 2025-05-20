Saber cómo funcionan los modelos de lenguaje grandes es esencial para comprender por qué a veces se equivocan. Los LLM predicen la siguiente palabra de una oración en función de los patrones que han aprendido de grandes cantidades de texto. No están sacando hechos de una base de datos, sino haciendo conjeturas fundamentadas. Esto puede llevar a respuestas que suenan precisas pero son falsas, especialmente cuando el tema no está claro, es poco común o va más allá de lo que se entrenó al modelo.

Las alucinaciones son difíciles de eliminar porque no son errores en el sistema; son una característica inherente de cómo funcionan estos modelos probabilísticos. Cuando no hay un patrón sólido disponible en los datos de entrenamiento, o cuando una instrucción es demasiado vaga o abierta, el modelo puede inventar algo que suene plausible.

También hay una cuestión más filosófica en juego. Cuando un modelo de IA inventa algo, ¿está fallando o creando?

Puri señala que a medida que los modelos se vuelven más poderosos en su razonamiento, también pueden exhibir un comportamiento más "creativo" que raya en la alucinación. “Se podría argumentar que la creatividad implica algún tipo de alucinación”, dice. “Uno imagina lo inimaginable. Pero en las aplicaciones empresariales, eso es una desventaja, no una fortaleza”.

El investigador de IBM Payel Das se encuentra entre los que intentan abordar el tema replanteando cómo los modelos manejan la información. “Es la paradoja del progreso”, dice Das a IBM Think en una entrevista. “Estos modelos están mejorando en el razonamiento, pero no necesariamente en la memoria. Pueden resolver problemas más difíciles, pero aún así se equivocan en lo básico”.

Su equipo en IBM estuvo desarrollando Larimar, un sistema de aumento de memoria diseñado para dar a los modelos una forma de memoria a corto plazo editable. La idea es dejar que los modelos revisen u olviden los hechos según sea necesario, sin volver a entrenar todo el sistema; una flexibilidad en tiempo real de la que carecen en gran medida los LLM actuales.

“Los modelos de hoy son estáticos y frágiles”, dice. “No se les puede enseñar algo en medio de una conversación o actualizar su comprensión sin volver a capacitarlos por completo. Larimar es un paso para hacerlos más flexibles”.

Otros enfoques basados en la memoria también son prometedores. MemReasoner, desarrollado por investigadores de Microsoft, se centra en ayudar a los modelos a razonar de manera más eficaz en secuencias largas mediante la selección y conexión de información relevante de partes anteriores de una conversación. El proyecto CAMELoT de IBM está diseñado para ayudar a los modelos a mantener la coherencia cuando trabajan con grandes volúmenes de texto o interacciones prolongadas.

Fuera del laboratorio, compañías como Vectara están construyendo herramientas prácticas para combatir las alucinaciones. Los “agentes guardianes” de Vectara monitorean los resultados de la IA en tiempo real y reescriben los errores antes de que lleguen a los usuarios. Das dice que, si bien ningún arreglo resolverá el problema, la combinación de estrategias de memoria y revisión es un gran paso adelante.

“Nunca eliminaremos todos los errores”, afirma Das. “Así como la gente comete errores. Pero podemos hacer modelos que sean mejores para aprender, adaptarse y corregirse a sí mismos. Y eso marca una gran diferencia”.