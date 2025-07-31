Los sistemas de IA pueden superar pruebas e imitar a los expertos, pero aún no saben cuándo levantar la mano y admitir que pueden estar equivocados.
Los modelos de lenguaje de gran tamaño (LLM) ahora pueden traducir texto, resumir información, generar código y mantener conversaciones con una fluidez sorprendente. Son rápidos, fluidos y a menudo convincentes. Pero no saben cuándo están adivinando, y pueden sonar confiados incluso cuando están confundidos o fuera de lugar.
Lo que falta es una forma de dar un paso atrás y reflexionar; un sistema que sabe cuándo hacer una pausa y reevaluar. En los humanos, esta capa reflectante se conoce como metacognición, y los investigadores de IBM creen que una funcionalidad similar podría ser la clave para hacer que la IA sea más fiable y adaptable.
La becaria de IBM y responsable global de ética de la IA,Francesca Rossi, y sus colegas defienden una nueva arquitectura que separa la heurística rápida del razonamiento deliberado y superpone un sistema de supervisión reflexiva. La arquitectura, denominada SOFAI, significa IA lenta y rápida; se inspira en la psicología y la ciencia cognitiva, y traduce esos conocimientos en principios de ingeniería de IA.
"Queríamos combinar los puntos fuertes de los enfoques neuronal y simbólico sin forzarlos a formar un único híbrido", dijo Rossi en una entrevista con IBM Think. "Eso significaba crear una estructura que pudiera determinar qué modo de razonamiento utilizar y cuándo".
El sistema SOFAI, como se detalla en un artículo reciente publicado por la Association for Computing Machinery, piensa en capas. En el primer nivel están los solucionadores rápidos, incluidos los modelos de machine learning, como los LLM o los modelos de machine learning más tradicionales, que responden rápidamente y gestionan los problemas conocidos con facilidad. Estas son las partes instintivas del sistema, que reaccionan sin vacilación.
Luego vienen los solucionadores lentos, que toman un camino más cuidadoso. Estos motores suelen basarse en el razonamiento simbólico y en reglas estructuradas para resolver los problemas paso a paso. Tardan más, pero sus respuestas son más precisas. Velar por ambos es una tercera capa: la metacognición. Esta parte de la SOFAI evalúa lo que está haciendo el sistema, determina si la respuesta rápida es satisfactoria, dado el contexto, e interviene si se requiere un enfoque diferente. La capa de metacognición actúa como una especie de guía interna, eligiendo cuándo moverse rápido y cuándo ralentizar.
"El solucionador rápido siempre iría primero", dijo Rossi. "Si produjera una respuesta plausible y no hubiera mucho en juego, el proceso terminaría ahí. Pero si el módulo de metacognición consideraba que la respuesta era deficiente, enviaba el problema a un motor de razonamiento más riguroso".
Este diseño refleja cómo piensa la gente. Para tareas rutinarias como leer, conducir o charlar, respondemos de forma rápida y automática. Pero cuando nos encontramos con incertidumbre, riesgo o complejidad, disminuimos la velocidad. Consideramos alternativas, comprobamos nuestro razonamiento o consultamos a otros. SOFAI está diseñado para replicar ese proceso reflexivo.
El equipo de Rossi descubrió que incluso bucles de feedback limitados entre el solucionador rápido y el módulo de metacognición podían mejorar significativamente los resultados sin necesidad de escalar a sistemas más lentos. En SOFAI, la arquitectura también admite una corrección iterativa: el solucionador rápido puede revisar su output en respuesta al feedback guiado antes de que el sistema recurra al solucionador lento, que es más costoso.
“Repetir una o dos veces el proceso suele ser suficiente para obtener respuestas de alta calidad”, afirmó Rossi. "Eso ahorra tiempo, reduce el uso de energía y preserva la opción de escalar solo cuando sea realmente necesario".
Las implicaciones de SOFAI son particularmente poderosas en el contexto de los LLM. Estos modelos alimentan chatbots, generadores de contenidos, plataformas de atención al cliente y asistentes de codificación. Pero sus outputs pueden ser inconsistentes, impredecibles y desalineados con los valores humanos. Las organizaciones que utilizan LLM a menudo tienen dificultades para controlar lo que dicen los modelos, especialmente cuando están en juego el contexto, la legalidad o la ética.
"Uno de los desafíos es que los modelos de lenguaje se entrenan con grandes cantidades de datos de Internet, lo que incluye ruido, sesgos y perspectivas incompletas", explicó Rossi. “No se puede asumir que el modelo sabe qué valores aplicar en un contexto determinado”.
SOFAI ofrece un enfoque práctico para mantener los sistemas de IA en marcha sin necesidad de volver a entrenar el modelo de lenguaje subyacente. En cambio, introduce una capa de supervisión que actúa como un equipo de revisión integrado, y mantiene la IA centrada y consistente. Esto incluye evaluadores que revisan las respuestas del modelo, comparándolas con políticas internas, estándares éticos o reglas específicas para la tarea. Si algo parece estar mal, el sistema puede solicitar de forma autónoma una versión mejor. "Se puede considerar como enseñar al sistema a revisarse a sí mismo", explicó Rossi. “No todo debe resolverse reentrenando el modelo. A veces basta con tener un juez inteligente entre la entrada y la salida".
Esta modularidad permite a SOFAI adaptarse a diversas necesidades culturales, organizativas y normativas. Se pueden definir diferentes evaluadores para diferentes jurisdicciones o unidades de negocio. Si las directrices cambian, solo hay que actualizar a los evaluadores. Los solucionadores centrales permanecen intactos.
"La belleza de mantener la metacognición separada es que pone la alineación al alcance de la mano", dijo Rossi. “Brinda a los usuarios las herramientas para cocrear el comportamiento de la IA sin necesidad de reconstruir el sistema desde cero”.
Rossi tiene claro que SOFAI no se creó para vivir en el papel. Fue diseñado para un uso realista y desordenado. A medida que las empresas conectan modelos de lenguaje a herramientas como motores de búsqueda, hojas de cálculo y aplicaciones de programación, el resultado suele ser más potente pero más difícil de controlar, afirmó. SOFAI ayuda a gestionar esta complejidad seleccionando los sistemas adecuados para cada tarea, decidiendo cuándo escalar y manteniendo las salidas alineadas con la política a medida que el entorno de IA se interconecta cada vez más.
“En el futuro, la IA empresarial no se parecerá a un único modelo monolítico”, afirmó Rossi. "Será un compuesto: diferentes agentes, herramientas, API y sistemas de razonamiento. SOFAI es un marco para gobernar ese ecosistema".
En muchos escenarios hipotéticos, SOFAI funciona como gestor de proyectos para pensar. Monitoriza las solicitudes, evalúa la complejidad de la tarea, selecciona el solucionador o combinación de solucionadores apropiados y, a continuación, supervisa el resultado. También realiza un seguimiento de los patrones a lo largo del tiempo, aprendiendo qué combinaciones producen resultados fiables y adaptándose en consecuencia.
“Se obtiene tanto rendimiento como explicabilidad”, dijo Rossi. "Se pueden auditar las decisiones, rastrear qué solucionadores se utilizaron y ajustar los parámetros metacognitivos si fuera necesario".
Esta estructura también ofrece ventajas medioambientales y operativas. Muchos sistemas de razonamiento a gran escala son caros de ejecutar, especialmente cuando se basan en gráficos de inferencia masivos o lógica simbólica en tiempo real. Al minimizar las llamadas a estos solucionadores de peso pesado, SOFAI puede reducir el consumo de energía y, al mismo tiempo, mantener una alta precisión.
"La eficiencia no solo se trata de velocidad", dijo Rossie. "Se trata de saber cuándo no pensar demasiado. Y eso es lo que permite la metacognición”.
El auge de la IA generativa ha obligado a las organizaciones y a los responsables políticos a enfrentarse a cuestiones difíciles. ¿Cómo podemos garantizar que los sistemas se comporten adecuadamente? ¿Cómo es la rendición de cuentas cuando las decisiones se toman de forma autónoma? ¿Cómo pueden reflejarse diferentes valores en modelos entrenados con datos globales?
SOFAI ofrece una posible respuesta. Al incorporar una capa de toma de decisiones que imita la metacognición humana, la arquitectura facilita una supervisión que es a la vez flexible y basada en la realidad. Puede escalarse a través de las aplicaciones, adaptarse a las normas locales y proporcionar a los usuarios un control en tiempo real sobre el comportamiento de las máquinas.
"No pretendemos humanizar la IA", afirmó Rossi. "Estamos tratando de hacerlo más responsable. Y eso comienza por saber cuándo hacer una pausa, reconsiderar y cambiar de rumbo".
Según Rossi, la arquitectura también anticipa el futuro de los sistemas basados en agentes. En los ecosistemas de IA del mañana, dijo, los modelos colaborarán, transferirán subtareas, consultarán bases de datos e iterarán a través de pasos para alcanzar los objetivos. Sin coordinación, esa complejidad podría volverse inmanejable. Pero SOFAI ofrece una estructura de gobierno ligera, adaptable y con principios para dirigir a los agentes.
"Piense en ello como un director de orquesta, no como un dictador", dijo Rossi. "Hay que mantener la orquesta en armonía, pero también se necesita improvisación".
Rossi cree que integrar la metacognición en la IA no es solo una decisión técnica, sino una decisión responsable. Refleja un compromiso con la transparencia, la adaptabilidad y la agencia compartida. El objetivo no es imponer el control desde arriba, sino ofrecer a los humanos una forma significativa de colaborar con los sistemas inteligentes.
"Estamos construyendo sistemas que aprenden, se adaptan y actúan en el mundo", dijo Rossi. "También deben aprender cuándo parar, reflexionar y preguntarse: '¿Estoy haciendo lo correcto?'"
