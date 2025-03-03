El funcionamiento interno de los modelos de lenguaje de gran tamaño (LLM) ha sido tradicionalmente opaco. Un modelo recibía una instrucción y generaba una respuesta, sin revelar sus pasos de razonamiento internos.

El razonamiento híbrido cambia esta dinámica al exponer el proceso de pensamiento paso a paso de un modelo. Cuando se activan, sistemas como Granite 3.2 muestran su trabajo, haciendo visibles las rutas lógicas que siguen.

“Nuestra decisión de hacer visible el proceso de razonamiento de Claude refleja la consideración de múltiples factores. Uno de esos factores es la mejora de la experiencia del usuario y la transparencia de la confianza en el proceso de razonamiento de Claude”, afirmó el portavoz de Anthropic. “Esto proporciona a los usuarios conocimientos sobre cómo se llega a las conclusiones, lo que fomenta unos niveles adecuados de confianza y comprensión. Por lo general, los usuarios confían más en los resultados cuando pueden observar la cadena de pensamiento. Esperamos que esta visibilidad permita a los usuarios evaluar mejor la calidad y la exhaustividad del razonamiento de Claude, y les ayude a comprender mejor sus capacidades. Además, esperamos que los usuarios y desarrolladores puedan crear mejores instrucciones al leer los resultados del razonamiento de Claude y proporcionar feedback específico sobre pasos concretos del razonamiento”.

“Poder exponer el razonamiento real del modelo es fantástico para la explicabilidad”, afirma Daniels. “Antes de poder demostrar el razonamiento de la cadena de pensamiento (CoT), se trataba realmente de la probabilidad del siguiente token. Por lo tanto, era un poco como una caja negra”.

Estas tecnologías tienen aplicaciones comerciales que se extienden a muchos sectores. “Las finanzas y el ámbito jurídico son los más adecuados, ya que se ocupan de documentación estructurada”, afirma Daniels, y añade que “cualquier sector regulado puede obtener un enorme valor” de estos modelos de pensamiento avanzados.

Pero el razonamiento híbrido puede ser especialmente útil en ámbitos que requieren un análisis complejo.

“Las matemáticas y el código son realmente los dos puntos centrales que he observado en términos de puntos de referencia para el razonamiento”, afirma Daniels. En el caso del desarrollo de software, los beneficios podrían ser sustanciales: “El uso de un modelo de pensamiento permitiría definir cuál debería ser el alcance del proyecto, dados los requisitos que usted ha establecido”, afirma.

Los LLM estándar generan respuestas prediciendo la siguiente palabra más probable basándose en los patrones de sus datos de entrenamiento. Este enfoque funciona bien para muchas tareas, pero estos modelos pueden tener dificultades con los problemas de razonamiento de varios pasos.

Los modelos de razonamiento híbrido pueden cambiar a un modo de cálculo intensivo, generando explícitamente pasos de razonamiento intermedios antes de proporcionar una respuesta final. El modelo utiliza estos pasos para resolver problemas complejos, de forma similar a como los seres humanos escriben los pasos intermedios cuando resuelven problemas matemáticos complejos.

La arquitectura que permite el razonamiento híbrido se basa en lo que los investigadores denominan “cálculo en tiempo de prueba”, que implica dedicar recursos computacionales durante la inferencia y no solo durante el entrenamiento.

“Muchas veces, tradicionalmente, toda la potencia de cálculo se utilizaba para entrenar el modelo, y luego la inferencia del modelo era relativamente ligera en términos de requisitos computacionales”, afirma Daniels.

Pero a medida que los sistemas de IA se vuelven más complejos, el reto no será solo la potencia de procesamiento, sino saber cuándo utilizarla de forma eficiente. Por eso, según Daniels, la próxima frontera para el razonamiento híbrido será una autorregulación más inteligente: enseñar a la IA cuándo activar su modo de pensamiento más profundo por sí misma, sin que los humanos le digan que lo haga.

“El próximo paso en términos de modelos de razonamiento, o modelos de razonamiento híbridos, es cómo podemos comprender mejor o clasificar mejor las entradas dentro del tiempo de cálculo de la prueba, o dentro del marco de pensamiento”, afirma.