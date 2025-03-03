El funcionamiento interno de los modelos de lenguaje grandes (LLM) ha sido tradicionalmente opaco. Un modelo recibiría una instrucción y generaría una respuesta, sin revelar sus pasos de razonamiento interno.

El razonamiento híbrido cambia esta dinámica al exponer el proceso de pensamiento paso a paso de un modelo. Cuando se activan, los sistemas como Granite 3.2 muestran su trabajo, haciendo visibles las rutas lógicas que siguen.

"Nuestra decisión de hacer visible el proceso de razonamiento de Claude refleja la consideración de múltiples factores. Uno de esos factores incluye una experiencia de usuario mejorada y la transparencia de la confianza en el proceso de razonamiento de Claude", dijo el portavoz de Anthropic. "Esto proporciona a los usuarios insight sobre cómo se llega a las conclusiones, fomentando niveles adecuados de confianza y comprensión. Los usuarios generalmente confían más en los resultados cuando pueden observar la cadena de pensamiento. Esperamos que esta visibilidad permita a los usuarios evaluar mejor la calidad y la exhaustividad del razonamiento de Claude, y ayude a los usuarios a comprender mejor las capacidades de Claude. Además, esperamos que los usuarios y desarrolladores puedan crear mejores instrucciones leyendo los resultados de pensamiento de Claude y proporcionando feedback específico sobre pasos de razonamiento específicos".

"Ser capaz de exponer el pensamiento real del modelo es excelente para la explicabilidad", dice Daniels. "Antes de poder demostrar el razonamiento de la cadena de pensamiento (CoT), en realidad era solo la siguiente probabilidad de token. Así que un poco como una caja negra".

Estas tecnologías tienen aplicaciones comerciales que se extienden a muchas industrias. "Finanzas y legal encajan perfectamente porque se ocupan de documentación estructurada", dice Daniels, y agrega que "cualquier industria regulada puede obtener un valor tremendo" de estos modelos de pensamiento avanzados.

Pero el razonamiento híbrido puede ser especialmente útil en dominios que requieren un análisis complejo.

"Las matemáticas y el código son realmente los dos puntos de enfoque que he visto en términos de puntos de referencia para el razonamiento", dice Daniels. Para el desarrollo de software, los beneficios podrían ser sustanciales: "El uso de un modelo de pensamiento podría enmarcar cómo debería ser el alcance del proyecto dados los requisitos que ha establecido", dice.

Los LLM estándar generan respuestas prediciendo la siguiente palabra más probable en función de los patrones de sus datos de entrenamiento. Este enfoque funciona bien para muchas tareas, pero estos modelos pueden tener dificultades con problemas de razonamiento de varios pasos.

Los modelos de razonamiento híbrido pueden cambiar a un modo computacionalmente intensivo, generando explícitamente pasos de razonamiento intermedios antes de proporcionar una respuesta final. El modelo utiliza estos pasos para resolver problemas complejos, de forma similar a cómo los humanos escriben pasos intermedios al resolver problemas matemáticos complejos.

La arquitectura que permite el razonamiento híbrido se basa en lo que los investigadores llaman "computaciónen tiempo de prueba", que implica dedicar recursos computacionales durante la inferencia en lugar de solo durante el entrenamiento.

"Muchas veces, tradicionalmente, toda su potencia informática se utilizaría para entrenar el modelo, y luego inferir el modelo sería relativamente ligero en términos de requisitos computacionales", dice Daniels.

Pero a medida que los sistemas de IA se vuelven más complejos, el desafío no será solo la potencia de procesamiento, sino saber cuándo usarla de manera eficiente. Es por eso que la próxima frontera para el razonamiento híbrido, dice Daniels, será una autorregulación más inteligente: enseñar a la IA cuándo activar su modo de pensamiento más profundo por sí sola, sin que los humanos le digan que lo haga.

"El siguiente paso en términos de modelos de razonamiento, o modelos de razonamiento híbrido, es cómo podemos comprender o clasificar mejor las entradas dentro del cálculo del tiempo de prueba, o dentro de la infraestructura", dice.