El nuevo Claude 3.7 Sonnet de Anthropic ahora puede activar y desactivar su modo de pensamiento profundo como un interruptor de luz, respondiendo preguntas simples al instante mientras reserva el trabajo pesado computacional para problemas complejos que lo necesitan.
Este enfoque de razonamiento híbrido marca un cambio en la inteligencia artificial que, según los expertos, puede reducir costos e impulsar capacidades, ya que los modelos Granite de IBM también adoptan características de alternancia similares basadas en la complejidad de la tarea. Esta evolución se produce en un momento en el que organizaciones de todo el mundo se enfrentan a las realidades financieras de la IA avanzada, lo que podría hacer que el razonamiento sofisticado sea más accesible y, al mismo tiempo, conservar valiosos recursos informáticos.
"La estructura de costos de los modelos de pensamiento es importante; no todas las preguntas requieren una pausa de 32 segundos para que el modelo las piense", dice Maya Murad, gerente de producto de IA en IBM Research, durante un episodio reciente del podcast Mixture of Experts. "Esta capacidad permite a las empresas utilizar los recursos de manera inteligente, aplicando computación extensiva solo cuando el problema lo requiere, creando sistemas de IA que se adapten mejor a la forma en que los humanos abordan diferentes tareas cognitivas".
El razonamiento híbrido señala un cambio en el enfoque de la industria de la IA de simplemente construir sistemas más potentes a crear otros que sean prácticos de usar, dice Abraham Daniels, gerente sénior de programas con IBM Research, a IBM Think. Para las empresas, este cambio podría ser crucial, ya que el costo de operar una IA sofisticada se ha convertido en una consideración importante.
Los modelos consumen significativamente más recursos computacionales (y, por lo tanto, cuestan más dinero) durante el razonamiento profundo que cuando proporcionan respuestas simples. El razonamiento híbrido permite a las empresas optimizar el gasto en IA ajustando los niveles de computación a la complejidad de las tareas.
Anthropic lanzó recientemente Claude 3.7 Sonnet con "modo de pensamiento extendido", lo que permite a los usuarios solicitar un análisis más exhaustivo cuando sea necesario. IBM equipó de manera similar sus modelos Granite con capacidades de "alternancia", lo que brinda a los usuarios control sobre cuándo activar el razonamiento intensivo.
"Construimos un razonamiento híbrido con una filosofía diferente a la de otros modelos de razonamiento en el mercado", dijo un portavoz de Anthropic a IBM Think. "Nuestro enfoque se basa en cómo funciona el cerebro humano. Como humanos, no tenemos dos cerebros separados para el pensamiento rápido y el profundo, y en Anthropic, consideramos que el razonamiento es algo que debe integrarse profundamente en las capacidades de todos nuestros modelos en lugar de una característica separada. Este enfoque se basa en cómo vemos que Claude se integra con nuestros clientes en todas las aplicaciones. Si bien algunas interacciones requieren respuestas rápidas, como la lluvia de ideas sobre el material de marketing, otras, como el análisis financiero complejo o la investigación de la industria, requieren un pensamiento más profundo y prolongado. Queríamos que estas dos funcionalidades fueran lo más sencillas y rentables posible para que nuestros clientes accedieran a ellas y las utilizaran".
El proceso de pensamiento de la IA se vuelve más transparente con este enfoque. "El modelo en sí sigue siendo una caja negra, pero al menos en el resultado, se puede ver cómo el modelo llegó a esa conclusión", dice Daniels. Esta visibilidad puede mejorar resultados y abordar las inquietudes de explicabilidad, lo cual es particularmente importante para las industrias reguladas, dice.
Daniels y otros expertos ven que este desarrollo responde a una necesidad práctica: eliminar la sobrecarga computacional innecesaria para preguntas sencillas.
"No se necesita demasiado razonamiento para todas las tareas, y básicamente, cuando hay cosas más complicadas, da la capacidad de pagar más, tanto en términos de latencia como de costo", dice Kate Soule, directora de gestión de productos técnicos en IBM Research, en el podcast.
El funcionamiento interno de los modelos de lenguaje grandes (LLM) ha sido tradicionalmente opaco. Un modelo recibiría una instrucción y generaría una respuesta, sin revelar sus pasos de razonamiento interno.
El razonamiento híbrido cambia esta dinámica al exponer el proceso de pensamiento paso a paso de un modelo. Cuando se activan, los sistemas como Granite 3.2 muestran su trabajo, haciendo visibles las rutas lógicas que siguen.
"Nuestra decisión de hacer visible el proceso de razonamiento de Claude refleja la consideración de múltiples factores. Uno de esos factores incluye una experiencia de usuario mejorada y la transparencia de la confianza en el proceso de razonamiento de Claude", dijo el portavoz de Anthropic. "Esto proporciona a los usuarios insight sobre cómo se llega a las conclusiones, fomentando niveles adecuados de confianza y comprensión. Los usuarios generalmente confían más en los resultados cuando pueden observar la cadena de pensamiento. Esperamos que esta visibilidad permita a los usuarios evaluar mejor la calidad y la exhaustividad del razonamiento de Claude, y ayude a los usuarios a comprender mejor las capacidades de Claude. Además, esperamos que los usuarios y desarrolladores puedan crear mejores instrucciones leyendo los resultados de pensamiento de Claude y proporcionando feedback específico sobre pasos de razonamiento específicos".
"Ser capaz de exponer el pensamiento real del modelo es excelente para la explicabilidad", dice Daniels. "Antes de poder demostrar el razonamiento de la cadena de pensamiento (CoT), en realidad era solo la siguiente probabilidad de token. Así que un poco como una caja negra".
Estas tecnologías tienen aplicaciones comerciales que se extienden a muchas industrias. "Finanzas y legal encajan perfectamente porque se ocupan de documentación estructurada", dice Daniels, y agrega que "cualquier industria regulada puede obtener un valor tremendo" de estos modelos de pensamiento avanzados.
Pero el razonamiento híbrido puede ser especialmente útil en dominios que requieren un análisis complejo.
"Las matemáticas y el código son realmente los dos puntos de enfoque que he visto en términos de puntos de referencia para el razonamiento", dice Daniels. Para el desarrollo de software, los beneficios podrían ser sustanciales: "El uso de un modelo de pensamiento podría enmarcar cómo debería ser el alcance del proyecto dados los requisitos que ha establecido", dice.
Los LLM estándar generan respuestas prediciendo la siguiente palabra más probable en función de los patrones de sus datos de entrenamiento. Este enfoque funciona bien para muchas tareas, pero estos modelos pueden tener dificultades con problemas de razonamiento de varios pasos.
Los modelos de razonamiento híbrido pueden cambiar a un modo computacionalmente intensivo, generando explícitamente pasos de razonamiento intermedios antes de proporcionar una respuesta final. El modelo utiliza estos pasos para resolver problemas complejos, de forma similar a cómo los humanos escriben pasos intermedios al resolver problemas matemáticos complejos.
La arquitectura que permite el razonamiento híbrido se basa en lo que los investigadores llaman "computaciónen tiempo de prueba", que implica dedicar recursos computacionales durante la inferencia en lugar de solo durante el entrenamiento.
"Muchas veces, tradicionalmente, toda su potencia informática se utilizaría para entrenar el modelo, y luego inferir el modelo sería relativamente ligero en términos de requisitos computacionales", dice Daniels.
Pero a medida que los sistemas de IA se vuelven más complejos, el desafío no será solo la potencia de procesamiento, sino saber cuándo usarla de manera eficiente. Es por eso que la próxima frontera para el razonamiento híbrido, dice Daniels, será una autorregulación más inteligente: enseñar a la IA cuándo activar su modo de pensamiento más profundo por sí sola, sin que los humanos le digan que lo haga.
"El siguiente paso en términos de modelos de razonamiento, o modelos de razonamiento híbrido, es cómo podemos comprender o clasificar mejor las entradas dentro del cálculo del tiempo de prueba, o dentro de la infraestructura", dice.
Únase a IBM para un seminario web en el que demostramos cómo encontrar un retorno de la inversión (ROI) real a través de iniciativas de IA agéntica, con ejemplos en todas las industrias, casos de uso e incluso las propias historias de éxito de IBM.
Descubra por qué IBM ha sido reconocida como líder en el 2025 Gartner® Magic Quadrant™ para plataformas de ciencia de datos y machine learning.
Descubra cómo las organizaciones están pasando de lanzar IA en pilotos dispares a usarla para impulsar la transformación en el núcleo.
Acceda a nuestro catálogo completo de más de 100 cursos en línea al adquirir hoy mismo una suscripción individual o multiusuario, lo que le permitirá ampliar sus conocimientos en una amplia gama de nuestros productos a un precio bajo.
IBM® Granite es una familia de modelos de IA abiertos, de alto rendimiento y confiables, diseñados para empresas y optimizados para escalar sus aplicaciones de IA. Explore opciones de lenguaje, código, series de tiempo y medidas de protección.
Dirigida por los principales líderes de opinión de IBM, el plan de estudios está diseñado para ayudar a los líderes empresariales a obtener los conocimientos necesarios para priorizar las inversiones en IA que pueden impulsar el crecimiento.
Encuestamos a 2000 organizaciones sobre sus iniciativas de IA para descubrir qué funciona, qué no y cómo pueden avanzar.
Active estos cinco cambios de mentalidad para superar la incertidumbre, estimular la reinvención empresarial y potenciar el crecimiento con la IA agéntica.
Aprenda a incorporar con confianza la IA generativa y el aprendizaje automático en su negocio.
Entrene, valide, ajuste y despliegue IA generativa, modelos fundacionales y capacidades de machine learning con IBM watsonx.ai, un estudio empresarial de próxima generación para creadores de IA. Diseñe aplicaciones de IA en menos tiempo y con menos datos.
Ponga a trabajar la IA en su negocio con la experiencia en IA líder del sector y la cartera de soluciones de IBM a su lado.
Los servicios de IA de IBM Consulting ayudan a reinventar la forma en que las empresas trabajan con IA para la transformación.
Obtenga acceso único a capacidades que abarcan el ciclo de vida del desarrollo de IA. Produzca potentes soluciones de IA con interfaces fáciles de usar, flujos de trabajo y acceso a API y SDK estándar de la industria.