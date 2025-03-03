El nuevo Claude 3.7 Sonnet de Anthropic ahora puede activar y desactivar su modo de pensamiento profundo como si fuera un interruptor de luz, respondiendo preguntas sencillas al instante y reservando el trabajo computacional pesado para problemas complejos que lo requieran.
Este enfoque de razonamiento híbrido marca un cambio en la inteligencia artificial que, según los expertos, puede reducir los costes y aumentar las capacidades, y los modelos Granite de IBM también adoptan características similares basadas en la complejidad de la tarea. Esta evolución se produce en un momento en el que organizaciones de todo el mundo se enfrentan a las realidades financieras de la IA avanzada, lo que podría hacer que el razonamiento sofisticado sea más accesible y, al mismo tiempo, conservar valiosos recursos informáticos.
“La estructura de costes de los modelos de pensamiento es importante; no todas las preguntas requieren una pausa de 32 segundos para que el modelo las piense”, afirma Maya Murad, directora de producto de IA en IBM® Research, durante un episodio reciente del pódcast Mixture of Experts. “Esta capacidad permite a las empresas utilizar los recursos de forma inteligente, aplicando cálculos extensos solo cuando el problema lo requiere, creando sistemas de IA que se ajustan mejor a la forma en que los seres humanos abordan las diferentes tareas cognitivas”.
El razonamiento híbrido marca un cambio en el enfoque del sector de la IA, que pasa de limitarse a crear sistemas más potentes a desarrollar otros que sean prácticos de usar, según explica Abraham Daniels, director sénior de programas de IBM Research, a IBM Think. Para las empresas, este cambio podría ser crucial, ya que el coste de operar una IA sofisticada se ha convertido en un factor importante a tener en cuenta.
Los modelos consumen muchos más recursos computacionales (y, por lo tanto, cuestan más dinero) durante el razonamiento profundo que cuando proporcionan respuestas simples. El razonamiento híbrido permite a las empresas optimizar el gasto en IA ajustando los niveles de computación a la complejidad de las tareas.
Anthropic ha lanzado recientemente Claude 3.7 Sonnet con “modo de pensamiento ampliado”, que permite a los usuarios solicitar un análisis más exhaustivo cuando sea necesario. IBM ha equipado de forma similar sus modelos Granite con capacidades de “alternancia”, lo que permite a los usuarios controlar cuándo activar el razonamiento intensivo.
“Hemos creado el razonamiento híbrido con una filosofía diferente a la de otros modelos de razonamiento del mercado”, explicó un portavoz de Anthropic a IBM Think. “Nuestro enfoque se basa en el funcionamiento del cerebro humano. Como seres humanos, no tenemos dos cerebros separados para el pensamiento rápido y el pensamiento profundo, y en Anthropic consideramos que el razonamiento es algo que debe integrarse profundamente en las capacidades de todos nuestros modelos, en lugar de ser una característica separada. Este enfoque se basa en cómo vemos la integración de Claude con nuestros clientes en todas las aplicaciones. Mientras que algunas interacciones requieren respuestas rápidas, como la lluvia de ideas para material de marketing, otras, como el análisis financiero complejo o la investigación sectorial, requieren un pensamiento más profundo y prolongado. Queríamos que ambas funcionalidades fueran lo más sencillas y rentables posible para que sus clientes pudieran acceder a ellas y utilizarlas”.
El proceso de pensamiento de la IA se vuelve más transparente con este enfoque. “El modelo en sí mismo sigue siendo una caja negra, pero al menos en el resultado, se puede ver cómo el modelo llegó a esa conclusión”, dice Daniels. Esta visibilidad puede mejorar los resultados y abordar las preocupaciones sobre la explicabilidad, lo cual es particularmente importante para los sectores regulados, afirma.
Daniels y otros expertos consideran que este avance responde a una necesidad práctica: eliminar la sobrecarga computacional innecesaria para preguntas sencillas.
“No se necesita un razonamiento exhaustivo para todas las tareas, y básicamente le da la posibilidad, cuando se trata de cosas más complicadas, de pagar más, tanto en términos de latencia como de coste”, afirma Kate Soule, directora de Gestión Técnica de Productos de IBM Research, en el pódcast.
El funcionamiento interno de los modelos de lenguaje de gran tamaño (LLM) ha sido tradicionalmente opaco. Un modelo recibía una instrucción y generaba una respuesta, sin revelar sus pasos de razonamiento internos.
El razonamiento híbrido cambia esta dinámica al exponer el proceso de pensamiento paso a paso de un modelo. Cuando se activan, sistemas como Granite 3.2 muestran su trabajo, haciendo visibles las rutas lógicas que siguen.
“Nuestra decisión de hacer visible el proceso de razonamiento de Claude refleja la consideración de múltiples factores. Uno de esos factores es la mejora de la experiencia del usuario y la transparencia de la confianza en el proceso de razonamiento de Claude”, afirmó el portavoz de Anthropic. “Esto proporciona a los usuarios conocimientos sobre cómo se llega a las conclusiones, lo que fomenta unos niveles adecuados de confianza y comprensión. Por lo general, los usuarios confían más en los resultados cuando pueden observar la cadena de pensamiento. Esperamos que esta visibilidad permita a los usuarios evaluar mejor la calidad y la exhaustividad del razonamiento de Claude, y les ayude a comprender mejor sus capacidades. Además, esperamos que los usuarios y desarrolladores puedan crear mejores instrucciones al leer los resultados del razonamiento de Claude y proporcionar feedback específico sobre pasos concretos del razonamiento”.
“Poder exponer el razonamiento real del modelo es fantástico para la explicabilidad”, afirma Daniels. “Antes de poder demostrar el razonamiento de la cadena de pensamiento (CoT), se trataba realmente de la probabilidad del siguiente token. Por lo tanto, era un poco como una caja negra”.
Estas tecnologías tienen aplicaciones comerciales que se extienden a muchos sectores. “Las finanzas y el ámbito jurídico son los más adecuados, ya que se ocupan de documentación estructurada”, afirma Daniels, y añade que “cualquier sector regulado puede obtener un enorme valor” de estos modelos de pensamiento avanzados.
Pero el razonamiento híbrido puede ser especialmente útil en ámbitos que requieren un análisis complejo.
“Las matemáticas y el código son realmente los dos puntos centrales que he observado en términos de puntos de referencia para el razonamiento”, afirma Daniels. En el caso del desarrollo de software, los beneficios podrían ser sustanciales: “El uso de un modelo de pensamiento permitiría definir cuál debería ser el alcance del proyecto, dados los requisitos que usted ha establecido”, afirma.
Los LLM estándar generan respuestas prediciendo la siguiente palabra más probable basándose en los patrones de sus datos de entrenamiento. Este enfoque funciona bien para muchas tareas, pero estos modelos pueden tener dificultades con los problemas de razonamiento de varios pasos.
Los modelos de razonamiento híbrido pueden cambiar a un modo de cálculo intensivo, generando explícitamente pasos de razonamiento intermedios antes de proporcionar una respuesta final. El modelo utiliza estos pasos para resolver problemas complejos, de forma similar a como los seres humanos escriben los pasos intermedios cuando resuelven problemas matemáticos complejos.
La arquitectura que permite el razonamiento híbrido se basa en lo que los investigadores denominan “cálculo en tiempo de prueba”, que implica dedicar recursos computacionales durante la inferencia y no solo durante el entrenamiento.
“Muchas veces, tradicionalmente, toda la potencia de cálculo se utilizaba para entrenar el modelo, y luego la inferencia del modelo era relativamente ligera en términos de requisitos computacionales”, afirma Daniels.
Pero a medida que los sistemas de IA se vuelven más complejos, el reto no será solo la potencia de procesamiento, sino saber cuándo utilizarla de forma eficiente. Por eso, según Daniels, la próxima frontera para el razonamiento híbrido será una autorregulación más inteligente: enseñar a la IA cuándo activar su modo de pensamiento más profundo por sí misma, sin que los humanos le digan que lo haga.
“El próximo paso en términos de modelos de razonamiento, o modelos de razonamiento híbridos, es cómo podemos comprender mejor o clasificar mejor las entradas dentro del tiempo de cálculo de la prueba, o dentro del marco de pensamiento”, afirma.
Únase a IBM para un webinar en el que demostraremos cómo encontrar un ROI real a través de iniciativas de IA agéntica, con ejemplos en sectores, casos de uso e incluso las propias historias de éxito de IBM.
Descubra por qué IBM ha sido reconocido como líder en el 2025 Gartner Magic Quadrant for Data Science and Machine Learning Platforms.
Descubra cómo las organizaciones están pasando de lanzar la IA en proyectos piloto dispares a utilizarla para impulsar la transformación en el núcleo.
Acceda a nuestro catálogo completo de más de 100 cursos en línea al adquirir hoy mismo una suscripción individual o multiusuario, que le permitirá ampliar sus conocimientos en una amplia gama de nuestros productos a un precio bajo.
IBM® Granite es una familia de modelos de IA abiertos, eficaces y de confianza, adaptados a la empresa y optimizados para escalar sus aplicaciones de IA. Explore las opciones de lenguaje, código, series temporales y límites de protección.
Dirigido por los principales líderes de opinión de IBM, el plan de estudios está diseñado para ayudar a los líderes empresariales a obtener el conocimiento necesario para priorizar las inversiones en IA que pueden impulsar el crecimiento.
Hemos encuestado a 2000 organizaciones sobre sus iniciativas de IA para descubrir qué funciona, qué no y cómo puede adelantarse.
Active estos cinco cambios de mentalidad para superar la incertidumbre, impulsar la reinvención empresarial e impulsar el crecimiento con la IA agentica.
Aprenda a incorporar con confianza la IA generativa y el machine learning a su negocio.
Entrene, valide, ajuste e implemente IA generativa, modelos fundacionales y capacidades de machine learning con IBM watsonx.ai, un estudio empresarial de nueva generación para desarrolladores de IA. Cree aplicaciones de IA en menos tiempo y con menos datos.
Ponga la IA al servicio de su negocio con la experiencia líder del sector y el portfolio de soluciones de IA de IBM.
Los servicios de IA de IBM Consulting ayudan a reinventar la forma de trabajar de las empresas usando IA para la transformación.
Obtenga acceso único a capacidades que abarcan el ciclo de vida de desarrollo de la IA. Produzca potentes soluciones de IA con interfaces intuitivas, flujos de trabajo y acceso a API y SDK estándar del sector.