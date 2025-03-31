A medida que modelos de razonamiento como o1 de OpenAI, DeepSeek-R1 y Gemini 2.5 de Google compiten por los mejores puntos de referencia de inteligencia de IA, las empresas que buscan integrar la IA desconfían cada vez más de algo llamado "inflación de modelos", el fenómeno por el que los modelos se vuelven innecesariamente grandes o complejos, empujando hacia arriba los costes computacionales y el tiempo de entrenamiento de los modelos y disminuyendo la velocidad a la que pueden proporcionar las respuestas que necesitan las empresas.

o1 de OpenAI y DeepSeek-R1 utilizan el razonamiento de la cadena de pensamiento (CoT) para dividir problemas complejos en pasos, logrando un rendimiento sin precedentes y una mayor precisión que los modelos anteriores. Pero CoT también exige importantes recursos computacionales durante la inferencia, lo que da lugar a resultados prolongados y una mayor latencia, afirma Volkmar Uhlig, vicepresidente y responsable del portfolio de infraestructura de IA de IBM, en una entrevista con IBM Think.

Introduzca una nueva clase de técnicas de prompting, descritas en varios artículos nuevos, que van desde el átomo de pensamiento (AoT) hasta la cadena de borrador (CoD), con el objetivo de aumentar la eficacia y la precisión del CoT ayudando a los modelos a resolver los problemas más rápidamente y, por lo tanto, reducir los costes y la latencia.

El científico de IA y fundador de una startup Lance Elliott ve las nuevas ramificaciones de la cadena de pensamiento como variaciones en un kit de herramientas de un ingeniero de instrucciones. "Su kit de herramientas de trabajo manual típico puede tener un martillo normal, que sería CoT", le dice a IBM Think. "AoT sería similar a usar un martillo especializado utilizado para situaciones que implican cortar y ajustar paneles de yeso. Podría usar un martillo normal para trabajar en paneles de yeso, pero sería aconsejable usar un martillo para paneles de yeso si tuviera uno y supiera cómo usarlo correctamente".

Vyoma Gajjar, arquitecta de soluciones técnicas de IA en IBM, ve potencial en estos nuevos primos CoT, especialmente para las empresas que "buscan formas más rentables de dar instrucción a los modelos pequeños a obtener respuestas precisas para sus casos de uso específicos", afirma.