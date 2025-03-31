A medida que los modelos de razonamiento como o1 de OpenAI, DeepSeek-R1 y Gemini 2.5 de Google compiten por los mejores puntos de referencia de inteligencia de IA, las empresas que buscan integrar la IA son cada vez más cautelosas con algo llamado "inflación de modelos", el fenómeno por el cual los modelos se vuelven innecesariamente grandes o complejos, empujando hacia arriba costos computacionales y el tiempo de entrenamiento del modelo, y disminuyendo la velocidad a la que pueden proporcionar las respuestas que las empresas necesitan.

O1 y DeepSeek-R1 de OpenAI utilizan el razonamiento de la cadena de pensamiento (CoT) para dividir problemas complejos en pasos, logrando un rendimiento sin precedentes y una mayor precisión que los modelos anteriores. Pero CoT también exige recursos computacionales sustanciales durante la inferencia, lo que conduce a resultados largos y mayor latencia elevada, afirma Volkmar Uhlig, vicepresidente y responsable de cartera de infraestructuras de IA en IBM, en una entrevista con IBM Think.

Ingrese una nueva clase de técnicas de ingeniería de instrucciones, descritas en varios artículos nuevos, que van desde el átomo de pensamiento (AoT) hasta la cadena de borrador (CoD), buscando aumentar la eficiencia y precisión de CoT ayudando a los modelos a resolver problemas más rápidamente, reduciendo así los costos y la latencia.

El científico de IA y fundador de una startup, Lance Elliott, ve las nuevas ramas de la cadena de pensamiento como variaciones en el kit de herramientas de un ingeniero de instrucción. “Su kit de herramientas de trabajo manual típico podría tener un martillo normal, ese sería CoT”, le dice a IBM Think. “AoT sería similar a usar un martillo especializado para situaciones que implican cortar y ajustar paneles de yeso. Podrías usar un martillo normal para trabajar en paneles de yeso, pero sería aconsejable usar un martillo para paneles de yeso si tuvieras uno y supieras cómo usarlo correctamente".

Vyoma Gajjar, arquitecto técnico de soluciones de IA en IBM, ve potencial en estos nuevos primos de CoT, especialmente para las empresas que "buscan formas más rentables de dar instrucción a los modelos pequeños a obtener respuestas precisas para sus casos de uso específicos", dice.