La cadena de impulsos de pensamiento simula procesos de razonamiento similares a los humanos al descomponer problemas elaborados en pasos intermedios manejables que conducen secuencialmente a una respuesta concluyente2. Esta estructura de resolución de problemas paso a paso tiene como objetivo ayudar a garantizar que el proceso de razonamiento sea claro, lógico y eficaz.
En los formatos de instrucción estándar, la salida del modelo suele ser una respuesta directa a la entrada proporcionada. Por ejemplo, se podría proporcionar una instrucción de entrada preguntando "¿De qué color es el cielo?", la IA generaría una respuesta simple y directa, como "El cielo es azul".
Sin embargo, si se le pide que explique por qué el cielo es azul utilizando el prompting de CoT, la IA primero definiría qué significa "azul" (un color primario). La IA deduciría entonces que el cielo parece azul debido a la absorción de otros colores por la atmósfera. Esta respuesta demuestra la capacidad de la IA para construir un argumento lógico.
Para construir una instrucción, un usuario suele añadir una instrucción al final de su instrucción. Los usuarios suelen añadir una indicación a su instrucción como "describa los pasos de su razonamiento" o "explique su respuesta paso a paso". En esencia, esta técnica de prompting pide al LLM que no solo genere un resultado, sino que también detalle la serie de pasos intermedios que condujeron a esa respuesta3.
La cadena de instrucciones es otro método popular utilizado en aplicaciones de IA generativa para mejorar la fiabilidad mediante el uso de múltiples instrucciones que se complementan entre sí secuencialmente para desglosar tareas complejas. Técnicas como la cadena de instrucciones y la CoT guían al modelo para razonar un problema paso a paso en lugar de saltar a una respuesta que simplemente suena correcta. Este método también puede ser útil para la observabilidad y la depuración, ya que anima al modelo a ser más transparente en su razonamiento. La principal diferencia entre estos métodos es que la cadena de instrucciones encadena varias instrucciones para desglosar las tareas paso a paso, mientras que las instrucciones de CoT provocan el proceso de razonamiento del modelo dentro de una única instrucción.