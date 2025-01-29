Los modelos de lenguaje de gran tamaño (LLM) como GPT-3, 4 y PaLM se denominan comúnmente modelos de "caja negra" porque los usuarios no tienen acceso a sus componentes internos, como parámetros, métodos de ajuste o procesos de toma de decisiones.

Dicha interacción se realiza esencialmente a través de instrucciones de texto que utilizan llamadas a la interfaz de programación de aplicaciones (API) como los principales mecanismos de entrada y salida. Aunque estos modelos son bastante excelentes, su capacidad para producir resultados precisos específicos de la tarea suele depender en gran medida de la calidad de las instrucciones2, 3.

Con esto, el prompt engineering es relevante para diseñar instrucciones específicas para dirigir el comportamiento del modelo. Tanto los enfoques manuales como los automatizados para el prompt engineering han tenido un éxito notable. Sin embargo, no vienen sin píldoras amargas, especialmente para aquellas tareas que requieren un control fuerte o muchos resultados específicos de la instancia.

Por ejemplo, tareas como el resumen o la generación de diálogos requieren que el modelo siga los comportamientos objetivo de forma sistemática, como la inclusión de detalles clave o la adhesión a un patrón de razonamiento estricto o a directrices estilísticas prescritas. Las técnicas convencionales a menudo no son suficientes para garantizar el cumplimiento constante de estos requisitos matizados.

Directional stimulus prompting (DSP) viene a llenar este vacío. DSP es un pequeño modelo de política auxiliar y genera instrucciones específicas de la instancia que guían al LLM hacia sus decisiones.

Las instrucciones emitidas sirven a un contexto específico para cada instancia y se considera que persuaden al LLM para que produzca outputs más alineados y deseables. Al conectar la DSP al proceso, los usuarios disponen de una potente herramienta para corregir el comportamiento de los LLM de caja negra y lograr una mayor coherencia, relevancia y precisión en el trabajo que necesita precisión1.