Los modelos de lenguaje grandes (LLM), como GPT-3, 4 y PaLM, se conocen comúnmente como modelos de "caja negra" porque los usuarios no tienen acceso a sus componentes internos, como parámetros, métodos de ajuste o procesos de toma de decisiones.

Dicha interacción se realiza esencialmente a través de instrucciones de texto que utilizan llamadas de interfaz de programación de aplicaciones (API) como los principales mecanismos de entrada y salida. Si bien estos modelos son bastante excelentes, su capacidad para producir resultados precisos específicos de tareas a menudo depende en gran medida de la calidad de las instrucciones.2, 3

Con esto, la ingeniería rápida para diseñar instrucciones específicas para dirigir el comportamiento del modelo es relevante. Tanto los enfoques manuales como los automatizados para la ingeniería rápida han tenido un éxito notable. Sin embargo, no vienen sin dificultades, especialmente para aquellas tareas que requieren un control fuerte o muchos resultados específicos de la instancia.

Por ejemplo, las tareas como el resumen o la generación de diálogos requieren que el modelo siga los comportamientos objetivo de manera sistemática, como incluir detalles clave o adherirse a un patrón de razonamiento estricto o pautas estilísticas prescritas. Las técnicas convencionales a menudo no son suficientes para garantizar el cumplimiento constante de estos requisitos matizados.

Directional stimulus prompting (DSP) viene a llenar este vacío. DSP es un pequeño modelo de política auxiliar y genera instrucciones de estímulo direccional específicas de la instancia que guían al LLM hacia sus decisiones.

Las instrucciones emitidas sirven a un contexto específico para cada instancia y se considera que persuaden al LLM para que produzca resultados más alineados y deseables. Al conectar DSP al proceso, los usuarios tienen una poderosa herramienta para corregir el comportamiento de los LLM de caja negra para lograr una mayor coherencia, relevancia y exactitud en el trabajo que necesita precisión.1