DSPy puede ser útil en varios tipos diferentes de flujos de trabajo y escenarios. Algunos de los más utilizados son la generación aumentada por recuperación, multihop question answering y el resumen de documentos.

Chain of thought

Chain of thought (CoT) prompting simula procesos de razonamiento similares a los humanos al pedirle al modelo que descomponga tareas complejas en una secuencia de pasos lógicos hacia una resolución final. Estos pasos de razonamiento se introducen en la ventana de contexto del modelo, lo que le proporciona una mayor base en la tarea en cuestión y, a menudo, conduce a mejores respuestas incluso en escenarios complejos. DSPy ayuda haciendo que el modelo de lenguaje genere instrucciones y estrategias de cadena de pensamiento y probándolas con el modelo de lenguaje para generar las instrucciones de CoT más efectivas para el modelo dado.

Generación aumentada por recuperación

La generación aumentada por recuperación (RAG) es un enfoque que permite a los LLM aprovechar un gran corpus de conocimientos de fuentes y consultar su almacén de conocimientos para encontrar pasajes o contenidos relevantes y producir una respuesta bien refinada. La RAG garantiza que los LLM puedan utilizar dinámicamente el conocimiento en tiempo real, incluso si no se entrenaron originalmente en el tema, y dar respuestas correctas. Esta potencia adicional conduce a una mayor complejidad al configurar pipelines de RAG. DSPy ofrece un enfoque fluido para configurar pipelines de instrucciones y generar instrucciones efectivas (ajuste de instrucciones) o, en el caso de modelos más pequeños, ajustar las ponderaciones de los modelos.

Los pipelines de RAG se pueden optimizar con DSPy de dos maneras: mediante ejemplos etiquetados o ejemplos de bootstrap. Los ejemplos etiquetados son simplemente preexistentes, y los ejemplos etiquetados manualmente se utilizan para entrenar directamente el modelo de estudiante. Hace bootstrapping en el contexto de DSPy significa usar un modo de lenguaje en un paradigma de profesor y estudiante. El profesor genera nuevos ejemplos de entrenamiento basados en algunas instrucciones proporcionadas por el usuario. Estos ejemplos de bootstrapping se utilizan junto con los ejemplos etiquetados manualmente o en lugar de ellos para entrenar el módulo del estudiante hasta que proporcione las respuestas correctas. Las instrucciones que generan las respuestas correctas se actualizan iterativamente a lo largo del pipeline DSPy.

Multihop question answering

Muchas veces, una sola consulta de búsqueda no es suficiente para una tarea compleja de preguntas y respuestas. El popular conjunto de datos HotPot Question Answering consiste en preguntas que requieren múltiples análisis y recuperaciones de preguntas antes de que puedan responderse. Por ejemplo: "¿Bill Nelson voló como especialista en carga útil en un transbordador espacial lanzado por primera vez en qué año?" Esta respuesta requiere saber que Bill Nelson voló en el transbordador espacial Columbia y luego poder determinar que el Columbia voló por primera vez en 1981.

El enfoque estándar para este desafío en la literatura aumentada por recuperación es construir un sistema de búsqueda multihop. Estos sistemas leen los resultados recuperados y luego generan consultas adicionales para recopilar información adicional cuando sea necesario antes de llegar a una respuesta final. Con DSPy, puede crear el mismo sistema en unas cuantas líneas de código de una manera sólida que le permite actualizar los modelos y simplemente volver a ejecutar su pipeline.

Resumen

El resumen condensa un texto más largo en una versión más corta sin dejar de conservar la información clave y las ideas principales. Es una habilidad poderosa para que un LLM funcione bien, con aplicaciones que van desde la creación de resúmenes de artículos hasta la generación de informes concisos a partir de documentos extensos.

Evaluar la calidad de los resúmenes producidos por los modelos de lenguaje presenta desafíos importantes. A diferencia de las tareas con respuestas claras correctas o incorrectas, la calidad del resumen suele ser subjetiva y depende del contexto. El modelo debe equilibrar la retención de información con la concisión, al tiempo que conserva el tono y la intención del texto original y garantiza la precisión de los hechos sin introducir errores. Adaptarse a diferentes tipos de material de origen y propósitos de resumen presenta un desafío adicional. DSPy le permite utilizar datos etiquetados para ajustar sus instrucciones de resumen para obtener las mejores respuestas posibles.