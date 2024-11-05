DSPy puede ser útil en varios tipos diferentes de flujos de trabajo y escenarios. Algunos de los más utilizados son la generación aumentada por recuperación, la respuesta a preguntas de múltiples saltos y el resumen de documentos.

Cadena de pensamiento

El prompting de cadena de pensamiento (CoT) simulan procesos de razonamiento similares a los humanos al pedir al modelo que descomponga tareas complejas en una secuencia de pasos lógicos hacia una resolución final. Estos pasos de razonamiento se introducen en la ventana contextual del modelo, lo que le proporciona una mayor base en la tarea en cuestión y, a menudo, conduce a mejores respuestas incluso en escenarios complejos. DSPy ayuda haciendo que el modelo de lenguaje genere una cadena de instrucciones y estrategias de pensamiento y probándolos con el modelo de lenguaje para generar las instrucciones de CoT más efectivas para el modelo dado.

Generación aumentada por recuperación

La generación aumentada por recuperación (RAG) es un enfoque que permite a los LLM aprovechar un gran corpus de conocimientos de fuentes y consultar su base de datos para encontrar pasajes o contenidos relevantes y producir una respuesta bien refinada. La RAG garantiza que los LLM puedan utilizar dinámicamente los conocimientos en tiempo real, incluso si no han recibido formación original sobre el tema, y dar respuestas correctas. Esta potencia adicional conduce a una mayor complejidad a la hora de configurar pipelines RAG. DSPy ofrece un enfoque fluido para configurar pipelines de instrucciones y generar instrucciones efectivas (ajuste de instrucciones) o, en el caso de modelos más pequeños, afinar las ponderaciones del modelo.

Los pipelines RAG se pueden optimizar con DSPy de dos maneras: utilizando ejemplos etiquetados o utilizando ejemplos de bootstrapping. Los ejemplos etiquetados son simplemente preexistentes, los ejemplos etiquetados manualmente se utilizan para entrenar directamente el modelo de estudiante. Bootstrapping en el contexto de DSPy significa usar un modo de lenguaje en un paradigma de profesor y alumno. El profesor genera nuevos ejemplos de formación basados en unas pocas instrucciones proporcionadas por el usuario. Estos ejemplos de bootstrapping se utilizan junto con los ejemplos etiquetados manualmente o en lugar de ellos para entrenar el módulo del alumno hasta que proporcione las respuestas correctas. A continuación, las instrucciones que generan las respuestas correctas se actualizan iterativamente a lo largo del pipeline DSPy.

Respuesta a preguntas multisalto

Muchas veces, una sola consulta de búsqueda no es suficiente para una tarea compleja de respuesta a preguntas. El popular conjunto de datos HotPot Question Answering consta de preguntas que requieren múltiples análisis y recuperaciones de preguntas antes de poder responderlas. Por ejemplo: "¿Bill Nelson voló como especialista en carga útil en un transbordador espacial lanzado por primera vez en qué año?" Esta respuesta requiere saber que Bill Nelson voló en el transbordador espacial Columbia y luego poder determinar que el Columbia voló por primera vez en 1981.

El enfoque estándar para este desafío en la literatura aumentada de recuperación es construir un sistema de búsqueda multisalto. Estos sistemas leen los resultados recuperados y luego generan consultas adicionales para recopilar información adicional cuando sea necesario antes de llegar a una respuesta final. Con DSPy puede crear el mismo sistema en unas pocas líneas de código de una manera sólida que le permite actualizar modelos y simplemente volver a ejecutar su pipeline.

Resumen

El resumen condensa un texto más largo en una versión más corta sin dejar de conservar la información clave y las ideas principales. Es una habilidad poderosa para que un LLM lo haga bien, con aplicaciones que van desde la creación de resúmenes de artículos hasta la generación de informes concisos a partir de documentos extensos.

Evaluar la calidad de los resúmenes producidos por los modelos de lenguaje presenta desafíos importantes. A diferencia de las tareas con respuestas claras correctas o incorrectas, la calidad del resumen suele ser subjetiva y depende del contexto. El modelo debe equilibrar la retención de información con la concisión, al mismo tiempo que conserva el tono y la intención del texto original y garantiza la precisión de los hechos sin introducir errores. Adaptarse a diferentes tipos de material de origen y propósitos de resumen supone un desafío adicional. DSPy le permite utilizar datos etiquetados para ajustar sus instrucciones de resumen para obtener las mejores respuestas posibles.