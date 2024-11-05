DSPy peut être utile dans plusieurs types de workflows et de scénarios différents. Les plus couramment utilisés incluent la génération augmentée de récupération, la réponse aux questions à sauts multiples et la synthèse de documents.

Chaîne de pensée

Le prompting par chaîne de pensée (CoT) simule des processus de raisonnement humains en demandant au modèle de décomposer des tâches complexes en une séquence d’étapes logiques menant à une résolution finale. Ces étapes de raisonnement sont intégrées dans la fenêtre contextuelle du modèle, ce qui lui permet de mieux s’ancrer dans la tâche à accomplir et conduit souvent à de meilleures réponses, même dans des scénarios complexes. DSPy aide en demandant au modèle de langage de générer des prompts et des stratégies de chaîne de pensée et en les testant avec le modèle de langage afin de générer les prompts CoT les plus efficaces pour le modèle donné.

Génération augmentée de récupération

La génération augmentée de récupération (RAG) est une approche qui permet aux LLM d’exploiter un vaste corpus de connaissances provenant de différentes sources et d’interroger leur base de connaissances afin de trouver des passages ou des contenus pertinents et de produire une réponse bien affinée. Le RAG garantit que les LLM peuvent exploiter de manière dynamique des connaissances en temps réel, même s’ils n’ont pas été initialement entraînés sur le sujet, et donner des réponses correctes. Cette puissance supplémentaire entraîne une plus grande complexité lors de la mise en place des pipelines RAG. DSPy offre une approche transparente pour mettre en place des pipelines de prompting et soit générer des prompts efficaces (via l’optimisation), soit, dans le cas de modèles plus petits, affiner les pondérations du modèle lui-même.

Les pipelines RAG peuvent être optimisés avec DSPy de deux manières : à l’aide d’exemples étiquetés ou d’exemples d’amorçage. Les exemples étiquetés sont simplement des exemples préexistants, étiquetés manuellement et employés pour entraîner directement le modèle élève. Dans le contexte de DSPy, les amorçages consistent à utiliser un mode de langage dans un paradigme enseignant-élève. L’enseignant génère de nouveaux exemples d’entraînement à partir de quelques prompts fournies par l’utilisateur. Ces exemples amorcés sont ensuite employés en complément ou à la place des exemples étiquetés manuellement pour entraîner le module élève jusqu’à ce qu’il fournisse les bonnes réponses. Les prompts qui génèrent les bonnes réponses sont ensuite mis à jour de manière itérative tout au long du pipeline DSPy.

Réponse aux questions à sauts multiples

Une seule requête de recherche ne suffit souvent pas pour une tâche complexe de réponse aux questions. Le célèbre jeu de données HotPot Question Answering comprend des questions qui nécessitent plusieurs analyses et récupérations avant de pouvoir y répondre. Par exemple : « En quelle année Bill Nelson a-t-il volé pour la première fois en tant que spécialiste de charge utile à bord d’une navette spatiale ? » Pour répondre à cette question, il faut savoir que Bill Nelson a volé à bord de la navette spatiale Columbia, puis déterminer que celle-ci a volé pour la première fois en 1981.

L’approche standard pour relever ce défi dans la littérature augmentée par récupération consiste à créer un système de recherche à sauts multiples. Ces systèmes lisent les résultats récupérés, puis génèrent des requêtes supplémentaires pour recueillir des informations complémentaires si nécessaire avant de parvenir à une réponse finale. Grâce à DSPy, vous pouvez créer le même système en quelques lignes de code de manière robuste, ce qui vous permet de mettre à jour les modèles et d’exécuter à nouveau votre pipeline.

Synthèse

La synthèse condense un texte long en une version plus courte tout en conservant les informations clés et les idées principales. C’est une compétence puissante pour un LLM, avec des applications allant de la création de résumés d’articles à la génération de rapports concis à partir de documents longs.

L’évaluation de la qualité des résumés produits par les modèles de langage présente des défis importants. Contrairement aux tâches pour lesquelles les réponses sont clairement bonnes ou mauvaises, la qualité de la synthèse est souvent subjective et dépend du contexte. Le modèle doit trouver un équilibre entre la conservation des informations et la concision, tout en préservant le ton et l’intention du texte original et en garantissant l’exactitude des faits sans introduire d’erreurs. L’adaptation à différents types de sources et à différents objectifs de résumé représente un défi supplémentaire. DSPy vous permet d’exploiter des données étiquetées pour affiner vos prompts de résumé afin d’obtenir les meilleures réponses possibles.