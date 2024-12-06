La génération augmentée par récupération (RAG) est une architecture qui optimise les sorties d’un grand modèle de langage en utilisant les références d’une base de connaissances faisant autorité. Les données d’apprentissage sont ainsi complétées par des sources vérifiées avant que le modèle de langage ne génère une réponse. Les LLM sont entraînés sur de grands corpus et utilisent des milliards de paramètres pour générer une sortie, mais ils ne sont pas toujours en mesure d’accéder à des informations à jour ou précises à partir de leurs corpus d’entraînement. La RAG étend les capacités déjà puissantes des LLM à un domaine donné, sans qu’ils soit nécessaire d’entraîner à nouveau le modèle. Il s’agit d’un moyen puissant et potentiellement rentable d’améliorer les sorties des LLM, afin qu’ils restent pertinents, précis et utiles dans divers contextes.

Dans DSPy, vous utilisez une architecture RAG en ajoutant une étape de contexte dans la signature. Cette étape rassemble le contexte du modèle de récupération et l’ajoute au prompt du modèle de langage afin d’obtenir une meilleure réponse.

class GenerateAnswer(dspy.Signature):

“””Answer questions with short factoid answers.”””



context = dspy.InputField(desc=”may contain relevant facts”)

question = dspy.InputField()

answer = dspy.OutputField(desc=”often between 1 and 5 words”)

Cette signature newGenerateAnswer peut être utilisée avec votre modèle RAG. Vous transmettez la GenerateAnswer au module « ChainOfThought » afin que le contexte récupéré ainsi que la question et la réponse utilisent une approche Chain of Thought.

Vous mettez également à jour la méthode forward afin de générer des passages contextuels à partir de la RAG et de les utiliser pour générer des réponses. DSPy appellera cette méthode « forward » chaque fois qu’il générera une réponse à une question, en recueillant le contexte du jeu de données ColBERT-Wiki 17 et en le transmettant au modèle de langage (dans ce cas, Llama 3.1). À mesure que chaque réponse est générée, DSPy compare la sortie à la sortie souhaitée pour s’assurer que les prompts aident le modèle à générer la bonne réponse.

class RAG(dspy.Module):

def __init__(self, num_passages=3):

super().__init__()



self.retrieve = dspy.Retrieve(k=num_passages)

self.generate_answer = dspy.ChainOfThought(GenerateAnswer)



def forward(self, question):

context = self.retrieve(question).passages

prediction = self.generate_answer(context=context, question=question)

return dspy.Prediction(context=context, answer=prediction.answer)

Pour aider DSPy à concevoir les meilleurs prompts, vous avez besoin d’un jeu de données de test qu’il pourra utiliser pour tester les prompts, puis les évaluer.

Pour donner des questions de test à DSPy, vous chargerez le jeu de données HotPotQA. HotpotQA est un jeu de données question-réponse en langage naturel multi-sauts qui nécessite plusieurs récupérations et inférences pour arriver à la bonne réponse. Il s’agit d’un excellent outil pour tester la capacité des modèles à générer des faits justificatifs, afin d’entraîner et de tester des systèmes de type question-réponse plus explicables.

Voici un exemple de question tiré du jeu de données : « Qui le président Franklin Roosevelt a-t-il nommé pour transmettre les votes du collège électoral au Congrès ? » Vous pouvez constater que cette question demande plusieurs éléments d’information pour y répondre correctement.

The answer is: “Robert Digges Wimberly Connor”.

Le contexte à l’appui provient des pages Wikipédia sur Robert Digges Wimberly Connor et sur la National Archives and Records Administration.

HotPotQA est recueilli et publié par une équipe de chercheurs en TAL de l’Université Carnegie Mellon, de l’Université de Stanford et de l’Université de Montréal. Plus d’informations sur HotPotQA sont disponibles sur leur site GitHub.

Après avoir chargé le jeu de données, divisez-le en ensembles d’entraînement et de test. Cela vous permet de tester la chaîne de récupération et d’aider DSPy à localiser les meilleurs prompts pour le modèle de langage.

# Load the dataset.

dataset = HotPotQA(train_seed=1, train_size=20, eval_seed=2023, dev_size=50, test_size=0)



# Tell DSPy that the ‘question’ field is the input. Any other fields are labels and/or metadata.

trainset = [x.with_inputs(‘question’) for x in dataset.train]

devset = [x.with_inputs(‘question’) for x in dataset.dev]

Ensuite, vous allez amorcer plus d’exemples pour permettre à DSPy de générer des prompts et de les évaluer. Callingcompile utilise toute l’architecture que vous avez configurée, ainsi que le jeu de données HotPotQA, pour générer et tester les prompts et obtenir la meilleure performance de votre modèle de langage.

from dspy.teleprompt import BootstrapFewShot



# Validation logic: check that the predicted answer is correct.

# Also check that the retrieved context does actually contain that answer.

def validate_context_and_answer(example, pred, trace=None):

answer_EM = dspy.evaluate.answer_exact_match(example, pred)

answer_PM = dspy.evaluate.answer_passage_match(example, pred)

return answer_EM and answer_PM



# Set up a basic DSPy optimizer, which will compile your RAG program.

bfs_optimizer = BootstrapFewShot(metric=validate_context_and_answer)



# Compile!

compiled_rag = bfs_optimizer.compile(RAG(), trainset=trainset)

Maintenant que DSPy s’est chargé du prompt engineering, vous allez le tester avec la question personnalisée sur le prix Nobel 2006 que vous avez utilisée auparavant. Comme le modèle de recherche utilise des extraits de Wikipédia datant de 2017, il fonctionnera au mieux avec les connaissances susceptibles de figurer dans ce corpus :

# Get the prediction. This contains `pred.context` and `pred.answer`.

pred = compiled_rag(test_question)



# Print the contexts and the answer.

print(f”Question: {test_question}”)

print(f”Predicted Answer: {pred.answer}”)

Vous avez maintenant la bonne réponse.

Question : De quel pays est originaire le lauréat du prix Nobel de littérature en 2006, et quel est son nom ? Réponse prédite : Turquie, Orhan Pamuk

Orhan Pamuk est originaire de Turquie, cette réponse est donc correcte. La version compilée de DSPy a non seulement trouvé la bonne réponse, mais l’a également formulée correctement : une réponse claire et concise. Examinons le contexte de cette réponse prédite pour voir comment le modèle est parvenu à la bonne réponse :

pred.context

Cela renvoie :

[« Orhan Pamuk | Ferit Orhan Pamuk (connu sous le nom d’Orhan Pamuk, né le 7 juin 1952) est un romancier, scénariste et universitaire turc, lauréat du prix Nobel de littérature en 2006. L’un des romanciers les plus en vue de Turquie, son œuvre s’est vendue à plus de treize millions d’exemplaires dans soixante-trois langues, ce qui fait de lui l’écrivain le plus vendu du pays. », « Prix Palanca 2006 | Les lauréats des Carlos Palanca Memorial Awards for Literature en 2006 (classement, titre de l’ouvrage récompensé, nom de l’auteur). », « Miguel Donoso Pareja | Miguel Donoso Pareja (13 juillet 1931 — 16 mars 2015) était un écrivain équatorien qui a remporté le Premio Eugenio Espejo en 2006 (prix national de littérature décerné par le président de l’Équateur). »]

La réponse se trouve dans le premier élément de contexte renvoyé. Comme vous le voyez, DSPy a conçu des prompts optimaux en examinant l’historique du modèle de langage à l’aide de la méthode inspect_history() du modèle de langage.

lm.inspect_history()

Cet historique est très long, car il comprend tous les exemples du processus de compilation lors duquel DSPy a testé les prompts générés. La dernière partie de l’historique montre comment le modèle est parvenu à la bonne réponse et au bon format :

[[ ## context ## ]] [1] « Orhan Pamuk | Ferit Orhan Pamuk (connu sous le nom d’Orhan Pamuk, né le 7 juin 1952) est un romancier, scénariste et universitaire turc, lauréat du prix Nobel de littérature en 2006. L’un des romanciers les plus en vue de Turquie, son œuvre s’est vendue à plus de treize millions d’exemplaires dans soixante-trois langues, ce qui fait de lui l’écrivain le plus vendu du pays. » [2] « Prix Palanca 2006 | Les lauréats des Carlos Palanca Memorial Awards for Literature en 2006 (classement, titre de l’ouvrage récompensé, nom de l’auteur). » [3] « Miguel Donoso Pareja | Miguel Donoso Pareja (13 juillet 1931 — 16 mars 2015) était un écrivain équatorien qui a remporté le Premio Eugenio Espejo en 2006 (prix national de littérature décerné par le président de l’Équateur). »] [[ ## question ## ]] De quel pays est originaire le lauréat du prix Nobel de littérature 2006, et quel est son nom ? Répondez avec les champs de sortie correspondants, en commençant par le champ `[[ ## reasoning ## ]]`, puis `[[ ## answer ## ]]`, puis en terminant par le marqueur pour `[[ ## completed ## ]]`. [31mResponse:[0m [32m[[ ## reasoning ## ]] Le texte mentionne le prix Nobel de littérature 2006 et précise qu’Orhan Pamuk, romancier turc, en est le lauréat. [[ ## answer ## ]] Turquie, Orhan Pamuk [[ ## completed ## ]][0m

Comme vous pouvez le constater, DSPy a utilisé le modèle pour générer le prompt :

Répondre avec les champs de sortie correspondants, en commençant par le champ [[ ## reasoning ## ]] , puis [[ ## answer ## ]] , puis en terminant par le marqueur pour [[ ## completed ## ]] .

Cela permet d’obtenir la réponse et le cadrage corrects.