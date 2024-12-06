Retrieval-Augmented Generation (RAG) ist eine Architektur, die die Ausgabe eines großen Sprachmodells durch Referenzen aus einer maßgeblichen Wissensdatenbank optimiert. Dadurch werden die Trainingsdaten mit verifizierten Quellen ergänzt, bevor das Sprachmodell eine Antwort generiert. LLMs werden auf großen Korpussen trainiert und verwenden Milliarden von Parametern, um Ausgaben zu erzeugen, aber sie können möglicherweise nicht auf aktuelle oder genaue Informationen aus ihrem Trainingskorpus zugreifen. RAG erweitert die bereits leistungsstarken Fähigkeiten von LLMs auf einen bestimmten Bereich, ohne dass das Modell neu trainiert werden muss. Es ist eine leistungsfähige und potenziell kostenwirksame Möglichkeit, die Ausgaben von LLMs so zu verbessern, dass sie in verschiedenen Kontexten relevant, genau und nützlich bleiben.

In DSPy verwenden Sie eine RAG-Architektur, indem Sie einen Kontextschritt in der Signatur hinzufügen. In diesem Schritt wird der Kontext aus dem Abrufmodell erfasst und in der Prompt des Sprachmodells eingefügt, um hoffentlich eine bessere Antwort zu geben.

class GenerateAnswer(dspy.Signature):

“””Answer questions with short factoid answers.”””



context = dspy.InputField(desc=”may contain relevant facts”)

question = dspy.InputField()

answer = dspy.OutputField(desc=”often between 1 and 5 words”)

Diese newGenerateAnswer-Signatur kann mit Ihrem RAG-Modell verwendet werden. Sie übergeben die GenerateAnswer an das Modul „ChainOfThought“, sodass der abgerufene Kontext sowie Frage und Antwort einen ChainOfThought-Ansatz verwenden.

Sie aktualisieren auch die Vorwärtsmethode, um Kontextpassagen aus dem RAG zu generieren, und verwenden diese kontextbezogenen Passagen dann, um Antworten zu generieren. DSPy ruft diese Vorwärtsmethode jedes Mal auf, wenn es eine neue Antwort auf eine Frage generiert. Dabei sammelt es beide Kontexte aus dem ColBERT Wiki 17-Abstraktionsdatensatz und übergibt diesen Kontext dann an das Sprachmodell, in diesem Fall Llama 3.1. Wenn jede Antwort generiert wird, vergleicht DSPy die Ausgabe mit der gewünschten Ausgabe, um sicherzustellen, dass die Prompts dem Modell helfen, die richtigen Antworten zu generieren.

class RAG(dspy.Module):

def __init__(self, num_passages=3):

super().__init__()



self.retrieve = dspy.Retrieve(k=num_passages)

self.generate_answer = dspy.ChainOfThought(GenerateAnswer)



def forward(self, question):

context = self.retrieve(question).passages

prediction = self.generate_answer(context=context, question=question)

return dspy.Prediction(context=context, answer=prediction.answer)

Um DSPy dabei zu unterstützen, die besten Prompts für uns zu entwickeln, benötigen Sie einen Datensatz, mit dem es Prompts testen und dann bewerten kann.

Um DSPy-Testfragen zu stellen, laden Sie den HotPotQA-Datensatz. HotpotQA ist ein Datensatz zur Beantwortung von Fragen mit natürlichen Multi-Hop-Fragen, die mehrere Abrufe und Inferenzen erfordern, um die richtige Antwort zu finden. Es ist ein großartiges Tool, um zu testen, wie gut Modelle unterstützende Fakten generieren, um besser erklärbare Fragen-Antwort-Systeme zu trainieren und zu testen.

Eine Frage aus dem Datensatz lautet zum Beispiel: „Wen hat Präsident Franklin Roosevelt dazu ernannt, für die Übermittlung der Stimmen des Wahlgremiums für den Kongress verantwortlich zu sein?“ Sie können sehen, dass für diese Frage mehrere Informationen erforderlich sind, um sie richtig zu beantworten.

The answer is: “Robert Digges Wimberly Connor”.

Der unterstützende Kontext stammt von Wikipedia-Seiten über Robert Digges Wimberly Connor und über die National Archives and Records Administration.

HotPotQA wird von einem Team von NLP-Forschern an der Carnegie Mellon University, der Stanford University und der Universite de Montreal erfasst und veröffentlicht. Weitere Informationen zu HotPotQA finden Sie auf der GitHub-Website.

Nachdem Sie den Datensatz geladen haben, teilen Sie ihn in Trainings- und Testsätze auf. Auf diese Weise können Sie die Abrufkette testen und DSPy dabei helfen, die besten Prompts für das Sprachmodell zu finden.

# Load the dataset.

dataset = HotPotQA(train_seed=1, train_size=20, eval_seed=2023, dev_size=50, test_size=0)



# Tell DSPy that the ‘question’ field is the input. Any other fields are labels and/or metadata.

trainset = [x.with_inputs(‘question’) for x in dataset.train]

devset = [x.with_inputs(‘question’) for x in dataset.dev]

Als Nächstes führen Sie ein Bootstrapping weiterer Beispiele durch, um DSPy mehr Möglichkeiten zu geben, Prompts zu generieren und diese auszuwerten. Callingcompile nutzt die gesamte Architektur, die Sie konfiguriert haben, sowie den HotPotQA-Datensatz, um Prompts zu generieren, zu testen und die beste Leistung aus Ihrem Sprachmodell herauszuholen.

from dspy.teleprompt import BootstrapFewShot



# Validation logic: check that the predicted answer is correct.

# Also check that the retrieved context does actually contain that answer.

def validate_context_and_answer(example, pred, trace=None):

answer_EM = dspy.evaluate.answer_exact_match(example, pred)

answer_PM = dspy.evaluate.answer_passage_match(example, pred)

return answer_EM and answer_PM



# Set up a basic DSPy optimizer, which will compile your RAG program.

bfs_optimizer = BootstrapFewShot(metric=validate_context_and_answer)



# Compile!

compiled_rag = bfs_optimizer.compile(RAG(), trainset=trainset)

Nachdem DSPy nun das Prompt Engineering für Sie durchgeführt hat, können Sie es mit der benutzerdefinierten Frage zum November 2006 testen, die Sie zuvor verwendet haben. Da das Retrieval-Modell Wikipedia-Auszüge aus dem Jahr 2017 verwendet, funktioniert es am besten mit Wissen, das in diesem Korpus vorhanden sein könnte:

# Get the prediction. This contains `pred.context` and `pred.answer`.

pred = compiled_rag(test_question)



# Print the contexts and the answer.

print(f”Question: {test_question}”)

print(f”Predicted Answer: {pred.answer}”)

Jetzt erhalten Sie die richtige Antwort zurück.

Frage: Aus welchem Land ging der Gewinner des Literaturnobelpreises 2006 hervor und wie lautete sein Name? Prognostizierte Antwort: Türkei, Orhan Pamuk

Orhan Pamuk kommt aus der Türkei, daher ist diese Antwort richtig. Die kompilierte Version von DSPy hat die Antwort nicht nur richtig verstanden, sondern sie auch richtig formuliert und mit einer kurzen und klaren Aussage beantwortet. Sehen wir uns den Kontext für diese prognostizierte Antwort an, um zu sehen, wie das Modell zur richtigen Antwort gekommen ist:

pred.context

Dies liefert Folgendes:

[„Orhan Pamuk | Ferit Orhan Pamuk (allgemein bekannt als Orhan Pamuk; * 7. Juni 1952) ist ein türkischer Romanautor, Drehbuchautor, Akademiker und Gewinner des Literaturnobelpreises 2006. Als einer der bekanntesten Romanautoren der Türkei wurden mit seinem Werk über dreizehn Millionen Bücher in 63 Sprachen verkauft, was ihn zum meistverkauften Autor des Landes macht.“, „2006 Palanca Awards | Die Gewinner der Carlos Palanca Memorial Awards for Literature im Jahr 2006 (Rang, Titel des Gewinnerbeitrags, Name des Autors).“, „Miguel Donoso Pareja | Miguel Donoso Pareja (13. Juli 1931 – 16. März 2015) war ein ecuadorianischer Schauspieler und Gewinner des Premio Eugenio Espejo-Preises 2006 (Nationalpreis von Ecuador für Literatur, verliehen vom Präsidenten von Ecuador).“]

Die Antwort liegt im ersten Teil des zurückgegebenen Kontexts. Sie können sehen, wie DSPy optimale Prompts entwickelt hat, indem Sie sich die Historie des Sprachmodells mit der Methode inspect_history() des Sprachmodells ansehen.

lm.inspect_history()

Diese Historie ist sehr lang, da sie alle Beispiele aus dem Kompilierungsprozess enthält, bei dem DSPy seine generierten Prompts getestet hat. Der letzte Teil der Historie zeigt, wie das Modell zur richtigen Antwort im richtigen Format gelangt ist:

[[ ## Kontext ## ]] [1] «Orhan Pamuk | Ferit Orhan Pamuk (allgemein einfach als Orhan Pamuk bekannt; geboren am 7. Juni 1952) ist ein türkischer Romanautor, Drehbuchautor, Akademiker und Gewinner des Literaturnobelpreises 2006. Als einer der bekanntesten Romanautoren der Türkei wurden mit seinem Werk über dreizehn Millionen Bücher in 63 Sprachen verkauft, was ihn zum meistverkauften Autor des Landes macht. [2] «Palanca Awards 2006 | Die Gewinner der Carlos Palanca Memorial Awards for Literature im Jahr 2006 (Rang, Titel des Gewinnerbeitrags, Name des Autors).» [3] «Miguel Donoso Pareja | Miguel Donoso Pareja (13. Juli 1931 – 16. März 2015) war ein ecuadorianischer Schauspieler und Gewinner des Premio Eugenio Espejo-Preises 2006 (Nationalpreis von Ecuador für Literatur, verliehen vom Präsidenten von Ecuador).» [[ ## Frage ## ]] Aus welchem Land kam der Gewinner des Literaturnobelpreises 2006 und wie lautet sein Name? Antworten Sie mit den entsprechenden Ausgabefeldern, beginnend mit dem Feld „[[ ## Reasoning ## ]]“, dann mit „[[ ## Answer ## ]]“ und enden mit der Markierung für „[[ ## completed # # ]]“. [31mResponse:[0m [32m[[ ## Argumentation ## ]] Der Text erwähnt den Literaturnobelpreis 2006 und besagt, dass Orhan Pamuk, ein türkischer Romanautor, der Gewinner war. [[ ## Antwort ## ]] Türkei, Orhan Pamuk [[ ## abgeschlossen ## ]][0m

Sie können sehen, dass DSPy das Modell verwendet hat, um den Prompt zu generieren:

Antworten Sie mit den entsprechenden Ausgabefeldern, beginnend mit dem Feld [[ ## reasoning ## ]] , dann [[ ## answer ## ]] und endet dann mit dem Marker für [[ ## completed ## ]] .

Dies führt zur richtigen Antwort und Einordnung.