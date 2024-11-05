DSPy kann bei verschiedenen Arten von Workflows und Szenarien hilfreich sein. Einige der am häufigsten verwendeten sind die Generierung mit erweitertem Abruf, die Beantwortung von Multihop-Fragen und die Zusammenfassung von Dokumenten.

Gedankenkette

Das Chain of Thought (CoT)-Prompting simuliert menschenähnliche Denkprozesse, indem das Modell aufgefordert wird, komplexe Aufgaben in eine Abfolge logischer Schritte zu einer endgültigen Lösung zu zerlegen. Diese Argumentationsschritte werden in das Kontextfenster des Modells eingespeist und geben ihm einen besseren Einblick in die jeweilige Aufgabe. Oft führen sie selbst in komplexen Szenarien zu besseren Antworten. DSPy hilft dabei, indem es das Sprachmodell eine Kette von Denkaufforderungen und Strategien generieren lässt und diese mit dem Sprachmodell testet, um die effektivsten CoT-Prompts für das gegebene Modell zu generieren.

Retrieval-Augmented Generation

Retrieval-Augmented Generation (RAG) ist ein Ansatz, der es LLMs ermöglicht, auf einen großen Wissenskorpus aus Quellen zuzugreifen und seinen Wissensspeicher abzufragen, um relevante Passagen oder Inhalte zu finden und eine gut verfeinerte Antwort zu geben. Die RAG stellt sicher, dass LLMs Echtzeitwissen auch dann dynamisch nutzen können, wenn sie ursprünglich nicht auf dem Gebiet geschult wurden, und korrekte Antworten geben können. Diese zusätzliche Leistung führt zu einer größeren Komplexität bei der Einrichtung von RAG-Pipelines. DSPy bietet einen nahtlosen Ansatz für die Einrichtung von Prompting-Pipelines und entweder zur Generierung effektiver Prompts (Prompt-Tuning) oder bei kleineren Modellen zur Feinabstimmung der Modellgewichtungen selbst.

RAG-Pipelines können mit DSPy auf zwei Arten optimiert werden: mithilfe von gekennzeichneten Beispielen oder mithilfe von Bootstrap-Beispielen. Beschriftete Beispiele sind einfach bereits vorhanden, manuell beschriftete Beispiele werden für das direkte Training des Schülermodells verwendet. Bootstrapping im DSPy-Kontext bedeutet die Verwendung eines Sprachmodus in einem Lehrer- und Schülerparadigma. Der Lehrer generiert neue Trainingsbeispiele auf der Grundlage einiger weniger Prompts. Diese Bootstrapping-Beispiele werden dann zusammen oder anstelle der manuell beschrifteten Beispiele verwendet, um das Schülermodul so lange zu schulen, bis es die richtigen Antworten liefert. Die Prompts, die richtigen Antworten generieren, werden dann in der gesamten DSPy-Pipeline iterativ aktualisiert.

Multihop-Fragebeantwortung

Für eine komplexe Frage-und-Antwort-Aufgabe reicht eine einzelne Suchanfrage oft nicht aus. Der beliebte HotPot Question Answering-Datensatz besteht aus Fragen, die mehrere Analyse- und Abfrageoperationen erfordern, bevor sie beantwortet werden können. Zum Beispiel: „In welchem Jahr flog Bill Nelson als Nutzlastspezialist mit einem Space Shuttle, das zum ersten Mal gestartet wurde?“ Um diese Antwort zu erhalten, muss man wissen, dass Bill Nelson mit dem Space Shuttle Columbia geflogen ist, und dann feststellen können, dass die Columbia 1981 zum ersten Mal geflogen ist.

Der Standardansatz für diese Herausforderung in der Retrieval-Augmented-Literatur ist der Aufbau eines Multihop-Suchsystems. Diese Systeme lesen die abgerufenen Ergebnisse und generieren dann zusätzliche Abfragen, um bei Bedarf zusätzliche Informationen zu sammeln, bevor sie zu einer endgültigen Antwort gelangen. Mit DSPy können Sie dasselbe System in wenigen Codezeilen auf robuste Weise erstellen, sodass Sie Modelle aktualisieren und Ihre Pipeline einfach erneut ausführen können.

Zusammenfassung

Bei der Zusammenfassung wird ein längerer Textabschnitt zu einer kürzeren Version verdichtet, wobei die wichtigsten Informationen und Hauptgedanken erhalten bleiben. Für ein LLM ist es eine wichtige Fähigkeit, die sich in vielen Bereichen einsetzen lässt, beispielsweise beim Verfassen von Artikelzusammenfassungen oder beim Erstellen prägnanter Berichte aus umfangreichen Dokumenten.

Die Bewertung der Qualität von Zusammenfassungen, die von Sprachmodellen erstellt wurden, wirft eine große Herausforderung auf. Im Gegensatz zu Aufgaben mit eindeutigen richtigen oder falschen Antworten ist die Qualität der Zusammenfassung oft subjektiv und kontextabhängig. Das Modell muss ein Gleichgewicht zwischen Informationsspeicherung und Präzision herstellen und dabei den Ton und die Absicht des Originaltexts beibehalten und die sachliche Genauigkeit ohne Fehler gewährleisten. Die Anpassung an verschiedene Arten von Quellenmaterial und Zusammenfassungszwecke stellt eine zusätzliche Herausforderung dar. DSPy ermöglicht es Ihnen, gelabelte Daten zu verwenden, um Ihre Zusammenfassungs-Prompts abzustimmen, damit Sie die bestmöglichen Antworten erhalten.