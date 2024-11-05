DSPyの使用は、pip install dspy-aiを呼び出すだけで簡単に使用できます。ほとんどのモデルはAPIを通じてクラウドで使用するか、ローカルで実行できるため、特別なハードウェアは必要ありません。ローカルで実行することも、Google ColabやWatson Studioなどのホストされたノートブック環境で実行することもできます。

検索拡張生成のための典型的なDSPyパイプラインは、言語モデルと検索モデルで構成されています。例えば、OpenAI GPT-3.5 Turboを言語モデルとして、ColBERTV2リトリーバーを検索モデルとして動作させるには、DSPyを次のように設定します。

import dspy

turbo = dspy.OpenAI(model=’gpt-3.5-turbo’)

colbertv2_wiki17_abstracts = dspy.ColBERTv2(url=’http://20.102.90.50:2017/wiki17_abstracts’)

# set the language model and the retrieval model

dspy.settings.configure(lm=turbo, rm=colbertv2_wiki17_abstracts)

署名の構築

署名は、言語モデルと検索モデルのインプットとアウトプットフィールドをどのように構造化できるかを構成できるテンプレートです。例えば、次のコード・スニペットは、コンテキストを備えた言語モデルと、構造を備えた検索モデルをプロンプトする構文を示しています。

class GenerateAnswer(dspy.Signature):

“””Answer questions with short factoid answers.”””

context = dspy.InputField(desc=”may contain relevant facts”)

question = dspy.InputField()

answer = dspy.OutputField(desc=”often between 1 and 5 words”)

モデルが受け取るもの、生成するべきものに関するより堅固なガイドラインを定義するために、コンテキストと回答フィールドの簡単な説明を含めています。

コンパイル

署名を定義したら、プログラムを実行し、タスクに適切なオプティマイザーを使用して、タスクに最適なプロンプトを作成できます。DSPyで。このプロセスはコンパイルと呼ばれます。プログラムをコンパイルすると、各モジュールに保存されているパラメーターが更新されます。ほとんどのシナリオでは、これは主にプロンプト内に含める優れたデモンストレーションを収集して選択するという形で行われます。

コンパイルには次のものが必要です。

• トレーニングセットまたはブートストラップされたサンプル。

• 検証のためのメトリクス。RAGシナリオでは、これは、予測された回答の精度と、取得されたコンテキストにその回答が含まれているかどうかを測定する方法です。

• テスト対象のプロンプトを生成する特定のオプティマイザー。例えば、BootstrapFewShotオプティマイザーはプロンプトを生成し、その生成されたプロンプトをテストするために使用できます。

DSPyプログラムをコンパイルするには、使用するモデルを設定し、それらを選択したオプティマイザーのコンパイル・メソッドに渡します。例えば、RAGアプリケーションのプログラムには、言語モデルと検索モデルが含まれます。次に、これらはコンパイル・メソッドに渡され、オプティマイザーは取得したデータを使用して言語生成のコンテキストを設定します。

次に、検索モデルと言語モデルの両方を評価するためのメトリクスを定義します。そのメトリクス定義は、BootstrapFewShotやLabeledFewShotオプティマイザーなどのオプティマイザーに与えられ、言語モデルによって生成されたプロンプトを評価する際に使用されます。最後に、オプティマイザーは、トレーニングデータセットとともに定義したforwardメソッドを含むカスタムモジュールをコンパイルします。

使用するオプティマイザーを選択するには通常、実験が必要ですが、ガイドラインがあります。

• サンプルが非常に少ない場合（約10個）は、BootstrapFewShotから始めて、新しいトレーニングデータを生成することができます。

• 例えば50個以上のサンプルなど、より多くのデータがある場合は、BootstrapFewShotWithRandomSearchを使用して、トレーニングデータのランダムな部分に新しいトレーニングデータを生成してください。

• 非常に効率的なプログラムが必要な場合は、BootstrappingFinetuneを使用してタスクに合わせて小規模なLLMをファイン・チューニングできます。

評価と反復

プログラムをコンパイルしてメトリクスを比較した後は、成果に満足しているかもしれません。また、選択したメトリクスに従って、最終的なプログラムや成果の何かが気に入らないという点があることもあるでしょう。反復的な開発が鍵となります。DSPyでは、データの反復処理、プログラム構造、選択したメトリクス、選択したオプティマイザーの更新を通じて段階的に行うためのツールを提供します。