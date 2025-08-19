policy_context_keywordsのパラメータの最初のパスでは、Tavilyの検索を絞り込むために、保険契約から特定の用語（例えば、その名前、保険会社）を追加することができます。

MIN_CONTEXT_LENGTHは、検索されるコンテキストの最小許容長を定義します。

SIMILARITY_THRESHOLDは、チャンクが「良い」とみなされるための最小関連性スコアを定義します。

def corrective_rag(...)は、修正RAGワークフロー全体を調整するメイン関数を定義します。

corrective_rag関数は、関連するコンテキストを収集するためのretrieved_context_piecesを作成することから始まります。まず、クエリに基づいてPDFベクトル・ストアからchunks_from_vectorstoreを取得してスコア付けし、次にstorage_chunks_vectorが言語モデルを使用してその関連性を評価します。SIMILARITY_THRESHOLDを満たすgood_chunks_vectorのみが保持されます。current_contextは、これらの断片からコンパイルされます。

current_contextがMIN_CONTEXT_LENGTHを下回っている場合、システムはWeb検索を試みます。tavily_search_queryを構築し、policy_context_keywordsを組み込む可能性があります。直接検索(tavily_context_direct)が実行されます。重要なのは、Verify_promptが作成され、LLMに送信され、Web検索結果（is_relevant_source）がパブリック・プログラムではなくプライベート・ポリシーからのものであるかどうかを判断することです。そうである場合、コンテキストが追加されます。

コンテキストが不十分な場合、システムはクエリを書き直す準備をします。rewrite_promptを使用してLLMからimproved_queryを取得し、2回目のWeb検索(tavily_context_rewritten)を実行します。この新しいコンテキストも、同じソース検証を受けます。

len(current_context.strip()) == 0が最後のチェックです。すべての試行後に関連するコンテキストが見つからない場合は、事前定義された拒否メッセージが返されます。それ以外の場合は、検証済みのすべてのコンテキストを使用してfinal_promptを作成し、言語モデルに送信して最終的な回答を生成します。

全体のCollective_rag関数は、修正RAGの段階的な取得、スコアリング、検証機能を詳細に処理します。これにより、知識ベースと知識ストリームを常に更新できるようになり、堅牢で状況に応じた回答が得られるというメリットがもたらされます。