RAGアクセラレーターとのQ&A
「RAG Accelerator」サンプルプロジェクトのQ&A機能を試して、提供されたドキュメントの情報に基づいた、事実に即した正確な出力を生成する「 検索拡張生成 (RAG)」を設定してみてください。
アクセラレータの入手と実行
クライアントチームに、アクセラレータのサンプルプロジェクトのアーカイブファイルのコピーを依頼してください。
必須サービス
RAG Accelerator を使用して Q&A を実行するには、以下のサービスが必要です:
- watsonx.ai
- watsonx.data
アクセルを踏む
アクセラレータを実行するには、プロジェクトの概要ページにある「Readme」を開き、指示に従ってください。
RAGアクセラレーターとのQ&Aの新着情報
RAG Acceleratorに関するQ&Aは、 watsonx の製品リリースとは別に更新されます。 定期的にアップデートを確認する。
バージョン 2.2.2 2026年2月
このリリースには以下のアップデートが含まれています:
:ナレッジカバレッジ分析レポートにより、ナレッジ所有者がコンテンツの改善や拡充が必要なトピックを迅速に特定できるよう支援します。
コンテンツ内の階層的関係性を可視化するタクソノミー生成と表示機能
分析、ダッシュボード、検索評価をテストするための合成ログレコードとクエリーフィードバックデータを生成する合成ログデータ生成ノートブック。 ノートブックは、生成されたレコードを含む CSV テストファイルをエクスポートします。このファイルをユーザーフィードバック分析ノートブックに入力できます。
バージョン 2.2、2025年12月
このリリースには以下のアップデートが含まれています:
- 新しいベクターデータベースオプション: OpenSearch ベクターデータベース(プライベートプレビュー)
- メトリックノートブックが watsonx.governance と連携しました
- 回答生成の入力コンテキストとして、独自のベクターデータベース検索を提供してください
バージョン 2.1 2025年11月
このリリースには以下のアップデートが含まれています:
- 新しいベクトルデータベースオプション DataStax ハイパーコンバージド・データベース
- PDFに加え、以下のドキュメントファイル形式オプションも利用可能です:HTML、MD、 DOCX、およびPPTX
- 文書ファイルの一括取り込み
- ユーザーフィードバックチャートをHTMLとしてエクスポートしてインサイトを共有
- パフォーマンス向上
- 統合先 watsonx.data Premium :回答生成機能は、検索 watsonx.data Premium APIを使用して Milvuswatsonx.data のベクトル検索を実行できます。
概要
RAGアクセラレータとのQ&Aでは、高度なRAGパターンと実装を提供しており、次のプロセスを含みます
- 文書処理 :ベクトルインデックスを生成するための文書の変換、処理、インデックス作成。
- ユーザーとの対話: UIベースのチャットボットアプリケーションにおけるユーザーとの会話。
- 回答生成: ベクトル検索結果に基づくRAG(参照支援型質問応答)による質問応答、または文書 watsonx.data Premium 検索APIを用いた回答生成。
- 入出力のログ :質問、取得されたチャンクおよびメタデータ、回答のログを2番目のログインデックスに記録する。
- ユーザーフィードバックの収集 :ユーザーフィードバックは、一致する入力/出力ログエントリに追加されます。
- コンテンツ分析: 否定的なユーザーフィードバックを受けた回答を改善するために強化すべき特定のコンテンツに関するレポート。
- 知識カバレッジの分析: より充実した内容や拡充が必要なトピックに関するレポート。
- 分類体系の生成と可視化 :コンテンツ内の階層的関係を可視化したもの。
- 人的介入 :専門家プロフィールを含むベクトルインデックスを使用して、不十分な回答に対応する最適な専門家を特定する。
以下の図は、RAGアクセラレーターとの質疑応答のプロセスをまとめたものである。
文書処理
文書処理およびインデックス作成用のノートブックは、以下のベクターデータベースのいずれかにおいて、文書変換、分割、ベクターインデックスのインデックス作成を自動化します
- watsonx エラスティック・サーチでディスカバリー。
- DataStax ハイパーコンバージド・データベース
- watsonx.data Milvus
ベクトル化するサンプル文書コレクションは、ZIPファイルの watsonx as a Service セットのバージョンです。 あるいは、ドキュメントを含む AWS S3 バケットに接続することもできます。
ノートブックをカスタマイズして、 watsonx の外部で作成した既存のベクターインデックスを他のツール、例えば Elastic コネクタやパイプライン、Spark パイプライン、または独自のプロセスで実行することができます。
ユーザーとの対話
サンプルチャットボットアプリケーションは、以下のようなタイプのインタラクションを含むことができる会話のためのUIを提供します:
- ユーザーからの質問
- 生成された回答と参照リンクが返される
- ユーザーが回答についてフィードバック
- ユーザーからの否定的なフィードバックに専門家がより良い回答を提供
以下のサンプル・チャットボット・アプリケーションをお試しください:
- watsonx Orchestrate AIアシスタント
- ストリームリット・アプリケーション
回答の生成
Q&A Python 関数用のノートブックは、 Python 関数コードを定義し、 デプロイメント・スペース明確に定義された URL 接尾辞でそのデプロイメント自動化する。 RAG Python 機能コードのQ&Aは、パラメータセットによって構成されます。 この関数は質問を入力として受け取り、質問に答えるのに最も関連性の高いチャンクを取得するためにベクトルインデックスを照会し、ソース文書へのリンクを含むチャンクのメタデータを取得します。 この関数は、最も関連性の高いチャンクを構成済みのプロンプトテンプレートに追加し、生成された回答、計算された忠実度スコア、およびメタデータとともに取得されたチャンクを返します。 ドキュメントを に保存すると watsonx.data Premium、回答生成機能は Retrieval API を使用して watsonx.dataMilvus に対する watsonx.data Premium ベクトル検索を実行できます。
入出力のログ記録
RAG Python 機能を使用した Q&A の呼び出しごとに、プロンプトの入力および出力テキストのログ取得を有効にすることができます。 ログ記録の前に、すべての個人情報は文字列から削除されます。 ベクトルデータベース内のドキュメントのログインデックスは、ベクトルインデックスとは別個です。
入出力のログ記録が有効になっている場合、ユーザーが質問を入力する際に、入力候補の質問補完機能を有効にすることができます。 ユーザーが最近回答した質問に基づいて完了を受け入れた場合、その回答はログインデックスから取得され、時間とGPUによる推論および取得コストが削減されます。
ユーザーフィードバックの収集
ユーザーからのフィードバックは、利害関係者がそのソリューションがユーザーにどの程度役立っているか、ユーザーがどのトピックに関心を持っているか、また、ソリューションがコンテンツに基づく質問にどの程度適切に回答できているかを理解するのに役立ちます。 回答に対するユーザーからのフィードバックを収集するために、RAG Python 機能を使用してQ&Aを再度呼び出すようアプリケーションを設定することができます。 満足度スコアと任意のコメントというユーザーからのフィードバックは、その後の分析用にQ&Aログレコードに追加されます。
ソリューションをテストするには、Synthetic Log Data Generator ノートブックを実行して、合成ログレコードとユーザーフィードバックデータを生成できます。 ノートブックは、生成されたレコードを含む CSV テストファイルをエクスポートします。 生成されたレコードを使用して、ユーザーフィードバック分析ノートブックで分析、ダッシュボード、および検索評価をテストできます。
コンテンツ分析
ユーザーフィードバック分析ノートブックを設定し、直接実行するか、 ジョブ実行することができます。 ノートブックは、指定した時間間隔または開始日と終了日のログデータを照会します。 ノートブックはログデータをデータフレームに読み込み、BERTopic、 Watson 自然言語処理、または Top2Vec 該当手法による教師なしトピック検出を用いて、どの文書トピックが最も頻繁に抽出されたかを判断し、回答を生成します。 このノートブックは、トピックごとにユーザー満足度を分析し、可視化します。また、評価の低い回答に対する質問、回答、ユーザーからのフィードバックコメントも含まれています。 これらの洞察に基づいて、利害関係者や知識コンテンツの所有者は、より良い回答につながるコンテンツの改善を推進することができます。 ノートブックからコンテンツインサイトチャートをHTML形式でエクスポートできます。
ナレッジカバレッジレポート(技術プレビュー)
ナレッジカバレッジ分析レポートを実行することで、より充実した内容や追加が必要なトピックを特定できます。
本レポートは次の処理を実行します:
- テストデータ、RAGログインデックス、コーパスインデックス( OpenSearch または Watson Discovery )から参照質問をコンパイルします。 ユーザーフィードバックデータは不要です。
- コーパスがユーザーの質問にどれだけ適切に回答しているかを評価し、改善が必要なコンテンツを特定します。
- 自動検出されたトピック、トピックの人気度、および知識ギャップ分析に関する情報を返します。
分類体系の生成と可視化(技術プレビュー)
タクソノミーの生成と可視化を実行して、コンテンツ内の階層的な関係を確認できます:
分類体系の生成は、文書コーパスから主要なテーマを自動的に識別・抽出後、親子関係による明確な階層的分類体系として整理します。 分類体系は、構造化されていないコンテンツから構造化された知識をいかに導き出せるかを示す。
分類体系の可視化は、分類構造を容易に探索できるインタラクティブな可視化を生成し、基盤となる文書コーパスを体系的かつ直感的に把握できる視覚的表現を提供する。
人的介入
ユーザーが回答に満足していない場合、より適切な回答を提供できる専門家の連絡先を取得するようにアプリケーションを設定することができます。 エキスパートプロファイリングノートブックを設定して、エキスパートプロファイル文書を処理し、その情報に基づいてインデックスを構築することができます。 例えば、アプリケーションは質問をエキスパートに転送し、エキスパートの回答をユーザーに送信し、コンテンツの改善の可能性についてナレッジベースの所有者に警告することができます。