知識ベースを検索に最適化する

知識ベースのコンテンツを、RAG(retrieval-augmented generation)パターンで生成AIモデルによりアクセスしやすいように適応させることができる。 コンテンツをジェネレーティブAIに適応させることで、コンテンツから生成されるAIの回答の質を向上させることができる。 コンテンツとRAGソリューションによっては、ツールの制限を補ったり、ある種の処理の必要性をなくしたりすることができる。

RAGソリューションでコンテンツをテストし、ガイドラインを作成することで、ナレッジベースのコンテンツを適応させることができます。

AIに対してコンテンツを準備するためのプロアクティブ・ガイドラインと、AIからの不適切な回答に対してコンテンツを修復するためのリアクティブ・ガイドラインを作成することができる。 以下の表は、コンテンツを準備または修復するためのガイドラインの作成と実装の違いをまとめたものです。

AI手法へのコンテンツ適応の比較
ガイドラインの目的 ガイドラインの作成方法 コンテンツ更新の範囲 コンテンツ更新のタイミング
AI用コンテンツの準備 RAGソリューションでコンテンツをテストする。 - すべての既存コンテンツまたは重要コンテンツ
- すべての新規コンテンツ
- RAG ソリューションを本番稼動させる前に
- 新規コンテンツのオーサリング中
AIのためにコンテンツを修復する RAGソリューションに関するユーザーフィードバックの収集 - 特定のトピックまたは文章
- 類似のトピックまたは文章
AIの回答に対する否定的なユーザーフィードバックを受け取った後
重要なことファンデーションモデルは常に改良されている。 今日作ったガイドラインは、将来必要なくなるかもしれない。 RAGソリューションの更新後にガイドラインを再テストする。

コンテンツをAIに対応させるためのガイドラインの作成

コンテンツをAIに対応させるためのガイドラインを作成し、適用することで、人間とAIの両方に対してコンテンツの質を向上させることができます。

ガイドラインを作成するには、生成AIを使ってコンテンツをテストする。 知識ベースを消費するRAGソリューションでテストすることで、最も正確な結果が得られます。 最終的なRAGソリューションとは異なるシステムでコンテンツをテストした場合、結果が異なる可能性があり、再テストしてガイドラインを調整する必要があるかもしれません。

AI用にコンテンツを準備するためのガイドラインを作成すること:

  1. 代表的な質問と、その質問に答えるトピックを集める。 最良の結果を得るためには、ユーザーからの質問を推測するのではなく、ユーザーからの質問を収集することです。 顧客からの質問は、RAGソリューションによって検索される可能性が最も高いコンテンツをターゲットにするのに役立ちます。 すべてのコンテンツ、コンテンツの種類、コンテンツのフォーマットをテストする必要はない。
  2. あなたのコンテンツに基づいて、モデルが質問に対する適切な回答を生成できるかどうかをテストしてください。 最良の結果を得るためには、RAG溶液で直接テストしてください。 また、コンテンツから質問と該当するテキストをプロンプトに入力し、生成された回答を確認することもできます。
  3. AIの回答が不十分な場合は、適切な回答が得られるまでコンテンツを変更してみてください。 適応テクニックを参照。
  4. トレンドに基づいてガイドラインを作成する。 ガイドライン例を参照。

コンテンツをAIに対応させるための適応テクニック

RAGソリューションが、ナレッジベースで回答されている質問に対して不十分な回答を生成することがわかったら、そのコンテンツを適応させてみてください。 例えば、解答を向上させるために以下のようなテクニックを試すことができる:

  • コンテンツのフォーマットを変更したり、コンテンツを並べ替えたりする。 たとえば、長い段落の代わりに箇条書きにしたり、表をシンプルにしたりする。
  • 概念を明確にし、重要な用語の定義を改善する。
  • 内容の主題や範囲を明確にするために文脈を加える。 例えば、セクションの見出しを追加することもできる。
  • 長いコンテンツの要約を追加する。
  • あいまいな代名詞を特定の名詞に置き換える。 例えば、代名詞のある各文には、その代名詞が参照する名詞が含まれていることを確認する。
ヒント: コンテンツの再フォーマットを計画する際は慎重に。 例えば、LLMがテーブルをうまく扱えない場合、テーブルを削除する計画は立てないでください。 テーブルは人間の読者にとって非常に便利なものであり、テーブルを置き換える頃には、RAGソリューションがテーブルを扱えるようになっているかもしれない。 コンテンツの全体的な質を高める場合にのみ、大規模な変更を加える。

AI用コンテンツを準備するためのガイドライン例

AI用のコンテンツを準備するためのガイドラインの例を以下に挙げるが、あなたのコンテンツにも当てはまるかもしれない:

概念的なグラフィックを文章で説明する
概念的なグラフィックをテキストで明確に説明することで、グラフィックの曖昧さを明確にし、画像からテキストへのモデルの費用を避けることができます。 テキストを説明するためにグラフィックを使用する。 グラフィックは、情報を省略したり、どの項目がオプションであるかを明確に指定しないため、概念を過度に単純化する可能性がある。 あたかも図解がないかのように、文章でプロセスやコンセプトを説明することで、読者やLLMの混乱を防ぐことができます。
アイコンの名前をテキストに含める
アイコンやその他のUI要素の名前を、画像だけを表示するのではなく、テキストに含めることで、AIに完全な文章を提供することができる。 例えば、"To edit an asset, click 編集アイコンのイメージ" という文章は、アイコンの画像なしでは完結しません。 しかし、「アセットを編集するには、編集アイコンをクリックします」という文章は、アイコンの画像がなくても理解できます。
長い手順やチュートリアルをまとめる
長い手順やチュートリアルがある場合、LLMはその内容全体を回答に収めることができないかもしれません。 ステップの要約を加えることは、LLMが質問に答えるのに役立つ。 要約はまた、ユーザーへの期待も示している。
リストに明確なリード文を追加する
LLMは、リード文なしでリストの主語を特定するのに苦労することがある。
非常に短いトピックを排除する
非常に短いトピックは、LLMが質問に対する適切な回答を作成するのに十分な情報を提供しない可能性がある。 たとえば、非常に短い親トピックは、目次で子トピックを整理する役割を果たし、価値のあるコンテンツはほとんど含まれていない。 非常に短いトピックは、AIからの回答が不十分となり、そのトピックにたどり着いたユーザーを失望させる可能性があります。 非常に短いトピックを削除するか、価値のあるコンテンツを追加することができます。

AIのためにコンテンツを修復するガイドラインを作成する

フィードバックの仕組みを導入しているAIから、不適切な回答をもたらすコンテンツを修正する方法を決定する最善の方法。 人間のユーザーは、回答が不適切であることを示すことができます。 フィードバック、質問、回答、検索されたトピックを保存する。

ガイドラインを作ること:

  1. ユーザーからAIの回答に対する否定的なフィードバックを集めましょう。
  2. 不適切な回答の原因を特定する。
  3. 適切であれば、AIからより良い回答が得られるまで、対象のトピックを更新する。 元の質問のいくつかのバリエーションで変更をテストしてください。 Adaptation tequniquesを参照のこと。
  4. 更新するトピックに傾向が見られたら、ガイドラインを作成する。 ガイドライン例を参照。

AI向けにコンテンツを修復する適応技術

コンテンツを修復するには、コンテンツを変更したり、追加したりすることができる。

以下の表は、AIからの回答が不十分なコンテンツを修復するためのいくつかのテクニックを説明しています。

不十分な回答に対する解決策
問題点 解決方法
コンテンツは存在しない。
ナレッジベースにふさわしくないコンテンツを追加しないでください。
コンテンツは存在するが、LLMはそれを見つけられなかった。 トピックのタイトル、セクションの見出し、トピック内の用語を更新してみてください。
LLMは内容を理解していなかった。
情報の書式を更新する。
LLMはその答えの一部を提供する。 情報を再フォーマット化したり、長い内容の要約を提供したりしてみてください。

AIの回答に対してユーザーから否定的なフィードバックがあった場合、コンテンツを変更することで対処できるとは限りません。 解決するのが簡単でも不可能でもない、不十分な回答の原因が他にも見つかるかもしれない。 ユーザーの質問は、LLMが理解できるほど明確で、完全で、整ったものでないかもしれない。 例えば、ユーザーからの質問にはこのような問題があります:

  • スペルミス
  • 十分な情報のない漠然とした質問
  • 誤った文法
  • 誤った用語
  • あなたの知識ベースに無関係なテーマ
ヒント: コンテンツの変更は慎重に。 不適切な回答や否定的な意見にいちいち対応しようとしないこと。 トレンドに基づいてガイドラインを作成する。

AI用コンテンツの修復ガイドライン例

AIのためにコンテンツを修復するためのガイドラインの例は、あなたのコンテンツに当てはまるかもしれません:

分かりにくい内容を明確にする
漠然としていたり、詳細が多すぎたり、文脈が欠けていたりする内容を明確にすることができる。
不足している情報のコンテンツを追加する
ドキュメントのギャップを埋めるためにコンテンツを追加したり、欠けている機能の代替案について言及したりすることができます。 例えば、ある植物苗店に、その植物苗店では扱っていない野菜の種を買いたいとよく客が尋ねてきたとする。 苗床チャットボットは種子に関する質問に「わからない」「いいえ」で答える。 ナーサリーのスタッフは、このような文章を知識ベースに加えることができる:「私たちは種子を販売していませんが、野菜の苗を豊富に取り揃えています そうすれば、LLMは有益な答えを出すことができる。
用語の追加・変更
ユーザーは、あなたがドキュメントで使っている用語とは異なる用語を使うかもしれない。 もし傾向があるようなら、LLMがそれを見つけられるよう、代替用語を挙げておくとよい。 例えば、「LLMの誤った回答は幻覚と呼ばれることがある」などと言う。