ナレッジソースとしてファイルをアップロードする

社内ナレッジベースに直接ドキュメントをアップロードすることで、エージェントの知識を高めることができます。 この方法は、迅速なセットアップと静的なコンテンツに最適です。

ファイルアップロードを使用する場合

以下のシナリオでファイルアップロードを使用します:

  • ほとんど変化のない、静的でレビューされたコンテンツ

  • エージェントに参照させたいドメイン固有の情報

  • 外部システムに依存しない迅速な知識統合の必要性

頻繁に更新されるデータセットや大規模なデータセットの場合は、代わりに外部のナレッジリポジトリへの接続を検討する。

ファイル要件

アップロードを確実に成功させるには、ファイルが以下の基準を満たしていることを確認してください。

対応ファイル形式とサイズ制限

ファイル拡張子

最大サイズ

.docx, .pdf, .pptx, .xlsx

25 MB

.csv, .html, .txt

5 MB

  • .csv ファイルは UTF‑8 でエンコードされている必要があります

  • 各ファイルは一意なファイル名でなければなりません

  • 一度に20ファイルまでアップロードできます。

  • バッチ内の全ファイルの合計サイズは30MBを超えてはならない。

  • 各ファイルは最大600ページまで。

ファイルをアップロードする手順

以下の手順に従って、ナレッジベースに文書をアップロードしてください:

  1. Knowledgeに移動し、 Choose knowledge +をクリックします。

  2. ソースの選択 ]で、[ ファイルのアップロード] をクリックします。

  3. アップロードボックスをクリックするか、ファイルをドラッグして入力し、[ 次へ] をクリックします。

  4. ナレッジの詳細セクション

    • 名前 ]には、ナレッジ・ソースの表示名を入力します。

    • 説明]には、ナレッジ・ソースの簡単な説明を入力します。 詳細については、 「知識記述の作成」 を参照してください。

  5. 保存 をクリックします。

  6. ファイルリストで、アップロードされたすべてのファイルをチェックします。

    • さらにファイルを追加するには、「 ファイルをアップロード 」をクリックします。

    • ファイルを削除するには、 「ファイルを削除」 「削除」アイコンをクリックしてください。

ドキュメントURLのサポート

アップロードされたファイルに外部URLを関連付けることで、ユーザーがオリジナルのソースを閲覧できるようになります。

URL を追加するには

  1. アップロードされたファイルのリストで、ファイル名にカーソルを合わせます。

  2. URL鉛筆アイコンのソースを編集」をクリックします。

  3. 新しい URL を入力するか、既存のものを更新する。

引用におけるURLの使用

  • エージェントがOrchestrate Chatでそのファイルからコンテンツを引用する場合、引用には「 ソースを表示 」ボタンが含まれます。

  • View source " をクリックすると、割り当てた URL が開きます。

  • ユーザーは、そのリンクを使ってオリジナル文書を確認したり、探索したりすることができる。

ソースの表示

文書処理機能の強化

既存のナレッジ・ソースにファイルをアップロードする際、または新しいナレッジ・ソースを作成する際、ドキュメントは高度な抽出技術を使用して処理され、より高い精度とコンテンツ品質が得られます。

主な強化点

  • テーブル処理の改善:表形式データを含む文書において、表の構造を保持し、より正確な表現を実現します。

  • OCR統合:画像が埋め込まれた文書からテキストを抽出し、重要な情報を見逃しません。

  • Markdown出力:抽出されたテキストをMarkdown形式で保存し、構造、可読性、文脈を維持します。

既知の制限

  • ページ数制限:各ファイルは最大600ページまで。

  • 処理時間:大きなファイルは処理に時間がかかる場合があります。

データの保存

ファイルや文書をエージェントに直接アップロードすると、データは特定の地域にある IBM Cloud データセンターに安全に保存されます。 サービスを利用する場所や方法によっては、いくつかの例外が適用される:

  • IBM Cloudwatsonx Orchestrate をご利用の場合、データはお客様の環境がホストされているのと同じ IBM Cloud データセンター内に保持されます。

  • AWS で watsonx Orchestrate をご利用の場合、データは、ご利用の AWS リージョンに地理的に最も近い IBM Cloud リージョンに保存されます。

注:

お客様の環境が AWS のムンバイでホストされている場合、データは AWS のムンバイに保持され、 IBM Cloud のリージョンには転送されません。

データの行き先を明確にするために、 watsonx Orchestrate AWS のリージョンを IBM Cloud のリージョンに対応付けた以下の参照表をご利用ください:

watsonx Orchestrate AWS にて

IBM Cloud にアップロードされたデータ

us-east-1 (ノースバージニア)

us-east (Washington D.C )

eu-central-1 (フランクフルト)

eu-de (フランクフルト)

ap-southeast-1 (シンガポール)

jp-tok(東京)