ナレッジソースとしてファイルをアップロードする
社内ナレッジベースに直接ドキュメントをアップロードすることで、エージェントの知識を高めることができます。 この方法は、迅速なセットアップと静的なコンテンツに最適です。
ファイルアップロードを使用する場合
以下のシナリオでファイルアップロードを使用します:
ほとんど変化のない、静的でレビューされたコンテンツ
エージェントに参照させたいドメイン固有の情報
外部システムに依存しない迅速な知識統合の必要性
頻繁に更新されるデータセットや大規模なデータセットの場合は、代わりに外部のナレッジリポジトリへの接続を検討する。
ファイル要件
アップロードを確実に成功させるには、ファイルが以下の基準を満たしていることを確認してください。
対応ファイル形式とサイズ制限
ファイル拡張子 | 最大サイズ |
|---|---|
| 25 MB |
| 5 MB |
.csvファイルは UTF‑8 でエンコードされている必要があります各ファイルは一意なファイル名でなければなりません
一度に20ファイルまでアップロードできます。
バッチ内の全ファイルの合計サイズは30MBを超えてはならない。
各ファイルは最大600ページまで。
ファイルをアップロードする手順
以下の手順に従って、ナレッジベースに文書をアップロードしてください:
Knowledgeに移動し、 Choose knowledge +をクリックします。
ソースの選択 ]で、[ ファイルのアップロード] をクリックします。
アップロードボックスをクリックするか、ファイルをドラッグして入力し、[ 次へ] をクリックします。
ナレッジの詳細セクション
名前 ]には、ナレッジ・ソースの表示名を入力します。
説明]には、ナレッジ・ソースの簡単な説明を入力します。 詳細については、 「知識記述の作成」 を参照してください。
保存 をクリックします。
ファイルリストで、アップロードされたすべてのファイルをチェックします。
さらにファイルを追加するには、「 ファイルをアップロード 」をクリックします。
ファイルを削除するには、 「ファイルを削除」
をクリックしてください。
ドキュメントURLのサポート
アップロードされたファイルに外部URLを関連付けることで、ユーザーがオリジナルのソースを閲覧できるようになります。
URL を追加するには
アップロードされたファイルのリストで、ファイル名にカーソルを合わせます。
「 URL
のソースを編集」をクリックします。
新しい URL を入力するか、既存のものを更新する。
引用におけるURLの使用
エージェントがOrchestrate Chatでそのファイルからコンテンツを引用する場合、引用には「 ソースを表示 」ボタンが含まれます。
View source " をクリックすると、割り当てた URL が開きます。
ユーザーは、そのリンクを使ってオリジナル文書を確認したり、探索したりすることができる。

文書処理機能の強化
既存のナレッジ・ソースにファイルをアップロードする際、または新しいナレッジ・ソースを作成する際、ドキュメントは高度な抽出技術を使用して処理され、より高い精度とコンテンツ品質が得られます。
主な強化点
テーブル処理の改善:表形式データを含む文書において、表の構造を保持し、より正確な表現を実現します。
OCR統合:画像が埋め込まれた文書からテキストを抽出し、重要な情報を見逃しません。
Markdown出力:抽出されたテキストをMarkdown形式で保存し、構造、可読性、文脈を維持します。
既知の制限 :
ページ数制限:各ファイルは最大600ページまで。
処理時間:大きなファイルは処理に時間がかかる場合があります。
データの保存
ファイルや文書をエージェントに直接アップロードすると、データは特定の地域にある IBM Cloud データセンターに安全に保存されます。 サービスを利用する場所や方法によっては、いくつかの例外が適用される:
IBM Cloud で watsonx Orchestrate をご利用の場合、データはお客様の環境がホストされているのと同じ IBM Cloud データセンター内に保持されます。
AWS で watsonx Orchestrate をご利用の場合、データは、ご利用の AWS リージョンに地理的に最も近い IBM Cloud リージョンに保存されます。
お客様の環境が AWS のムンバイでホストされている場合、データは AWS のムンバイに保持され、 IBM Cloud のリージョンには転送されません。
データの行き先を明確にするために、 watsonx Orchestrate AWS のリージョンを IBM Cloud のリージョンに対応付けた以下の参照表をご利用ください:
watsonx Orchestrate AWS にて | IBM Cloud にアップロードされたデータ |
|---|---|
|
|
|
|
|
|