テキスト抽出器の追加

ドキュメントからテキストを抽出するために、エージェントワークフローにテキスト抽出機能を追加することができます。 テキストエクストラクタは、エージェント型ワークフローが実行される際に、手作業によるデータ入力の必要性をなくし、文書処理時間を短縮します。 文書からテキストを抽出し、エージェント型ワークフロー内の下流ノード(フォーマット処理用のロジックブロック、キーワード分析用の生成プロンプト、その他のアクティビティなど)への入力として提供できます。

注: テキスト抽出ツールは、テキストコンテンツを抽出する目的でのみ、Microsoft Excel (.xlsx) ファイルを入力として受け付けます。 これらのファイルは、キーバリューペア(KVP)の抽出には使用できません。 このシステムはMicrosoftの.xlsx形式のみに対応しており、旧形式の.xls形式は受け付けません。

また、ドキュメント抽出ノードやドキュメント分類ノードなどの他のワークフローノードも、.xlsx ファイルには対応していません。

テキスト抽出器を設定して文書から意味的なキー値ペア(KVP) を抽出する場合、利用可能なモデルのリストからモデルを選択できます。 AI Gatewayを通じて独自のカスタムモデルを追加することもできます。 詳細については、 「カスタムAIモデルの追加」 を参照してください。

使用例としては、テキスト抽出ノードを使用してドキュメント内のフィードバックを分析するエージェント型ワークフローがある。 エージェントによるワークフローがチャットで実行されると、エージェントはユーザにドキュメントのアップロードを促すことができます。 次に、エージェント型ワークフローは文書からテキストを抽出し、他のノードは抽出されたテキストを処理して、キーポイントや要約などの期待される出力を生成することができる。

エージェント型ワークフローにテキスト抽出機能を追加する:

  1. ワークフロービルダーでエージェント型ワークフローを開きます。

  2. 追加アイコン「フロー項目を追加」アイコンをクリックします。

  3. フローノードタブを選択します。

  4. テキスト抽出ツールをエージェントワークフローにドラッグします。

  5. 必要なプロパティを選択してください:

    • 手書き文字の検出 :アップロードされたファイルから手書きのメモを抽出します。

    • 文書レイアウトを維持 :文書の元の書式設定を保持します。

    • テキストヒントを有効にする : 文脈ヒントを使用して認識精度を向上させます。

    • オブジェクトとして出力 : 出力変数のフォーマット方法を選択:

      • 無効化: エクストラクタは、抽出されたテキストとキー・値ペアを含むファイルへの URLdocument_refである出力変数を生成します。

      • 有効: エクストラクタは、 textという出力変数を生成します。これは、プレーンテキストとドキュメント構造のメタデータを含む、抽出結果全体を格納したJSON文字列オブジェクトです。

      出力のフォーマット方法を選択した後、出力変数を使用してデータをマッピングできます。詳細は「 データのマッピング 」を参照してください。

代わりに、テキスト抽出器を追加するには、開始ノードと終了ノード間の接続線をクリックし、 [フローアクティビティの追加 ] > [テキスト抽出器] を選択します。

文書からセマンティックなキーと値のペア(KVP)を抽出する

文書からセマンティックキーバリューペア(KVP)を抽出するために、テキスト抽出器を設定することができます。 セマンティックKVP抽出は、データを抽出するためのキーと値のペアに注目することで、フォーマットやレイアウトなどのドキュメントのバリエーションに適応することができます。

ドキュメントからキーと値のペアを抽出する:

  1. エージェントワークフローのテキスト抽出ノードを選択します。

  2. Extract key-value pairs スイッチをオンにする。

  3. Add schemaをクリックする。

  4. 有効なJSONスキーマを使用して、ドキュメントから抽出したいフィールドとテーブルを指定します。 以下にJSONの例を示す。
    [
        {
            "document_type": "Invoice",
            "document_description": "An invoice is a standard document issued by a seller to a buyer, outlining products or services provided, quantities, prices, and payment terms.",
            "fields": {
                "invoice_number": {
                    "description": "A unique identifier assigned by the vendor for this invoice.",
                    "example": "2023-AUS-987654"
                },
                "document_date": {
                    "description": "Date of the document.",
                    "example": "2025-07-05"
                },
                "vendor_name": {
                    "description": "Legal or trade name of the company issuing the invoice. Usually located in the header or footer, near the logo, or billing details.",
                    "example": "ABC Supply Company Ltd"
                },
                "vendor_number": {
                    "description": "Internal identifier used by the buyer's system to refer to the vendor.",
                    "example": "VEND-1023"
                }
            }
        }
    ]
    }
  5. テキスト抽出ツールに使用するモデルを選択してください。

    モデル 」リストからモデルを選択するか、 「すべての基礎モデルを表示」 をクリックして、利用可能なすべてのモデルが一覧表示されるモデル選択ダイアログを開きます。 モデルを検索するか、リストから選択してください。 モデルを選択したら、 「保存」 をクリックしてください。 選択したモデルに関連する通知(非推奨の通知やサードパーティのライセンス要件など)が表示されます。

    一部のモデルでは、ダイアログにステータスタグが表示され、 「推奨 」や「 サードパーティ製」 などの状態が示されます。 警告アイコンは、そのモデルが次回のリリースで廃止または非推奨になる可能性があることを示しています。

  6. KVP フォーススキーマ名を入力してください。

既存のスキーマを編集するには、エージェントのワークフローでテキスト抽出ノードを選択し、 スキーマの編集をクリックします。

セマンティックKVP抽出におけるkpv_model_name値のばらつき

オンプレミス

注:

kvp_model_name の値のばらつきは、オンプレミス展開にのみ適用されます。

フローツールがデフォルト値を使用する場合 kvp_model_name 、またはAPI呼び出し元が実行時に値を指定する場合、期待される結果を得るためには、渡された kvp_model_name 値の微妙な違いを理解することが重要です。

内部基盤モデルで構成されたモデル

IBM ( watsonx.ai )を使用してモデルを設定する場合、渡される値は、 kvp_model_nameSaaS とオンプレミス環境の両方で同じになります。

例えば、この値をkvp_model_nameで考えてみましょう watsonx/mistralai/mistral-small-3-1-24b-instruct-2503

次のように編集します。

  • watsonx プロバイダーIDです

  • mistralai/mistral-small-3-1-24b-instruct-2503 モデルカードです

プロバイダー ID は であるため watsonx、 SaaS およびオンプレミス watsonx/mistralai/mistral-small-3-1-24b-instruct-2503 環境の両方で同じ値を使用できます。

注:

プロバイダーIDが watsonx の場合、 IBM watsonx.ai の設定であることを示します。 SaaS とオンプレミス環境の両方で、同じkvp_model_nameを使用してセマンティックKVP抽出を行うことができます。

外部AIゲートウェイが設定されたモデル

オンプレミス環境でのAI Gatewayを使用した外部モデルの設定については、 「AI Gateway 経由での外部モデルの登録」 を参照してください。

外部AIゲートウェイを使用してモデルを設定する場合、モデルがインポートされるため、 SaaS とオンプレミス環境では、渡される値が kvp_model_name 異なります。

例えば、この値をkvp_model_nameで考えてみましょう groq/openai/gpt-oss-120b

次のように編集します。

  • groq プロバイダーIDです

  • openai/gpt-oss-120b モデルカードです

詳細については、プロバイダーID をご確認ください。

プロバイダーIDが 以外の場合は watsonx、値の前に を付加してください virtual-model。 つまり、値を として kvp_model_name 渡さなければ virtual-model/groq/openai/gpt-oss-120bなりません。

注:

プロバイダーIDが watsonx と異なる場合、その構成では外部AIゲートウェイが使用されていることを示します。 このような場合、 オンプレミス環境での意味的なKVP抽出を行うには、値の先頭に「virtual-model」を付ける必要があります。

より明確にするために、以下の例示付き表を参照してください:

表 1. 表1. SaaS とオンプレミス環境で渡されるkvp_model_nameの値に差異がある

モデル名

kvp_model_name

プロバイダーID

SaaS で渡す値

オンプレミス環境で渡す値

mistral-small-3-1-24b-instruct-2503

watsonx/mistralai/mistral-small-3-1-24b-instruct-2503

watsonx

watsonx/mistralai/mistral-medium-3-1-24b-instruct-2503

watsonx/mistralai/mistral-small-3-1-24b-instruct-2503

gpt-oss-120b

groq/openai/gpt-oss-120b

グロック

groq/openai/gpt-oss-120b

virtual-model/groq/openai/gpt-oss-120b

データを入力にマッピングする

デフォルトでは、オートマッピングが有効になっている。 しかし、入力に値をマッピングすることはできる。

値を入力にマップするには、以下の手順を実行する:

  1. テキスト抽出ノードを選択し、 データマッピングの編集をクリックします。

  2. データマッピングの入力値を指定する。 データマッピングの詳細については、 データのマッピングを参照してください。

テキスト抽出の制限と制約

テキスト抽出機能には次のような制限や制約があります。

領域

説明

最大ファイル・サイズ

10 MB(Microsoft Excelファイルを除く)

注: Microsoft Excel ファイルの最大ファイルサイズは 0.1 MB です。

アップロードされるファイルの最大数

5ファイル

使用可能なファイルの種類

.doc、.docx、.jpg、.jpeg、.png、.ppt、.pptx、.tif、.tiff、および.xlsx

最大ページ数

600ページ

最大画像数

制限なし

ページあたりの最大画像数

制限なし