添加文件提取器

您可以在代理工作流中添加自定义文档提取器,以便从文档中提取日期、姓名等字段或实体。

配置文档提取器时,您可以从可用模型列表中选择一个模型。 您还可以通过AI网关添加自己的自定义模型。 有关更多信息,请参阅通过 AI 网关添加 AI 模型

在代理工作流程中添加文件提取器:

  1. 在工作流构建器中打开代理工作流。

  2. 点击“添加流程项”图标 添加图标

  3. 选择 “流程节点 ”选项卡。

  4. 文档提取器拖入代理工作流程。

  5. 选择以下工具选项之一从文档中提取字段: 结构化非结构化。 有关适合您数据提取使用场景的工具选项的更多信息和指南,请参阅《 选择从文档中提取字段的工具选项》。

或者,要添加文档提取器,请单击起始节点与结束节点之间的连接线,然后选择 “添加流程活动”>“文档提取器 ”。

选择从文档中提取字段的工具选项

您可以从两种工具选项中选择,用于从文档中提取字段: 结构化非结构化。 这些工具在信息处理方式上有所不同,但两种选项中你需要遵循的步骤几乎相同。

  • 非结构化 :使用基于文本的语言模型从文档中提取顶级字段。 它最适合处理文本密集型内容,但无法从表格中提取列值。

  • 结构化 :采用基于视觉的多模态语言模型,同时提取顶级字段和表格数据。 由于它依赖于更大的模型,因此通常运行速度较慢。

何时使用各项工具选项

  • 对于文本密集型且跨多页的文档(如合同、电子邮件或手册),其中字段出现在页眉或正文内,请使用非结构化模式。 有关更多信息,请参阅选择“非结构化”选项后配置文档提取器

  • 结构化模板适用于结构化或固定版式的文档,通常长度为一至三页,例如发票、采购订单或税务表格。 当您需要从表格中提取信息时,这是最理想的选择。 有关更多信息,请参阅选择“结构化”选项后配置文档提取器

在选择非结构化选项后配置文档提取器

注:

watsonx/ibm/granite-3-3-8b-instruct 模型自 2025 年 11 月 24 日起已弃用,并将于 2026 年 2 月 22 日正式停用。 使用默认模型或其他受支持的模型作为非结构化文档提取器。

要配置文档提取器以识别并从非结构化文档中提取一组字段:

  1. 选择添加到代理工作流程的文档提取器。

  2. 点击“编辑字段”图标 编辑

  3. 模型列表中选择要用于文档提取器的模型。

    显示一个用于上传文档和添加字段的对话框。

    在“模型”列表中,单击 “查看所有基础模型 ”以打开模型选择对话框,该对话框列出了所有可用的模型。 要选择一个模型,请搜索或从列表中选择。 选择模型后,点击 “保存 ”。 将显示与所选模型相关的任何通知,例如弃用通知或第三方许可要求。

    某些型号的对话框中包含一个状态标签,用于标注 “推荐 ”或 “第三方 ”等状态。 警告图标表示该模型可能会在后续版本中被移除或弃用。

    注:

    您可以按任意顺序上传文件或添加字段。 当系统至少包含一个文档和一个字段时,提取过程即开始。

  4. 执行以下操作:

    • 上传您的文件

      上传的示例文件有助于创建字段。 这些文件不会训练模型,也不是正在配置的代理的一部分。

      上传文件可能需要一些时间。

      上传完成后,您可以看到文档预览,您可以使用工具栏上的选项执行以下操作:

      • 从列表中选择要查看的上传文件

      • 浏览正在查看的文件页面

      • 调整页面宽度和高度,以便查看

      • 放大或缩小页面查看

      • 搜索文档中的字段

      显示上传文件的示例

      在上一个示例中,用户上传了样本文件,并显示了这些文件的预览。

    • 添加字段

      点击 “添加字段 ”,为需要从文档中提取的信息(如日期、姓名等)添加字段。

      文档提取器会在各文档中搜索与字段相关的值。图 2:展示从文档中提取字段的示例。

      在上一个示例中,用户添加了价格、期限和日期字段,这些字段会在文档预览面板中进行搜索并显示。

      要编辑字段详细信息,请将鼠标悬停在该字段上,然后点击“查看字段详细信息 编辑 ”图标。 您可以编辑字段名称、描述和数据类型。 您可以添加字段示例,帮助模型理解您要提取的信息,然后单击 " 在文档中显示 "获取结果。 如果不再需要该字段,也可以将其删除。

  5. 要上传更多文件或删除现有文件,请从文件预览工具栏的列表中选择管理文件选项。

  6. 从文件预览工具栏浏览不同的文件,以验证信息提取是否符合预期。

  7. 配置触发用户审核的设置。 有关更多信息,请参阅配置用户评论

  8. 在您验证并获得预期结果后,请关闭文档提取器对话框。

在选择结构化选项后配置文档提取器

从采购订单和发票等结构化文档中提取所有明细项的能力,可减少人工操作并提高文档处理的准确性。

要配置文档提取器以识别并从结构化文档中提取一组字段:

  1. 选择添加到代理工作流程的文档提取器。

  2. 点击“编辑字段”图标 编辑

    显示一个用于上传文档和添加字段的对话框。
  3. “模型” 列表中选择或指定一个用于文档提取器的模型。

    在“模型”列表中,单击 “查看所有基础模型 ”以打开模型选择对话框,该对话框列出了所有可用的模型。 要选择一个模型,请搜索或从列表中选择。 选择模型后,点击 “保存 ”。 将显示与所选模型相关的任何通知,例如弃用通知或第三方许可要求。

    某些型号的对话框中包含一个状态标签,用于标注 “推荐 ”或 “第三方 ”等状态。 警告图标表示该模型可能会在后续版本中被移除或弃用。

    注:

    您可以按任意顺序上传文件或添加字段。 当系统至少包含一个文档和一个字段时,提取过程即开始。

  4. 执行以下操作:
    • 从预定义模式列表中选择一个模式

    您可以选择一种文档类型,并添加与该文档类型相关的多个字段,而无需手动逐个添加字段。 可选择多种文档类型,例如银行对账单、发票、保险理赔单等。

    要从预定义的模式中添加字段,请执行以下操作:
    1. 单击 “定义架构 ”。
    2. 从“预定义模式 ”中选择一种文档类型。

      系统将显示所选文档类型的说明以及所有可用于提取数据的关联字段。

    3. 单击创建

      文档提取器会在各文档中搜索与字段相关的值。图3:发票字段示例。

    在上一个示例中,对话框中显示了从发票文档中提取的字段。

    要编辑字段详细信息,请将鼠标悬停在该字段上,然后点击“查看字段详细信息 编辑 ”图标。 您可以编辑字段名称、数据类型和描述。 您可以添加字段示例,帮助模型理解您要提取的信息,然后单击 " 在文档中显示 "获取结果。 如果不需要该字段,也可以将其删除。

    • 上传您的文件

    上传的示例文件有助于创建字段。 这些文件不会训练模型,也不是正在配置的代理的一部分。

    上传文件可能需要一些时间。

    上传完成后,您可以看到文档预览,您可以使用工具栏上的选项执行以下操作:

    • 从列表中选择要查看的上传文件

    • 浏览正在查看的文件页面

    • 调整页面宽度和高度,以便查看

    • 放大或缩小页面查看

    • 搜索文档中的字段

    示例:显示已上传的发票

    在上一个示例中,用户上传了一份样本发票文档,系统随即显示了该文档的预览。 预览还显示了文档中自动检测到的表格,您可以从中提取数据。

    • 添加自动检测到的表格

    若要添加文档中自动检测到的表格以提取数据,请单击“添加表格”图标 添加表

    表中的数据被添加到以表名为标识的提取字段中。 要编辑表格名称,请将鼠标悬停在表格名称上,然后点击“编辑”图标 编辑。 要删除该表格,您可以点击“删除”图标 编辑

    您还可以重新排列提取表格中的列顺序。 有关更多信息,请参阅 “重新排序列”

    • 添加自定义表格

    要添加自定义表并定义用于提取数据的字段,请单击 “定义模式 ”,选择 “用户定义的模式 ”,然后单击 “创建 ”。

    执行以下操作以添加自定义表:

    a. 点击侧边栏中的“添加表格”图标 添加表 ,为自定义表格指定一个名称,然后按 Enter 键。

    b. 点击 “添加列 ”,为自定义表格输入列名,然后按下回车键。 重复此步骤可向自定义表格中添加更多列。

    系统在文档中搜索列值。 为某列找到的首个值将显示在侧边面板中,该列的所有其他值将在文档预览中被高亮显示。

    如果某列未找到值,则侧边栏中该列不会显示任何值。 在这种情况下,您可以点击“查看列详细信息”图标 查看列详情 ,系统会显示文档中的预期值。 此操作有助于系统理解您希望从该列中提取哪些信息。

    要提示输入值,请选择数据类型,将 “描述” 开关设置为开启状态,输入或描述该值,然后单击 “在文档中显示”。 系统根据您的描述在文档中搜索相关值。 若找到该值,则在侧边面板中显示。 若该列不再需要,您也可以将其删除。

    您还可以重新排列提取表格中的列顺序。 有关更多信息,请参阅 “重新排序列”

    c. 要查看自定义表格及其提取数据的预览,请点击表格名称旁边的 “查看 ”。

    示例展示自定义表格及其列

    • 添加字段

    若要为需要从文档中提取的信息(如日期、姓名等)添加更多字段,请单击 “定义模式 ”,选择 “用户自定义模式 ”,然后单击 “创建 ”→ “添加字段 ”。

    输入字段名称后,文档提取器会在各文档中搜索与这些字段相关的值。

    要编辑字段详细信息,请将鼠标悬停在该字段上,然后点击“查看字段详细信息”图标 编辑。 您可以编辑字段名称、数据类型和描述。 您可以添加字段示例,帮助模型理解您要提取的信息,然后单击 " 在文档中显示 "获取结果。 如果不再需要该字段,也可以将其删除。

  5. 要上传更多文档或删除现有文档,请点击文档预览工具栏列表中的“管理 管理文档文档”图标。

  6. 从文件预览工具栏浏览不同的文件,以验证信息提取是否符合预期。

  7. 配置触发用户审核的设置。 有关更多信息,请参阅配置用户评论

  8. 在您验证并获得预期结果后,请关闭文档提取器对话框。

对列进行重新排序

您可以通过拖放操作重新排列表格中的列。 此操作有助于确保列顺序与文档中原始表格保持一致。

默认情况下,模式中的列顺序与提取表中的顺序一致。 然而,如果在自动检测过程中遗漏了某列,而该列后来被手动添加,则该列会出现在表格末尾。

要重新排序表格中的列名:

  1. 将鼠标悬停在侧边栏中的列名上,然后单击“拖动”图标将其 拖动拖动。

  2. 点击表格名称旁边的 “查看 ”。 表格中的新列顺序已在预览中显示。

将数据映射到输入

默认情况下,自动映射已启用。 不过,您可以将数值映射到输入。

要将数值映射到输入,请完成以下步骤:

  1. 选择文档提取器节点,然后单击编辑数据映射

  2. 指定数据映射的输入值。 有关数据映射的更多信息,请参阅映射数据

将文档提取器节点中提取的映射表映射到工作流中的其他节点

现在,您可以在工作流中将文档提取器节点的表类型输出映射到目标位置。 您可以执行以下任何操作:

  • 要在聊天中显示整个表格,请在文档提取器节点下使用列表交互类型映射工作流中提取的表格。

示例展示了在文档提取器下使用列表实现的自定义表映射

  • 要在聊天中显示表格的行数据,您可以在工作流中使用 For each 循环遍历提取表格的各行。 为此,您可以将 For each 循环与用户活动节点和消息输出节点组合使用。 然后,要显示每行数据,您可以在“For each循环数据映射”中选择所需的列。

示例展示For each循环中列的数据映射

此外,若要在工作流的下游节点中使用任何提取的表格输出,可采用相同的“For each”循环数据映射流程。 这使得能够进行进一步处理,例如在工作流中应用条件逻辑。

配置用户评论

预览

您可以配置触发用户评论的设置。

若系统提取置信度评分低于设定的提取置信度阈值(针对非结构化选项),或提取结果为空值(针对结构化选项),则会创建用户审核任务并分配给用户。

配置用户评论:

  1. 在代理工作流程中选择文件提取器。

  2. 用户评论开关设置为开启状态。

  3. 执行以下其中一项操作:

    • 对于非结构化选项:点击 “如果提取置信度低于 ”字段中的“编辑 编辑图标 ”图标。 为所有字段或特定字段设置提取置信度阈值,该阈值可触发人工审核。 要选择触发用户审核的特定字段,请点击“编辑”图标 编辑图标,选择相应的字段,然后点击 “完成”。 提取置信度得分反映了提取结果与预期值的匹配程度。

    • 对于结构化选项:在 “如果提取结果包含任何空值 ”字段中,点击 编辑图标 “编辑”图标。

      1. “分配给 ”列表中,选择以下选项之一:

选项

描述

流启动器

只有启动流程的用户才能审核文档。

已指定用户

只有指定用户才能查看 document.If。目前尚未分配任何用户,请点击 “分配用户 ”以选择用户。 选中的用户将显示在 “已分配用户 ”字段中。 要切换用户,请点击“编辑”图标 编辑图标,然后选择其他用户。

从变量中获取用户

只有在变量中指定的用户才能审阅该文档。

系统会在聊天中通知用户,根据提取置信度评分或空值情况,需要进行人工审核。

示例:聊天中显示用户评论任务通知

用户可点击聊天通知查看评论活动。

展示用户评论任务的聊天示例

用户随后可检查提取的值,进行必要的修改,并提交审核。 提交后,工作流将使用更新后的值继续执行。

用户评论示例

文件提取器的限制和约束

文件提取器有以下限制和约束。

区域

描述

最大文件大小

10 MB

上传文件的最大数量

5 档案

接受的文件类型

.doc,.docx,.jpe,.jpeg.jpg,.pdf,.png,.ppt,.pptx,.tif,.tiff

最大页数

600 页

最大字段数

25 领域

以下限制同样适用于文档提取器:

  • 提取字段的置信度值

结构化文档提取器不同于非结构化文档提取器,其提取的字段值不提供置信度评分。 因此,基于信任度的用户评论规则无法配置。

  • 单一提及提取

文档提取器仅捕获文档中某个字段值的一个实例,通常是首次出现的位置。 例如,如果发票编号出现多次,则仅提取其中一次。 要捕获多个值,请定义具有不同语义标签的字段,例如家庭电话号码手机号码

创建主动型工作流

代理工作流定义了一系列相关联的活动和控制,旨在实现特定的业务目的或目标。 进一步了解代理工作流程。