更新与变更内容 Unstructured Data Integration

Unstructured Data Integration 更新可能包含新功能和修复。 版本按倒序排列,因此最新版本位于主题开头。

您可以在. 最新动态 IBM Software Hub处查看该平台及所有服务的新功能列表。

安装或升级 Unstructured Data Integration

准备好安装或升级了吗 Unstructured Data Integration

  • 要安装 Unstructured Data Integration 其他 IBM® Software Hub 服务,请参阅《 安装指南 IBM Software Hub》。
  • 要升级 Unstructured Data Integration 其他 IBM Software Hub 服务,请参阅升级指南 IBM Software Hub
  • 要安装或升级 Unstructured Data Integration 作为 的一部分,请参阅 watsonx.data watsonx.data™ integration集成。
    请注意: 与实例相关的所有 IBM Software Hub 组件 IBM Software Hub 必须安装相同版本。

IBM Software Hub 版本 5.3.1

新版于 2026年2 Unstructured Data Integration 月发布, 5.3.1IBM Software Hub 包含以下内容:

操作数版本: 5.3.1

此发行版包括下列更改:

更新
本次发布引入了以下更新:
  • 增量摄取现已支持 FileNet,Microsoft OneDrive 和. Unstructured Data Integration中的 SharePoint 文档。
本次版本修复的问题
本次发布修复了以下问题:
  • Slack 不支持对非结构化数据进行增量摄取
  • 语言标注器在处理未知语言的文档时会显示警告或错误信息
  • Milvus 节点因字符长度异常而失败
本次版本修复了客户报告的问题
有关本次发布中修复的客户报告问题的列表,请参阅 修复清单 IBM Cloud Pak for Data 支持 IBM 网站上的。
本次版本修复的安全问题
本次发布修复了以下安全问题:

CVE-2024-29041, CVE-2025-4598, CVE-2025-6965, CVE-2025-9230, CVE-2025-9714, CVE-2025-15284, CVE-2025-50181, CVE-2025-50182, CVE-2025-64756, CVE-2025-65945, CVE-2025-66414, CVE-2025-66418, CVE-2025-66471, CVE-2025-67735, CVE-2025-68973, CVE-2026-0621, CVE-2026-21441, CVE-2026-22036

不推荐使用的功能
以下功能在本版本中已弃用:
  • 对基础文档集的支持将在即将发布的版本中终止。
    更新任何包含基础文档集的项目归档:
    1. 导入项目归档文件,将基础文档集转换为文档集。
    2. 再次导出项目。

IBM Software Hub 版本 5.3.0

新版于 2025年 Unstructured Data Integration 12月发布, 5.3.0IBM Software Hub 包含。

操作数版本: 5.3.0

此发行版包括下列更改:

新功能
本次版本 Unstructured Data Integration 包含以下功能:
Unstructured Data Integration 现已成为 IBM watsonx.data integration
您现在可以在安装包 IBM watsonx.data integrationUnstructured Data Integration 安装。
针对非结构化数据集成流的改进日志记录与调试功能
运行流程时,您现在可通过每个节点的专用面板监控节点进度、查看日志详情及节点运行摘要,从而轻松排查问题:
  • 查看并复制日志详情。
  • 检查每个节点的运行状态,查看详细信息及以表格形式呈现的输出特征。
基于元数据的操作符属性面板

每个非结构化数据集成操作符的属性面板现显示输入特征——这些特征由前置操作符添加的所有特征按降序排列累积而成,同时提供可编辑的输出特征列表,用户可在此决定将哪些特征传递至后续节点。 此外,每个操作符均可同时接收来自参数集的属性输入和用户输入。

分支与合并非结构化数据流

在非结构化数据集成流程中使用分支和合并节点来分支流程,并为文档的进一步处理定义条件。 例如,在处理不同语言的文档集时,您可以分支流程,使一种语言的文档经过PII和HAP标注,而其他文档则跳过此步骤。 您还可以使用合并节点将所有分支的输出合并,以便在流程中进行进一步处理。

在非结构化数据流中引入自定义代码
现在您可以使用片段 Python 操作符节点添加自定义数据处理代码,或构建专属的自定义操作符节点。这些节点可通过用户界面上传,并在流程中与预定义操作符协同使用。
分类文档节点

使用预定义的文档类别对文档中的文本进行分类,并识别文档中的数据是否符合特定键值对格式,以确保文本能正确提取到实体表的字段中。

实体策展节点

将提取的实体整理为与目标表模式兼容的结构化格式。 此操作符用于非结构化数据整理流程。

新建生成输出节点类型
现在您可以使用 Milvus 或 Elasticsearch 存储向量嵌入,并通过实体存储节点将提取的实体存储在结构化实体表中。
更新
本次发布引入了以下更新:
  • 现在您可以添加标签,这些标签有助于查找和识别非结构化数据集成流程。
  • 当您的流程准备就绪后,即可将其提升至部署空间。