更新与变更内容 Unstructured Data Integration

Unstructured Data Integration 更新可能包含新功能和修复。版本按倒序排列，因此最新版本位于主题开头。

您可以在. 最新动态 IBM Software Hub处查看该平台及所有服务的新功能列表。

安装或升级 Unstructured Data Integration

准备好安装或升级了吗 Unstructured Data Integration？

要安装 Unstructured Data Integration 其他 IBM® Software Hub 服务，请参阅《安装指南 IBM Software Hub》。
要升级 Unstructured Data Integration 其他 IBM Software Hub 服务，请参阅升级指南 IBM Software Hub。
要安装或升级 Unstructured Data Integration 作为的一部分，请参阅 watsonx.data watsonx.data™ integration集成。
请注意：与实例相关的所有 IBM Software Hub 组件 IBM Software Hub 必须安装相同版本。

IBM Software Hub 版本 5.3.1

新版于 2026年2 Unstructured Data Integration 月发布， 5.3.1IBM Software Hub 包含以下内容：

操作数版本： 5.3.1

此发行版包括下列更改：

更新

本次发布引入了以下更新：

增量摄取现已支持 FileNet,Microsoft OneDrive 和. Unstructured Data Integration中的 SharePoint 文档。

本次版本修复的问题

本次发布修复了以下问题：

Slack 不支持对非结构化数据进行增量摄取
语言标注器在处理未知语言的文档时会显示警告或错误信息
Milvus 节点因字符长度异常而失败

本次版本修复了客户报告的问题

有关本次发布中修复的客户报告问题的列表，请参阅修复清单 IBM Cloud Pak for Data 支持 IBM 网站上的。

本次版本修复的安全问题

本次发布修复了以下安全问题：

CVE-2024-29041, CVE-2025-4598, CVE-2025-6965, CVE-2025-9230, CVE-2025-9714, CVE-2025-15284, CVE-2025-50181, CVE-2025-50182, CVE-2025-64756, CVE-2025-65945, CVE-2025-66414, CVE-2025-66418, CVE-2025-66471, CVE-2025-67735, CVE-2025-68973, CVE-2026-0621, CVE-2026-21441, CVE-2026-22036

不推荐使用的功能

以下功能在本版本中已弃用：

对基础文档集的支持将在即将发布的版本中终止。
更新任何包含基础文档集的项目归档：
1. 导入项目归档文件，将基础文档集转换为文档集。
2. 再次导出项目。

IBM Software Hub 版本 5.3.0

新版于 2025年 Unstructured Data Integration 12月发布， 5.3.0IBM Software Hub 包含。

操作数版本： 5.3.0

此发行版包括下列更改：

新功能

本次版本 Unstructured Data Integration 包含以下功能：

Unstructured Data Integration 现已成为 IBM watsonx.data integration

您现在可以在安装包 IBM watsonx.data integration 中 Unstructured Data Integration 安装。

针对非结构化数据集成流的改进日志记录与调试功能

运行流程时，您现在可通过每个节点的专用面板监控节点进度、查看日志详情及节点运行摘要，从而轻松排查问题：

查看并复制日志详情。
检查每个节点的运行状态，查看详细信息及以表格形式呈现的输出特征。

基于元数据的操作符属性面板

每个非结构化数据集成操作符的属性面板现显示输入特征——这些特征由前置操作符添加的所有特征按降序排列累积而成，同时提供可编辑的输出特征列表，用户可在此决定将哪些特征传递至后续节点。此外，每个操作符均可同时接收来自参数集的属性输入和用户输入。

分支与合并非结构化数据流

在非结构化数据集成流程中使用分支和合并节点来分支流程，并为文档的进一步处理定义条件。例如，在处理不同语言的文档集时，您可以分支流程，使一种语言的文档经过PII和HAP标注，而其他文档则跳过此步骤。您还可以使用合并节点将所有分支的输出合并，以便在流程中进行进一步处理。

在非结构化数据流中引入自定义代码

现在您可以使用片段 Python 操作符节点添加自定义数据处理代码，或构建专属的自定义操作符节点。这些节点可通过用户界面上传，并在流程中与预定义操作符协同使用。

分类文档节点

使用预定义的文档类别对文档中的文本进行分类，并识别文档中的数据是否符合特定键值对格式，以确保文本能正确提取到实体表的字段中。

实体策展节点

将提取的实体整理为与目标表模式兼容的结构化格式。此操作符用于非结构化数据整理流程。

新建生成输出节点类型

现在您可以使用 Milvus 或 Elasticsearch 存储向量嵌入，并通过实体存储节点将提取的实体存储在结构化实体表中。

更新

本次发布引入了以下更新：

现在您可以添加标签，这些标签有助于查找和识别非结构化数据集成流程。
当您的流程准备就绪后，即可将其提升至部署空间。