更新与变更内容 Unstructured Data Integration
Unstructured Data Integration 更新可能包含新功能和修复。 版本按倒序排列,因此最新版本位于主题开头。
您可以在. 最新动态 IBM Software Hub处查看该平台及所有服务的新功能列表。
安装或升级 Unstructured Data Integration
准备好安装或升级了吗 Unstructured Data Integration?
- 要安装 Unstructured Data Integration 其他 IBM® Software Hub 服务,请参阅《 安装指南 IBM Software Hub》。
- 要升级 Unstructured Data Integration 其他 IBM Software Hub 服务,请参阅升级指南 IBM Software Hub。
- 要安装或升级 Unstructured Data Integration 作为 的一部分,请参阅 watsonx.data
watsonx.data™ integration集成。请注意: 与实例相关的所有 IBM Software Hub 组件 IBM Software Hub 必须安装相同版本。
IBM Software Hub 版本 5.3.1
新版于 2026年2 Unstructured Data Integration 月发布, 5.3.1IBM Software Hub 包含以下内容:
操作数版本: 5.3.1
此发行版包括下列更改:
- 更新
- 本次发布引入了以下更新:
- 增量摄取现已支持 FileNet,Microsoft OneDrive 和. Unstructured Data Integration中的 SharePoint 文档。
- 本次版本修复的问题
- 本次发布修复了以下问题:
- Slack 不支持对非结构化数据进行增量摄取
- 语言标注器在处理未知语言的文档时会显示警告或错误信息
- Milvus 节点因字符长度异常而失败
- 本次版本修复了客户报告的问题
- 有关本次发布中修复的客户报告问题的列表,请参阅 修复清单 IBM Cloud Pak for Data 支持 IBM 网站上的。
- 本次版本修复的安全问题
- 本次发布修复了以下安全问题:
CVE-2024-29041, CVE-2025-4598, CVE-2025-6965, CVE-2025-9230, CVE-2025-9714, CVE-2025-15284, CVE-2025-50181, CVE-2025-50182, CVE-2025-64756, CVE-2025-65945, CVE-2025-66414, CVE-2025-66418, CVE-2025-66471, CVE-2025-67735, CVE-2025-68973, CVE-2026-0621, CVE-2026-21441, CVE-2026-22036
- 不推荐使用的功能
- 以下功能在本版本中已弃用:
- 对基础文档集的支持将在即将发布的版本中终止。更新任何包含基础文档集的项目归档:
- 导入项目归档文件,将基础文档集转换为文档集。
- 再次导出项目。
- 对基础文档集的支持将在即将发布的版本中终止。
IBM Software Hub 版本 5.3.0
新版于 2025年 Unstructured Data Integration 12月发布, 5.3.0IBM Software Hub 包含。
操作数版本: 5.3.0
此发行版包括下列更改:
- 新功能
- 本次版本 Unstructured Data Integration 包含以下功能:
- Unstructured Data Integration 现已成为 IBM watsonx.data integration
- 您现在可以在安装包 IBM watsonx.data integration 中 Unstructured Data Integration 安装。
- 针对非结构化数据集成流的改进日志记录与调试功能
- 运行流程时,您现在可通过每个节点的专用面板监控节点进度、查看日志详情及节点运行摘要,从而轻松排查问题:
- 查看并复制日志详情。
- 检查每个节点的运行状态,查看详细信息及以表格形式呈现的输出特征。
- 基于元数据的操作符属性面板
每个非结构化数据集成操作符的属性面板现显示输入特征——这些特征由前置操作符添加的所有特征按降序排列累积而成,同时提供可编辑的输出特征列表,用户可在此决定将哪些特征传递至后续节点。 此外,每个操作符均可同时接收来自参数集的属性输入和用户输入。
- 分支与合并非结构化数据流
在非结构化数据集成流程中使用分支和合并节点来分支流程,并为文档的进一步处理定义条件。 例如,在处理不同语言的文档集时,您可以分支流程,使一种语言的文档经过PII和HAP标注,而其他文档则跳过此步骤。 您还可以使用合并节点将所有分支的输出合并,以便在流程中进行进一步处理。
- 在非结构化数据流中引入自定义代码
- 现在您可以使用片段 Python 操作符节点添加自定义数据处理代码,或构建专属的自定义操作符节点。这些节点可通过用户界面上传,并在流程中与预定义操作符协同使用。
- 分类文档节点
使用预定义的文档类别对文档中的文本进行分类,并识别文档中的数据是否符合特定键值对格式,以确保文本能正确提取到实体表的字段中。
- 实体策展节点
将提取的实体整理为与目标表模式兼容的结构化格式。 此操作符用于非结构化数据整理流程。
- 新建生成输出节点类型
- 现在您可以使用 Milvus 或 Elasticsearch 存储向量嵌入,并通过实体存储节点将提取的实体存储在结构化实体表中。
- 更新
- 本次发布引入了以下更新:
- 现在您可以添加标签,这些标签有助于查找和识别非结构化数据集成流程。
- 当您的流程准备就绪后,即可将其提升至部署空间。