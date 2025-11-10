将隐藏的数据流转化为可信的洞察分析：IBM watsonx.data intelligence 中的 OpenLineage
IBM watsonx.data Intelligence 通过自定义沿袭映射扩展其 OpenLineage 支持，这一增强功能揭示了这些隐藏的数据联系。
许多关键数据流通过定制系统、ETL 工具和传统应用程序运行，而标准沿袭解决方案无法自动捕获这些数据流。这些看不见的联系掩盖了依赖关系，减缓了审计速度，削弱了治理和 AI 准备能力。
自动化扫描程序涵盖许多现代平台，但企业的大部分数据旅程仍然在自定义脚本、管道和旧版系统中进行。这些看不见的活动使沿袭情况变得支离破碎，使得追踪依赖关系或理解下游影响变得困难。
结果是数据旅程呈现出碎片化，存在盲点，这些盲点掩盖了依赖关系，减缓了审计速度，并削弱了人们对分析和 AI 计划的信心。
IBM watsonx.data intelligence 中的自定义沿袭映射可将沿袭扩展到自动化扫描程序之外，揭示现代系统、自定义系统和旧版系统中隐藏的数据流。
此增强功能建立在 OpenLineage 标准之上，允许团队将每个数据集、工作和转型连接成一个统一、受管控的视图，从而为团队提供更快行动的清晰度和信心。
其结果是一个透明的端到端数据依赖关系和转型图，使领导者能够从容自信地加强治理、加快审计、推进分析和 AI 准备。
自定义沿袭映射将三者的优点结合在一起：来自扫描程序的自动化沿袭、现有 OpenLineage 生产者生成的沿袭，以及通过 OpenLineage 有效载荷定义的自定义沿袭。
IBM watsonx.data intelligence 使用 OpenLineage，这是一种开放标准，用于描述数据在运行时或设计时如何移动。它允许组织定义血统事件，包括自定义和旧版系统，并将它们整合成统一、受管控的血统图，揭示数据在整个数据旅程中的移动和转化。
每个 OpenLineage 事件都描述了数据的移动方式：它读取的输入、转换数据的作业以及它产生的输出。这些事件可以通过 dbt 或 Airflow 等工具自动生成，或者客户也可以决定是针对专有环境和旧版环境自动发出这些事件，还是手动记录这些事件。导入后，watsonx.data Intelligence 会将这些事件与已知资产进行对齐，并在更广泛的谱系视图中对其进行可视化。
为了确保准确性和一致性，watsonx.data intelligence 提供了两种核心机制：
因此，自定义沿袭映射可提供一个受控的统一图形，其中集成了自动化和自定义沿袭。
自定义沿袭映射缩小了企业数据理解方面的可见性差距，为组织提供每个数据流（无论数据源自何处）的清晰、互联的视图，以便团队充满信心地采取行动。
每个依赖准确、可解释数据的团队都能享受到以下好处：
IBM 选择了 OpenLineage（由 Linux Foundation AI and Data 组织维护的开放标准），以确保整个数据生态系统的互操作性和透明度。
OpenLineage 提供了企业所需的灵活性、可扩展性和免于锁定的自由度，而 watsonx.data intelligence 则增加了 IBM 的治理、安全和企业整合功能。
IBM 基于 OpenLineage 构建，摒弃了专有格式，并通过开放标准帮助客户利用在沿袭文档方面的投资为未来提供保障。
借助自定义沿袭映射，IBM watsonx.data intelligence 使组织能够在自动化、自定义和旧版系统中查看和信任整个数据故事。
其成果如何？基于开放标准和企业信任，实现更强大的治理能力、更快的影响力分析和更可靠的 AI 决策。
随着生态系统继续发展，IBM 的承诺保持不变：帮助组织将隐藏的复杂性转化为可靠的数据驱动的决策。
