数据管道可观测性是指随时监控和了解数据管道状态的能力。具体而言,可观测性提供了对管道内部状态及其与系统输出的交互方式的洞察分析。
我们认为,全球的数据管道需要更好的数据可观察性。但不幸的是,当今数据工程中的情况几乎无法观察。多数数据管道旨在移动数据而非监控。用于测量,但不追踪。用于转型,但不告知。其结果便是臭名昭著的黑匣案例。
您知道传入了什么。您也知道传出了什么。但二者之间会出现哪些情况?以及,为何会出现此差异?遗憾的是,多数管道均非旨在解决这些未解之谜。多数管道是针对最佳情况而设计的。
然而,现实当然会更多地受到墨菲定律的支配,而在黑匣的输出端,您常会看到很多奇怪的值和神秘的失列缺。为此,数据工程师感到十分困惑,但他们意识到必须先观察才能进行校正。
本指南涵盖以下要点:
“可观测性”已成为一个流行词,因此最好将其定义为:数据可观察性是监控和改进应用程序与系统(如数据管道)中数据运行状况的总称。
“数据监控”可让您了解数据管道或数据的当前状态。它会告知您数据是否完整、准确和最新。它还会告知您管道是成功还是失败了。数据监控可告知您设备是正常工作还是出现故障;但除此之外,它不会提供太多背景信息。
因此,监控只是可观测性的其中一项功能。“数据可观察性”是一个总括性术语,它包括:
可观测性不仅涵盖一项活动(监控),而是涵盖一系列活动,因此对工程师来说有用得多。数据可观察性并不止于描述问题。它可提供背景信息和建议,以帮助解决问题。
IBM Databand 联合创始人兼首席技术官 Evgeny Shulman 解释道:“数据可观察性比监控更为深入,它可为系统指标添加更多背景信息、提供更深入的系统运行视图,并指示工程师是否需介入并应用修复。”“换言之,虽然监控会告知您某些微服务正在消耗一定数量的资源,但可观测性则会告知其当前状态与严重故障相关,因而您需要进行干预。”
此主动方法对于数据管道尤为重要。
数据管道可观测性是指能在任意时间点监控和了解数据管道的状态,尤其是基于系统输出的各种内部状态。它超越了基本监控,可提供对数据在管道中如何移动和转换的更深入洞察,且常与指标、日志记录与跟踪数据管道相关联。
数据管道通常涉及收集、转换和存储数据的一系列阶段。其中可能包括从不同来源提取数据、数据清理、数据转换(如聚合),以及将数据加载到数据库或数据仓库等流程。每个阶段均可能存在不同的行为和潜在问题,而它们会影响系统的数据质量、可靠性和整体性能。
通过可观测性可了解数据管道的每个阶段如何运作,及其内部工作如何与特定类型的输出(尤其是未提供所需性能、质量或准确性水平的输出)相关联。这些洞察信息有助于数据工程团队了解问题所在并进行修复。
数据管道可观测性至关重要,因为管道已从复杂变为极其复杂—从众多并发系统发展到众多相互依赖的系统。
出现数据质量问题和管道故障的一大原因在于这些管道内的转换。如今,多数数据架构均非透明—您无法判断内部出现的情况。转型在发生,但当结果不符合预期时,数据工程师对背后的原因便了解不多。
太多 DataOps 团队花费了太多时间来试图在缺少背景信息的情况下诊断问题。而且,如果您跟随自己的直觉并使用软件应用性能管理工具来监控 DataOps 管道,则很难奏效。
Evgeny 表示:“数据管道的行为与软件应用程序和基础设施截然不同。”“数据工程团队可以深入了解高级作业(或 DAG)状态和摘要数据库性能,但对管理其管道所需的适当信息级别却缺乏可见性。此差距导致很多团队需花费大量时间来跟踪问题,或在持续的偏执状态下工作。”
拥有更庞大、更专业的数据团队可能会有所帮助,但如果这些团队成员不进行协调,则可能会造成损害。访问数据并运行自己的管道和转换的更多人员,会导致错误并影响数据稳定性。
如今,越来越多的工程师开始关注数据稳定性,以及他们的数据是否适合客户在企业内外使用。因此,越来越多的团队会对数据可观察性感兴趣。
数据可观察性通过提供有关数据从开始到结束的流动与处理方式的洞察,来与您的数据管道协同工作。对数据可观察性在数据管道中工作原理的更详细说明如下:
数据可观察性平台可提供单独的监控工具无法提供的洞察分析。它们不仅会告知您出了什么问题,还会告知您它导致了哪些问题并提供线索,甚至是如何修复此问题的下一最佳行动方案。它可持续完成这些工作,而无需重新构建当前的管道或像先前一样“在飞行中更换引擎”。
您的数据管道是复杂的系统,它们需要能进行持续侦查的数据可观察性架构。您需要一个用于端到端监控的可观测性平台,以便了解出现故障的位置和原因。您需要一种方法来跟踪下游依赖关系,并知道而不是希望,您的修复方案已解决根本问题。
数据可观察性平台应包括:
该平台还应提供充分的规范性指导。数据可观察性和数据工程领域发展迅速,找到一个能与您的问题同步快速发展的平台是最佳途径之一。仅仅监控已不够。您必须观察、追踪、发出警报并做出反应。
了解 IBM Databand 如何通过提供数据管道监控功能,来快速检测任务故障或运行失败等数据事件,以便企业应对管道增长。如果您准备深入了解,请立即预约演示。
设计数据战略,消除数据孤岛、降低复杂性并提高数据质量,以获得卓越的客户和员工体验。
watsonx.data 支持您通过开放、混合和已治理数据,利用您的所有数据(无论位于何处)来扩展分析和 AI。
通过 IBM® Consulting 发掘企业数据的价值,建立以洞察分析为导向的组织,实现业务优势。