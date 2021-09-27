Spark 对现代数据堆栈至关重要。因此，为 Spark 环境配置适当级别的可观测性极为重要。监控 Spark 有多种选择，包括可提供预配置 Spark 和 Spark SQL 指标仪表板的 SaaS 程序。如果这还不够呢？

典型的 Spark 应用程序设置，无论是自托管还是托管解决方案，通常都包含用于监控集群运行状况的操作仪表板。这些仪表板虽然实用，但只能提供基础设施概览，而非与数据相关的实际指标。确实，当 CPU 使用率增加或集群 RAM 不足时，我们可以推测应用程序可能出现问题，但当数据源改变了模式或来自其他部门的数据损坏时，这些也无济于事。工程师面临的大多数问题是由数据而非底层基础设施引起的，因此他们必须花费大量时间来重现问题，或像侦探一样反复检查文件和存储桶。这正是应用程序监控能发挥作用的地方。

不同场景需要不同层次的可见性，数据工程师需要具备比执行指标更深一层的洞察力。否则，您可能要耗费大量时间来调试 Spark 中的数据质量问题。

在本指南中，您将了解如何为 Spark 实现高层与低层的数据可观察性。高层可观测性需要使用 Spark 的内部系统，例如侦听器 API 和查询执行侦听器。实现低层可观测性，需要学习如何使用库来跟踪数据质量指标。

掌握这两类方法后，您便可以根据具体问题选择最适合的解决方法。