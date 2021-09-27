Spark es crítico para la pila de datos modernos. Como tal, es extremadamente importante tener el nivel adecuado de observabilidad para sus entornos Spark. Hay muchas opciones para monitorear Spark, incluidos los programas SaaS que le proporcionan paneles preconfigurados para las métricas de Spark y Spark SQL. ¿Y si eso no es suficiente?

La configuración típica de una aplicación Spark, ya sea una solución autoalojada o gestionada, incluye algunos paneles operativos para monitorear el estado del clúster. Pero aunque esos paneles son muy útiles, solo nos brindan una visión general de la infraestructura y no las métricas reales relacionadas con los datos. Sí, podemos suponer que puede haber algún problema con la aplicación cuando la CPU ha aumentado el uso o el clúster se está quedando sin RAM, pero no ayuda cuando la fuente cambió el esquema o los datos que provienen de otro departamento no sirven. La mayoría de los problemas a los que se enfrentan los ingenieros están causados por los datos y no por la infraestructura subyacente, por lo que tienen que dedicar mucho tiempo a reproducir los problemas o a manipular archivos y buckets como si fueran detectives. Aquí es donde el seguimiento real de la aplicación puede ayudar.

Cada situación requiere un nivel diferente de visibilidad, y los ingenieros de datos deben tener la capacidad de ir más allá de las métricas de ejecución. De lo contrario, puede dedicarse una cantidad significativa de tiempo a depurar problemas de calidad de datos en Spark.

En esta guía, aprenderá a obtener niveles altos y bajos de observabilidad de los datos para Spark. Para los de alto nivel, utilizará los sistemas internos de Spark, como las API de oyentes y Query Execution Listeners. Para el nivel bajo, aprenderá a usar bibliotecas para realizar un seguimiento de las métricas de calidad de los datos.

Después de aprender a hacer ambas cosas, tendrá la opción de elegir la que mejor funcione para el problema que está tratando de resolver.