Ilustración de Apache Airflow proceso

Para lograr una Apache Airflow continua Observabilidad y monitorización, IBM Databand tiene la característica de una integración de Airflow sin fisuras.

El estado de los datos es más complicado que un error de tarea o ejecución. Necesita saber que sus tuberías Airflow entregarán datos completos y precisos a tiempo. Lo más importante es que necesita alertas sobre problemas de calidad de los datos antes de que afecten a los consumidores finales.

La integración de sus entornos de flujo de aire con IBM Databand ofrece una observabilidad continua del flujo de aire. Al centralizar los metadatos, los registros y los estados de las canalizaciones, Databand proporciona la información que necesita para entregar datos de alta calidad de forma constante.

Cómo funciona

Databand proporciona varias funciones de monitoreo, alertas y análisis que lo ayudan a monitorear el estado y la confiabilidad de sus DAG de flujo de aire. Al permitirle monitorear múltiples instancias de Airflow, proporciona un sistema de seguimiento centralizado para DAG de toda la compañía.

La integración con el conector de flujo de aire de Databand implica un proceso simple de tres pasos:

  1. Instale el paquete de Python dbnd-airflow-auto-tracking de Databand en su clúster de Airflow
  2. Configure un nuevo Airflow Syncer para crear un Airflow Syncer en su Databand interfaz de usuario (IU)
capacidades

Databandamplio conjunto de capacidades ayuda a simplificar y centralizar su Apache Airflow Observabilidad.

Observabilidad de datos en movimiento

Con poderosos alertas preventivas, mantener al tanto de las tuberías de Airflow que corren el riesgo de demoras en las entregas debido a la larga duración de las tareas. Además, descubra anomalías en el volumen de datos y obtenga visibilidad de los problemas de calidad de los datos, como los cambios importantes en la estructura de su conjunto de datos por parte de fuentes que normalmente pasan desapercibidas.

Análisis Principal de la Causa

Las alertas le llevan directamente al lugar donde se produce un incidente para que pueda perforar bajo la superficie y reducir el tiempo medio de resolución de la ingeniería. Todo lo que necesita para descubrir la causa principal de un problema se encuentra en un solo panel fácil de usar, que incluye entradas y resultados de canalización, seguimientos de errores, registros, fuente de datos, parámetros, xcom y métricas de usuario.

Visibilidad de 360 grados

Con todas sus actividades de Observabilidad de Flujo de Aire en un solo lugar, el panel integral de Databandfacilita resaltar todas las métricas importantes para cada uno de sus DAG de flujo de aire de alto riesgo. Las visualizaciones y gráficos de su activo de datos críticos le permiten ver si las métricas de la canalización están en los rangos correctos y si el rendimiento de Airflow está programado para la entrega.

Dé el siguiente paso

Implemente la observabilidad proactiva de los datos con IBM Databand hoy para que pueda saber cuándo hay un problema de estado de datos antes que sus usuarios.

agende una demostración en tiempo real
Más formas de explorar Documentación entrada en el blog Centro de demostraciones Recursos