Integração de observabilidade do Apache Airflow
Explore a documentação Agende uma demonstração em tempo real
ilustração do processo Apache Airflow

Para alcançar a observabilidade e monitoramento contínuos do Apache Airflow, o IBM Databand oferece uma integração do Airflow sem interrupções.

A saúde dos seus dados é mais complicada do que uma falha de tarefa ou execução. Você precisa saber que suas pipelines do Airflow entregarão dados completos e precisos no prazo. Mais importante, você precisa de alertas sobre problemas de qualidade de dados antes que eles afetem os consumidores downstream.

Integrar seus ambientes Airflow com o IBM Databand oferece observabilidade contínua do Airflow. Centralizando metadados de pipeline, logs e status, o Databand fornece insights necessários para entregar consistentemente dados de alta qualidade.

Casos de uso
Observe e monitore clusters do Airflow

O Databand se integra com os clusters gerenciados do Airflow mais populares, incluindo Google Cloud Composer, Astronomer e Amazon MWAA.

Alerte proativamente sobre incidentes na pipeline de dados

Analise e alerte sobre anomalias de metadados ou dados ausentes, depois rastreie a causa raiz das falhas da pipeline, problemas de qualidade de dados e as questões de impacto nas suas entregas de dados.

Centralize metadados do pipeline para rastreamento contínuo

Com uma visão geral de todas as suas instâncias do Airflow, o Databand facilita o rastreamento de status de pipeline, durações de execução, volumes de dados e métricas de qualidade de dados.

Melhore a saúde do pipeline de dados

Proporcione visibilidade em diferentes DAGs, fluxos de dados e níveis de infraestrutura, para aumentar a confiabilidade dos pipelines.

Veja como funciona

O Databand oferece várias funcionalidades de monitoramento, alerta e análise que ajudam a monitorar a saúde e confiabilidade dos seus DAGs do Airflow. Ao permitir que você monitore várias instâncias do Airflow, ele fornece um sistema de rastreamento centralizado para DAGs em toda a empresa.

Integrar com o conector do Airflow do Databand envolve um simples processo de três etapas:

  1. Instale o pacote Python dbnd-airflow-auto-tracking do Databand no seu cluster do Airflow
  2. Configure um novo Sincronizador do Airflow para criar um Sincronizador do Airflow na sua IU do Databand
Capacidades

O conjunto abrangente de recursos do Databand ajuda a simplificar e centralizar sua observabilidade do Apache Airflow.

Observabilidade de dados em movimento

Com alertas preventivos poderosos, mantenha-se a par das pipelines do Airflow que estão em risco de atrasos nas entregas devido à longa duração das tarefas. Além disso, descubra anomalias no volume de dados e ganhe visibilidade sobre questões de qualidade de dados, como mudanças bruscas na estrutura do seu conjunto de dados por fontes que normalmente passam despercebidas.

Análise da causa raiz

Os alertas direcionam você imediatamente ao ponto do incidente, permitindo que você investigue a fundo e reduza o tempo médio de resolução da equipe de engenharia. Tudo o que você precisa para descobrir a causa raiz de um problema está em um único dashboard fácil de usar, incluindo inputs e outputs de pipeline, rastros de erro, logs, fonte de dados, parâmetros, xcoms e métricas de usuário.

Visibilidade de 360 graus

Com todas as suas atividades de observabilidade do Airflow em um só lugar, o dashboard abrangente do Databand facilita destacar todas as métricas importantes para cada um dos seus DAGs críticos do Airflow. Visualizações e gráficos dos seus ativos de dados críticos permitem que você veja se as métricas de pipeline estão nos intervalos corretos e se o rendimento do Airflow está no cronograma para entrega.

Dê o próximo passo

Implemente hoje mesmo a observabilidade proativa de dados com o IBM Databand para saber quando há problemas de integridade de dados antes de chegarem ao conhecimento dos seus usuários.

Agende uma demonstração em tempo real
Outras maneiras de explorar Documentação Postagens do blog Centro de demonstração Recursos