Integrasi observabilitas Apache Airflow
Jelajahi dokumentasi Pesan demo langsung
ilustrasi proses Apache Airflow

Untuk mencapai observabilitas dan pemantauan Apache Airflow yang berkelanjutan, IBM® Databand® menghadirkan integrasi Airflow yang mulus.

Kesehatan data Anda lebih rumit daripada kegagalan tugas atau proses. Anda harus ketahui bahwa pipeline Airflow Anda akan mengirimkan data yang lengkap dan akurat tepat waktu. Yang lebih penting lagi, Anda memerlukan peringatan mengenai masalah kualitas data sebelum berdampak pada konsumen hilir.

Mengintegrasikan lingkungan Airflow Anda dengan IBM Databand menghadirkan observabilitas Airflow yang berkelanjutan. Dengan memusatkan metadata, log, dan status pipeline, Databand memberikan insight yang Anda perlukan untuk secara konsisten mengirimkan data berkualitas tinggi.

Contoh kasus
Amati dan pantau kluster Airflow

Databand terintegrasi dengan kluster Airflow terkelola yang paling populer, termasuk Google Cloud Composer, Astronomer, dan Amazon MWAA.

Dapatkan peringatan secara proaktif terhadap insiden pipeline data

Analisis dan dapatkan peringatan anomali metadata atau data yang hilang, lalu lacak akar masalah kegagalan pipeline, masalah kualitas data, dan dampak masalah pada pengiriman data Anda.

Sentralisasikan metadata pipeline untuk pelacakan berkelanjutan

Dengan gambaran menyeluruh dari semua instans Airflow Anda, Databand memudahkan untuk melacak status pipeline, durasi proses, volume data, dan metrik kualitas data.

Tingkatkan kesehatan pipeline data

Dapatkan visibilitas di seluruh DAG, aliran data, dan tingkat infrastruktur untuk keandalan pipeline yang lebih baik.

Cara kerjanya

Databand menyediakan berbagai fungsi pemantauan, peringatan, dan analitis yang membantu Anda memantau kesehatan dan keandalan DAG Airflow Anda. Dengan memungkinkan Anda memantau beberapa instans Airflow, Databand menghadirkan sistem pelacakan terpusat untuk DAG di seluruh perusahaan.

Integrasi dengan konektor Airflow Databand melibatkan proses tiga langkah sederhana:

  1. Instal paket Python dbnd-airflow-auto-tracking Databand di kluster Airflow Anda
  2. Konfigurasikan Airflow Syncer baru untuk membuat Airflow Syncer di UI Databand Anda
Kemampuan

Rangkaian kemampuan Databand yang komprehensif membantu menyederhanakan dan memusatkan observabilitas Apache Airflow Anda.

Observabilitas data-dalam-gerak

Dengan peringatan pencegahan yang kuat, pantau terus pipeline Airflow yang berisiko terlambat pengiriman karena durasi tugas yang lama. Selain itu, temukan anomali dalam volume data dan dapatkan visibilitas tentang masalah kualitas data, seperti gangguan perubahan pada struktur kumpulan data Anda oleh sumber yang biasanya tidak terdeteksi.

Analisis akar masalah

Peringatan membawa Anda langsung ke tempat terjadinya insiden sehingga Anda dapat melakukan investigasi di inti masalah dan mengurangi waktu penyelesaian teknis. Semua yang Anda perlukan untuk mengungkap akar masalah suatu masalah ditemukan di satu dasbor yang mudah digunakan, termasuk input dan output pipeline, jejak kesalahan, log, sumber data, parameter, xcoms, dan metrik pengguna.

Visibilitas 360

Dengan semua aktivitas observabilitas Airflow di satu tempat, dasbor Databand yang komprehensif memudahkan untuk menyorot semua metrik penting untuk setiap DAG Airflow berisiko tinggi Anda. Visualisasi dan bagan aset data penting memungkinkan Anda melihat apakah metrik pipeline berada dalam rentang yang tepat dan apakah throughput Airflow sesuai jadwal untuk dikirimkan.

Ambil langkah selanjutnya

Terapkan observabilitas data proaktif dengan IBM Databand hari ini sehingga Anda dapat mengetahui kapan ada masalah kesehatan data sebelum pengguna Anda melakukannya.

Pesan demo langsung
Penelusuran lainnya Dokumentasi Posting blog Pusat demo Sumber daya