IBM Databandは、データ品質の低さの問題を検出する、信頼性の高いリアルタイムのデータ品質の監視機能を提供します。
データの問題は表面化しないことが多いため、データ・エンジニアリング・チームは、あるポイントから次のポイントまで、データ・パイプラインを実行するだけでは不十分であることを理解しています。しかし、配信データに含まれる行と値は何千にも及ぶため、データ自体の遅延や品質の低下、変動性が見落とされることはよくあります。
IBM Databandのデータ品質の監視機能は、お客様のデータ・パイプラインとデータ・セットに接続して、スキーマの変更や重複、NULL値、データ鮮度に関する問題に対してアラートを通知します。また、データ・セットを経時的に視覚化できるため、傾向を分析し、早急な対応が必要なデータ品質のパターンを見つけることができます。
Databandが列レベルの変更や不規則な値、その他のプロファイリングの異常が発生した場合に通知するため、データ品質の向上を図れます。
データ鮮度に関するルールを設定することで、データ・セットが保証されたサービス・レベル(SLA)の期間内に更新されなかった場合にこれを把握できます。
データ品質のエラーが発生した場合に、依存するタスクとデータ・セットを特定できるため、透明性の確保や修復作業の優先順位付けに役立ちます。
Databandがデータ品質アラートを統合ビューに一元的に表示するため、データ健全性の全体像を把握できます。アラートの詳細を掘り下げて、コンテキストを把握し、問題を迅速に解決します。
読み書きされた行と運用に関する傾向レベルの日次のグラフを取得できます。最も重要なパイプラインとデータ・セットを並べ替えて、問題のあるパターンを特定できます。Databandが、予期しない件数の変化を検出し、強調表示します。
データ品質の問題が発生した場合に、Databandのエンドツーエンドのリネージュが、影響を受ける依存データ・セットとパイプラインを明確に示し、必要なときに全体像を把握できます。
Databandは、データ・パイプラインとの統合や、すでに利用されているApache AirflowやIBM DataStageなどの統合ツールとの連携を通じて、お客様のデータ・ファブリックと最新のデータ・スタック全体に対する継続的なデータ・オブザーバビリティーを提供します。