ولهذا السبب، يجب على أي مؤسسة تعتبر البيانات مهمة لسير أعمالها -سواء أكانت تستخدمها داخليًا أم تقدمها للعملاء الخارجيين- أن تمارس إدارة جودة البيانات وتنفِّذ إطار عمل لجودة البيانات. هذا هو ما يبدو عليه الأمر: تطوير عمليات وأنماط قابلة للتكرار، ويفضَّل أن تكون آلية، لضمان أن البيانات التي تدخل نظامك وتُسلَّم لاحقًا تتوافق مع ما تتوقعه أنت ومستهلكوك.
وكما يعرف مهندسو البيانات المتقدمون جيدًا، فإن فهم تلك التوقعات يُعَد نصف المعركة. والجزء الأكبر من النصف الآخر يُستغَل في تحويل تلك التوقعات إلى تتبُّع وتنبيهات تساعدك على اكتشاف وإصلاح المشكلات في عمليات إدخال البيانات المعقدة.
في هذا الدليل، نشارك استراتيجيات لضمان أن إدارة جودة البيانات لا تُضاف ببساطة إلى العمليات الثابتة الحالية، بل تُدمج في كل بنية DAG. ولإدارتها بشكل جيد، تحتاج إلى اكتشاف حالات الخلل قبل وقت طويل من دخول البيانات منخفضة الجودة إلى طبقة التحويل.