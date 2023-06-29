قابلية ملاحظة مسار البيانات هي قدرتك على مراقبة وفهم حالة مسار البيانات في أي وقت. على وجه التحديد، توفر قابلية الملاحظة رؤى حول الحالات الداخلية للمسار وكيفية تفاعلها مع مخرجات النظام.
نعتقد أن مسارات بيانات العالم بحاجة إلى مستوى أفضل من قابلية ملاحظة البيانات. ولكن لسوء الحظ، فإن القليل جدًا مما يحدث في مجال هندسة البيانات اليوم يمكن ملاحظته. تم تصميم معظم مسارات البيانات للحركة ولكن ليس للمراقبة. للقياس، ولكن ليس التتبع. للتحول، ولكن ليس لتوفير معلومة. والنتيجة هي حالة الصندوق الأسود سيئة السمعة.
أنت تعرف ما يدخل. أنت تعرف ما يخرج. ولكن ماذا يحدث بينهما؟ ولماذا التناقض؟ للأسف، هذه ألغاز لم تُبنَ معظم المسارات لحلها. وقد صُمم معظمها ليناسب أفضل سيناريو.
ومع ذلك، فإن الواقع يحكمه بالطبع قانون مورفي بشكل أوثق، وعلى جانب المخرجات من الصندوق الأسود، سترى غالبًا مجموعة من القيم الغريبة والأعمدة المفقودة الغامضة. يقع مهندسو البيانات في الحيرة ويدركوا أنه لكي يتم التصحيح، يجب عليك الملاحظة أولاً.
سيغطي هذا الدليل النقاط التالية:
أصبحت "قابلية الملاحظة" كلمة رائجة إلى حد ما، لذا من الأفضل على الأرجح تعريفها: قابلية ملاحظة البيانات هي المصطلح العام لمراقبة وتحسين السلامة للبيانات داخل التطبيقات والأنظمة مثل مسارات البيانات.
تتيح لك "مراقبة البيانات" معرفة الحالة الحالية لمسار بياناتك أو بياناتك نفسها. تخبرك ما إذا كانت البيانات كاملة ودقيقة وحديثة. تخبرك بما إذا كانت مساراتك قد نجحت أو فشلت. يمكن أن تُظهر لك مراقبة البيانات ما إذا كانت الأشياء تعمل أو معطلة، ولكنها لا تمنحك الكثير من السياق خارج ذلك.
وبالتالي، فإن المراقبة هي وظيفة واحدة فقط من وظائف قابلية الملاحظة. "قابلية ملاحظة البيانات" مصطلح شامل يشمل:
من خلال شمولها ليس فقط نشاطًا واحدًا - المراقبة - بل مجموعة من الأنشطة، فإن قابلية الملاحظة أكثر فائدة للمهندسين. لا تتوقف قابلية ملاحظة البيانات عند وصف المشكلة. بل توفر سياقًا واقتراحات للمساعدة في حلها.
"تتجاوز قابلية ملاحظة البيانات المراقبة من خلال إضافة المزيد من السياق للمقاييس، وتوفير رؤية أعمق للعمليات، وتحديد ما إذا كان المهندسون بحاجة للتدخل وتطبيق الإصلاح"، يوضح Evgeny Shulman، المؤسس المشارك والمدير التقني لشركة IBM Databand. "بعبارة أخرى، بينما تخبرك المراقبة أن بعض الخدمات المصغرة تستهلك عدداً معينا من الموارد، تخبرك قابلية الملاحظة أن حالتها الحالية مرتبطة بأعطال حساسة، ويجب عليك التدخل."
هذا النهج الاستباقي مهم بشكل خاص عندما يتعلق الأمر بمسارات البيانات.
تشير قابلية الملاحظة إلى القدرة على مراقبة وفهم حالة مسار البيانات في أي وقت، خاصةً فيما يتعلق بحالاته الداخلية، استنادًا إلى مخرجات النظام. وتتجاوز المراقبة الأساسية لتوفر فهماً أعمق لكيفية تحرك البيانات وتحويلها في المسار، وغالباً ما ترتبط بمقاييس وتسجيل وتتبع مسارات البيانات.
غالبا ما تتضمن مسارات البيانات سلسلة من المراحل حيث يتم جمع البيانات وتحويلها وتخزينها. قد يشمل ذلك عمليات مثل استخراج البيانات من مصادر مختلفة، وتنقية البيانات، وتحويل البيانات (مثل التجميع)، وتحميل البيانات في قاعدة بيانات أو مستودع بيانات. كل من هذه المراحل يمكن أن يكون لها سلوكيات مختلفة ومشاكل محتملة تؤثر على جودة البيانات وموثوقيتها والأداء العام للنظام.
قابلية الملاحظة توفر رؤى حول كيفية عمل كل مرحلة من مراحل مسار البيانات، وكيف ترتبط أعمالها الداخلية بأنواع محددة من المخرجات — خاصة تلك التي لا توفر مستويات الأداء أو الجودة أو الدقة المطلوبة. تتيح هذه الرؤى لفرق هندسة البيانات فهم ما حدث من الخطأ وإصلاحه.
تعتبر قابلية ملاحظة مسارات البيانات مهمة لأن المسارات قد تحولت من مركّبة إلى معقدة - من العديد من الأنظمة المتزامنة إلى العديد من الأنظمة المترابطة.
من المرجح أكثر من أي وقت مضى أن التطبيقات لا تحصل على فائدة فقط من مسارات البيانات — بل تعتمد عليها. كما يفعل المستخدمون النهائيون. عندما تعاني شركات مثل AWS من انقطاعات وتختفي لوحات معلومات التطبيقات حول العالم، يمكنك رؤية الإشارات من حولك على أن التعقيد يخلق تبعيات خطيرة.
حالياً، يبلغ معدل نمو صناعة التحليلات مجتمعًا 12% سنوياً. ستبلغ قيمتها المذهلة 105 مليار دولار أمريكي بحلول عام 2027، وفقًا لشركة Gartner - أي ما يقارب حجم الاقتصاد الأوكراني. وبهذا المعدل، يزداد حجم بيانات الشركات حاليًا بمعدل 62% كل شهر. كل تلك الشركات تقوم بتخزين وتحليل كل تلك البيانات؟ إنهم يراهنون بأعمالهم على ذلك وأن مسارات البيانات التي تديرها سوف تستمر في العمل.
أحد الأسباب الرئيسية لمشاكل جودة البيانات وفشل المسارات هو التحولات داخل تلك المسارات. تتسم معظم بنية البيانات اليوم بأنها مبهمة — فلا يمكنك معرفة ما يحدث بداخلها. تحدث التحولات، ولكن عندما لا تأتي الأمور كما هو متوقع، لا يكون لدى مهندسي البيانات الكثير من السياق لمعرفة سبب ذلك.
هناك عدد كبير جدًا من فرق عمليات البيانات تقضي وقتًا طويلاً جدًا في محاولة تشخيص المشكلات دون سياقها. وإذا اتبعت حدسك الأول واستخدمت أداة إدارة أداء تطبيقات برمجية لمراقبة مسار عمليات البيانات (DataOps)، نادراً ما ينجح الأمر.
يقول Evgeny: "تتصرف مسارات البيانات بشكل مختلف تمامًا عن تطبيقات البرامج والبنية التحتية". "يمكن لفرق هندسة البيانات الحصول على رؤى حول حالات الوظائف (أو DAG) عالية المستوى والأداء الملخص لقاعدة البيانات، لكنها تفتقر إلى الرؤية للمستوى المناسب من المعلومات التي تحتاجها لإدارة المسارات الخاصة بها. وتتسبب هذه الفجوة في قضاء العديد من الفرق في وقت طويل في تتبع المشكلات أو العمل في حالة من جنون الارتياب".
يمكن أن يساعد في الأمر وجود فريق بيانات أكبر وأكثر تخصصًا، ولكن قد يضر إذا لم ينسق أعضاء الفريق فيما بينهم. يتسبب وصول المزيد من الأشخاص إلى البيانات وتشغيل المسارات الخاصة بهم وعمليات التحول الخاص بهم في حدوث أخطاء والتأثير على استقرار البيانات.
يتزايد قلق المهندسين اليوم بشأن استقرار البيانات وما إذا كانت بياناتهم صالحة للاستخدام من قِبل مستهلكيها، سواء داخل الشركة أم خارجها. ولذا، فإن المزيد من الفرق مهتمة بقابلية ملاحظة البيانات.
تعمل قابلية ملاحظة البيانات مع مسار البيانات الخاص بك من خلال توفير رؤى حول كيفية تدفق البيانات ومعالجتها من البداية إلى النهاية. فيما يلي شرح أكثر تفصيلاً لكيفية عمل قابلية ملاحظة البيانات ضمن مسار البيانات:
توفر منصات قابلية ملاحظة البيانات رؤى لا تستطيع أدوات المراقبة توفيرها بمفردها. فهي لا تخبرك ببساطة ما هو الخطأ الذي حدث، بل تخبرك بالمشاكل التي تسببها وتقدم لك أدلة وحتى أفضل الإجراءات التالية لكيفية إصلاحها. وهي تفعل ذلك باستمرار، دون الحاجة إلى إعادة تصميم مساراتك الحالية أو "تغيير المحرك أثناء الرحلة" كما كان.
مسارات البيانات لديك عبارة عن أنظمة معقدة وتتطلب بنية قابلية ملاحظة البيانات التي تقوم بتحقيق مستمر. أنت بحاجة إلى منصة قابلية الملاحظة للمراقبة من البداية إلى النهاية حتى تعرف أين فشلت الأمور ولماذا. أنت بحاجة إلى طريقة لتتبع التبعيات النهائية، تحتاج أن تعرف، لا أن تأمل، أن حلك قد عالج المشكلة الجذرية.
يجب أن تتضمن منصة قابلية ملاحظة البيانات ما يلي:
يجب أن توفر المنصة أيضًا الكثير من الإرشادات الإلزامية. مجال قابلية ملاحظة البيانات وهندسة البيانات يتقدم بسرعة، وهو من أفضل الطرق للعثور على منصة تتطور بسرعة مثل مشاكلك. لم تعد المراقبة كافية. يجب عليك الملاحظة ، والتتبع ، والتنبيه ، واتخاذ إجراء.
