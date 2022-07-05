لقد أصبح نموذج البنية السحابية الأصلية موجودًا منذ فترة ليست بالقصيرة. في صميم البنية السحابية الأصلية توجد عناصر متماسكة وظيفية متماسكة ومستقلة تُعزّز رشاقة الأعمال وقابلية التوسع والمرونة — ما يسهم في تسريع الوصول إلى السوق، وتحقيق مزايا تنافسية، وتحسين التكاليف. وقد جرى دعم هذا النموذج بصورة فاعلة عبر منظومة تقنية متعددة اللغات (polyglot).
لكن الحلول التي تُبنى اعتمادًا على هذا المزيج من البنية المعمارية والمنظومة التقنية قد تصبح معقدة في الصيانة والإدارة، خصوصًا بسبب العدد الكبير من المكوّنات وتعدد الأطر التقنية اللازمة لتحقيقها. كما أن التطبيق غير الأمثل لممارسات التصميم والهندسة يضاعف تعقيد هذه الحلول ومخاطر صيانتها بشكل كبير.
تُعد المرونة إحدى الممارسات الهندسية التي قد تحسم نجاح أو فشل أي مبادرة للتحول الرقمي. وكما تعلم، تسهم المرونة مباشرة في توافر الحل ككل عبر مؤشرات مثل متوسط زمن التعافي (MTTR) ومتوسط الزمن بين الأعطال (MTBF)، كما تؤثر مباشرة في جودة تجربة المستخدم التحويلية، سلبًا أو إيجابًا.
والمرونة، ببساطة، هي قدرة النظام على الصمود أمام الأعطال والاستمرار في العمل. ورغم أن الأعطال قد تظهر في النهاية على هيئة أخطاء أو عدم توافر أحد المكوّنات/النظام، فإن عدد العوامل التي قد تؤدي إلى الأعطال في نظام موزع سحابة أصلية كبير ومتعدد.
توجد بالفعل مواد كثيرة تركز على كيفية تطبيق المرونة في تطبيقات السحابة الأصيلة. وتقدم ممارسة Build for Reliability Garage من IBM مدخلًا ممتازًا وإطارًا لتطبيق المرونة. كما توجد أطر مثل Chaos Monkey وأدوات مثل Gremlin تساعد على اختبار مرونة التطبيقات.
لكن يبقى التحدي قائمًا: كيف نتحقق من أن الحل مرن بما يكفي؟ وبشكل أدق: كيف نتأكد من أن اختباراتنا تغطي السيناريوهات اللازمة والكافية؟ وكيف نعرف أي أعطال ينبغي إحداثها عمدًا؟
نقترح لمعالجة هذا التحدي نهجًا من أربع خطوات على النحو التالي:
يمكن القيام بذلك عبر تحديد "مسارات اجتياز فريدة" — أي تسلسل/تركيبة استخدام مكوّنات الحل لدعم سيناريوهات وظيفية محددة. وتوفر هذه السيناريوهات والمكوّنات الداعمة مجموعة الأساس التي ينبغي اختبارها.
على سبيل المثال، قد يدعم تطبيقك واحدًا أو أكثر مما يلي:
بعد تحديد السيناريوهات والمكوّنات، تتمثل الخطوة التالية في تحديد ما الذي يمكن أن يتعطّل في هذه المكوّنات. لنأخذ مثالًا على خدمة مُصغَّرة واحدة بالخصائص التالية:
يمكن تكوين هذا التصور عبر تحديد "مناطق الفشل" كما يلي:
قد تتعطّل كل "منطقة فشل" تم تحديدها في الخطوة السابقة لأسباب متعددة — وهذا ما نحتاج إلى تحديده بعد ذلك. وبالاستمرار في المثال نفسه، فإن ربط مناطق الفشل بالأسباب المحتملة قد ينتج القائمة التالية:
يمكن استخدام الأسباب ومناطق الفشل لإنشاء مصفوفة كما هو موضح أدناه. ويتيح لنا ذلك الآن فهم التوليفات التي ينبغي أن نخطط لها عند تنفيذ "هجمات" على الحل. ويمكن بعد ذلك تنفيذ هذه التوليفات باستخدام أطر اختبار الفوضى، كما ذُكر سابقًا.
أخيرًا وليس آخرًا، فإن اختبار الأعطال وحده لن يكون كافيًا. ضع في اعتبارك السيناريوهات التالية:
يتطلب ذلك قدرات إضافية تُكمّل أطر اختبار الفوضى لديك، مثل البنية التحتية كتعليمات برمجية (IaC) أو إعادة التكوين الديناميكي للموارد السحابية.
وبالإضافة إلى ذلك — نظرًا لأن الاختبار الفعلي باستخدام المكوّنات مكلف — قد ترغب أيضًا في النظر في قدرات للتحقق "الثابت"، مثل ما يلي:
وبشكل عام، نرى أن المرونة تتطلب تركيزًا ليس بعد التطوير فقط، بل طوال دورة العمل — بدءًا من تحديد السيناريوهات مبكرًا، وترتيب أولوياتها بناءً على تأثيرها على الأعمال، ثم استخدام مزيج من "الهجمات" الثابتة والديناميكية للتحقق من مرونة المكوّنات والتأكد من صحتها. وسيساعد النهج الذي عرضناه في هذا المنشور على معالجة التحديات الرئيسية المطروحة عبر هذه الرحلة بالكامل.
