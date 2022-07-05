العلامات
نهج من أربع خطوات للتحقق من مرونة التطبيقات السحابية الأصلية

صورة تجريدية مُنشأة رقميًا لمكعبات متعددة بدرجات الأزرق والأرجواني.

كيف تعرف ما إذا كان الحل “مرنًا بالقدر الكافي”، وكيف تتأكد من أن اختباراتك تغطي السيناريوهات اللازمة؟

لقد أصبح نموذج البنية السحابية الأصلية موجودًا منذ فترة ليست بالقصيرة. في صميم البنية السحابية الأصلية توجد عناصر متماسكة وظيفية متماسكة ومستقلة تُعزّز رشاقة الأعمال وقابلية التوسع والمرونة — ما يسهم في تسريع الوصول إلى السوق، وتحقيق مزايا تنافسية، وتحسين التكاليف. وقد جرى دعم هذا النموذج بصورة فاعلة عبر منظومة تقنية متعددة اللغات (polyglot).

لكن الحلول التي تُبنى اعتمادًا على هذا المزيج من البنية المعمارية والمنظومة التقنية قد تصبح معقدة في الصيانة والإدارة، خصوصًا بسبب العدد الكبير من المكوّنات وتعدد الأطر التقنية اللازمة لتحقيقها. كما أن التطبيق غير الأمثل لممارسات التصميم والهندسة يضاعف تعقيد هذه الحلول ومخاطر صيانتها بشكل كبير.

     

    ما المقصود بالمرونة؟

    تُعد المرونة إحدى الممارسات الهندسية التي قد تحسم نجاح أو فشل أي مبادرة للتحول الرقمي. وكما تعلم، تسهم المرونة مباشرة في توافر الحل ككل عبر مؤشرات مثل متوسط زمن التعافي (MTTR) ومتوسط الزمن بين الأعطال (MTBF)، كما تؤثر مباشرة في جودة تجربة المستخدم التحويلية، سلبًا أو إيجابًا.

    والمرونة، ببساطة، هي قدرة النظام على الصمود أمام الأعطال والاستمرار في العمل. ورغم أن الأعطال قد تظهر في النهاية على هيئة أخطاء أو عدم توافر أحد المكوّنات/النظام، فإن عدد العوامل التي قد تؤدي إلى الأعطال في نظام موزع سحابة أصلية كبير ومتعدد.

    توجد بالفعل مواد كثيرة تركز على كيفية تطبيق المرونة في تطبيقات السحابة الأصيلة. وتقدم ممارسة Build for Reliability Garage من IBM مدخلًا ممتازًا وإطارًا لتطبيق المرونة. كما توجد أطر مثل Chaos Monkey وأدوات مثل Gremlin تساعد على اختبار مرونة التطبيقات.

    لكن يبقى التحدي قائمًا: كيف نتحقق من أن الحل مرن بما يكفي؟ وبشكل أدق: كيف نتأكد من أن اختباراتنا تغطي السيناريوهات اللازمة والكافية؟ وكيف نعرف أي أعطال ينبغي إحداثها عمدًا؟

    نقترح لمعالجة هذا التحدي نهجًا من أربع خطوات على النحو التالي:

    1. تحديد السيناريوهات والمكوّنات المعمارية التي يجب اختبار مرونتها

    يمكن القيام بذلك عبر تحديد "مسارات اجتياز فريدة" — أي تسلسل/تركيبة استخدام مكوّنات الحل لدعم سيناريوهات وظيفية محددة. وتوفر هذه السيناريوهات والمكوّنات الداعمة مجموعة الأساس التي ينبغي اختبارها.

    على سبيل المثال، قد يدعم تطبيقك واحدًا أو أكثر مما يلي:

    • البحث في كتالوج المنتجات أو تصفّحه عبر تطبيق قناة يستدعي الخدمات المُصغَّرة في الواجهة الخلفية، والتي تسترجع البيانات من مخزن بيانات دائم.
    • تصحيح العمليات/المخططات المجمعة التي يتم تنفيذها في وقت/تردد محدد مسبقاً.
    • الأحداث التي تُنشر على موضوعات مُكوَّنة مسبقًا وتُعالَج بواسطة الخدمات المُصغَّرة المشترِكة.
    • واجهات برمجة تطبيقات (APIs) مكشوفة وتستدعيها أنظمة مستهلكة متعددة.

    2. تحديد نقاط الفشل

    بعد تحديد السيناريوهات والمكوّنات، تتمثل الخطوة التالية في تحديد ما الذي يمكن أن يتعطّل في هذه المكوّنات. لنأخذ مثالًا على خدمة مُصغَّرة واحدة بالخصائص التالية:

    • تتيح واجهة برمجة تطبيقات (API) عبر بوابة.
    • يتم نشرها على إطار عمل حاويات يدعم Kubernetes.
    • تتصل بقاعدة بيانات.
    • تتكامل مع نظام تابع (Downstream).

    يمكن تكوين هذا التصور عبر تحديد "مناطق الفشل" كما يلي:

    مخطط يوضّح بنية طبقية للخدمات المُصغَّرة. في الوسط مربع أصفر بعنوان "Core"، تحيط به طبقة رمادية بعنوان "Microservice Pod". وخارجها طبقة زرقاء بعنوان "Node"، تليها طبقة زرقاء فاتحة بعنوان "API Gateway". وبعد ذلك طبقة بيضاء بعنوان "Resources + Downstream Systems"، ثم الطبقة الخارجية (بلون خوخي) بعنوان "Compute-Storage-Network". تمثل كل طبقة مكوّنًا ضمن التسلسل الهرمي للنظام.

    3. تحديد أسباب الفشل عبر مناطق الفشل

    قد تتعطّل كل "منطقة فشل" تم تحديدها في الخطوة السابقة لأسباب متعددة — وهذا ما نحتاج إلى تحديده بعد ذلك. وبالاستمرار في المثال نفسه، فإن ربط مناطق الفشل بالأسباب المحتملة قد ينتج القائمة التالية:

    • النواة (Core): قد تتعطّل الخدمة المُصغَّرة الأساسية نفسها — بوصفها وحدة تعليمات برمجية — بسبب مشكلات نفاد الذاكرة، أو قد يتعطّل خادم التطبيق، وما إلى ذلك.
    • حجيرة وعقدة الخدمات المصغرة: قد تفشل العقدة أو الحجيرة في اجتياز فحص السلامة (Health check). وقد يتعطّل الجهاز الافتراضي (VM) الذي يستضيف منصة حاويات Kubernetes.
    • API Gateway: قد يصبح محرك API Gateway غير مستجيب بسبب عدم كفاية سلاسل الرسائل/الذاكرة المطلوبة لخدمة الطلبات.
    • نظام الواجهة الخلفية: قد يستغرق نظام الواجهة الخلفية وقتًا طويلاً للاستجابة، وقد يتعطل.
    • الحوسبة/التخزين/الشبكة: قد تتعطل الشبكة بين الخدمة المُصغَّرة ونظام الواجهة الخلفية (والذي قد يكون مستضافًا في موقع منفصل).

    4. الاستعداد لمواجهة "الهجمات"

    يمكن استخدام الأسباب ومناطق الفشل لإنشاء مصفوفة كما هو موضح أدناه. ويتيح لنا ذلك الآن فهم التوليفات التي ينبغي أن نخطط لها عند تنفيذ "هجمات" على الحل. ويمكن بعد ذلك تنفيذ هذه التوليفات باستخدام أطر اختبار الفوضى، كما ذُكر سابقًا.

    جدول يوضح إيجابيات المنتجات وسلبياتها

    اعتبارات إضافية

    أخيرًا وليس آخرًا، فإن اختبار الأعطال وحده لن يكون كافيًا. ضع في اعتبارك السيناريوهات التالية:

    • بالإضافة إلى إحداث عطل في مثيل واحد من أحد المكوّنات، عليك التأكد من عدم وجود توسُّع تلقائي (Auto-scaling) أو مثيلات متعددة تعمل على المنصة السحابية؛ أو التأكد من تعطل جميع النسخ المتماثلة (Replicas) حسب الحاجة.
    • لاختبار سلوك النظام في وضع الأداء المتراجع (مثلًا عند الاعتماد على ذاكرة التخزين المؤقت (Cache))، ستحتاج إلى قدرة اختبار "قبل" و"بعد".

    يتطلب ذلك قدرات إضافية تُكمّل أطر اختبار الفوضى لديك، مثل البنية التحتية كتعليمات برمجية (IaC) أو إعادة التكوين الديناميكي للموارد السحابية.

    وبالإضافة إلى ذلك — نظرًا لأن الاختبار الفعلي باستخدام المكوّنات مكلف — قد ترغب أيضًا في النظر في قدرات للتحقق "الثابت"، مثل ما يلي:

    • التحقق من صحة وصف النشر لمجموعة النسخ المتماثلة (ReplicaSet)
    • التحقق من إعدادات التوسع التلقائي للأجهزة الافتراضية (VMs).
    • فحوصات تعليمات برمجية ثابتة لآليات إعادة المحاولة، وتنفيذ قاطع الدائرة (Circuit breaker)، وما إلى ذلك.

    تعرّف على المزيد

    وبشكل عام، نرى أن المرونة تتطلب تركيزًا ليس بعد التطوير فقط، بل طوال دورة العمل — بدءًا من تحديد السيناريوهات مبكرًا، وترتيب أولوياتها بناءً على تأثيرها على الأعمال، ثم استخدام مزيج من "الهجمات" الثابتة والديناميكية للتحقق من مرونة المكوّنات والتأكد من صحتها. وسيساعد النهج الذي عرضناه في هذا المنشور على معالجة التحديات الرئيسية المطروحة عبر هذه الرحلة بالكامل.

    تضمن خدمات IBM لتطوير التطبيقات السحابية الأصلية وتحديثها دمج ممارسات هندسية بالاتساق والدقة المطلوبة. للمزيد من المعلومات، تفضل بزيارة الروابط التالية:

