هناك عدد من المقاييس التي يمكنك الاختيار من بينها، ولكننا نوصي بالتركيز على هذه المقاييس الثمانية للحصول على أكبر قدر من الفوائد داخل مجموعة تكنولوجيا المعلومات.
1. درجات Apdex وSLA
دعنا نبدأ بمؤشر أداء التطبيقات (Apdex) ونتائج اتفاقية مستوى الخدمة (SLA)، لأنها أساس تجربة العملاء الفائقة. السرعات ومعدلات النقل التي ستقيسها هي الجوانب المحددة التي يجب أن تساهم في تحقيق أداء سريع، لكنها وسيلة وليست الهدف النهائي. العملاء السعداء هم هدفك - ونأمل أن يؤدي إلى زيادة المبيعات.
تُعَد درجات Apdex وSLA الطريقة الأكثر شيوعًا لعرض مراقبة تجربة المستخدم النهائي. تتتبّع درجة Apdex الأداء النسبي للتطبيق من خلال تحديد هدف للوقت الذي يجب أن يستغرقه طلب الويب أو المعاملة عادةً. اتفاقيات مستوى الخدمة هي المقاييس الواردة في عقد العميل الخاص بك، وأي شيء أقل من اتفاقية مستوى الخدمة المحددة يؤدي إلى انخفاض في تجربة العملاء (CX) (وربما عقوبات محددة مسبقًا).
2. توافر التطبيقات (المعروف أيضًا باسم مدة التشغيل أو مراقبة الأداء)
هذا هو المقياس الأكثر أساسية: هل الأضواء مضاءة؟ أنت تعمل على مراقبة وقياس إذا ما كان التطبيق متاحًا عبر الإنترنت ومتوفرًا. تستخدم معظم الشركات ذلك لقياس مدى الامتثال لاتفاقية مستوى الخدمة (SLA). غالبًا ما يكون وقت التشغيل اختصارًا لتقييم موثوقية النظام وصحته بشكل عام. يمكن أن تؤثِّر فترة التعطل المفرط سلبًا على رضا المستخدم للمؤسسات التي تقدِّم خدمات عبر الإنترنت. بالنسبة لتطبيق ويب، يمكنك التحقق من التوفر من خلال فحص HTTP بسيط ومجدول بانتظام.
3. استخدام وحدة المعالجة المركزية (المعروف أيضًا باسم استخدام الموارد)
يمكن أن تكون النسبة المئوية العالية من سعة وحدة المعالجة المركزية التي يستخدمها أحد التطبيقات علامة على وجود مشكلة في الأداء. يمكن أن يؤدي الارتفاع المفاجئ في استخدام وحدة المعالجة المركزية إلى أوقات استجابة أبطأ. قد تكون التقلبات في الطلب على التطبيق مؤشرًا على أنك بحاجة إلى إضافة المزيد من مثيلات التطبيق. القاعدة العامة هي أنه إذا تجاوز استخدام وحدة المعالجة المركزية 70% أكثر من 30% من الوقت، فقد تنفد سعة وحدة المعالجة المركزية.
يمكن أن يتضمن استخدام الموارد أيضًا استخدام الذاكرة والقرص. يساعد تتبُّع ذاكرة الوصول العشوائي على تحديد تسبب تسرّب الذاكرة الذي قد يؤدي إلى فشل أو الحاجة إلى ذاكرة أكبر. يمكن أن تساعد مقاييس استخدام القرص على منع نفاد مساحة التخزين الدائمة للتطبيق، ما قد يؤدي إلى فشله. قد يكون الاستخدام المرتفع للأقراص أيضًا علامة على عدم كفاءة تخزين البيانات الخلفية أو سياسات الاحتفاظ بالبيانات الخاطئة.
4. معدلات الخطأ
يجب أن يراقب برنامج مقاييس إدارة أداء APM التطبيقات لتسجيل النسبة المئوية للطلبات التي ينتج عنها فشل. يساعد هذا على تحديد حل المشكلات التي تؤثِّر على تجربة المستخدم وتحديد أولوياتها. يمكن أن تتضمن أخطاء التطبيقات أخطاء الخادم أو استجابة 404 أو مهلة في التطبيق. يمكنك تكوين حل APM الخاص بك لإرسال إشعارات عندما يتجاوز معدل الخطأ مَعلمة محددة. على سبيل المثال، أرسل تنبيها عندما تؤدي 2.5% من الطلبات ال 25 السابقة إلى حدوث خطأ.
5. جمع المهملات
يمكن أن يحسِّن تجميع البيانات المهملة (GC) الأداء من خلال تحديد وإزالة الاستخدام المستمر للذاكرة الكثيف لغة جافا أو لغات أخرى. الخبر السار هو أن أتمتة GC تستعيد الذاكرة المخصصة للكائنات أو البيانات غير المستخدمة أو الزائدة عن الحاجة والتي لم يَعُد التطبيق يستخدمها. يتم حذف الكائنات أو البيانات غير المستخدمة ونسخ الكائنات الحية إلى تجمع ذاكرة من الجيل الأحدث. هذا هو المقياس الذي تريد الاحتفاظ به في منتصف السعادة. إذا تم تشغيل GC كثيرًا ، فقد يتطلب الأمر الكثير من النفقات العامة. ولكن إذا لم يتم تشغيل GC كثيرًا بما فيه الكفاية، فقد يترك نظامك بذاكرة قليلة جدًا.
6. عدد المثيلات
تمكّنك مثيلات التتبع من توسيع نطاق التطبيق لتلبية طلب المستخدم الفعلي، استنادًا إلى عدد مثيلات التطبيق التي تعمل في أي وقت. قد يكون هذا مهمًا بشكل خاص لتطبيقات السحابة. يمكن أن يساعدك Auto-scaling على ضمان توسيع نطاق التطبيقات الحديثة لتلبية الطلب وتوفير الميزانية خلال ساعات غير الذروة. ويمكن أن يؤدي هذا أيضًا إلى تشكيل تحديات في مراقبة البنية التحتية. على سبيل المثال، إذا كان تطبيقك يتوسَّع تلقائيًا في استخدام وحدة المعالجة المركزية، فقد لا ترى أبدًا ارتفاعًا في استخدام وحدة المعالجة المركزية - بدلًا من ذلك، قد ترى عدد مثيلات الخادم يرتفع كثيرًا، إلى جانب فاتورة الاستضافة.
7. معدلات الطلب
يمكنك قياس حجم الحركة التي يستقبلها التطبيق لتحديد أي انخفاضات أو زيادات كبيرة، أو تزامن المستخدمين. سيساعدك الربط بين معدلات الطلبات ومقاييس أداء التطبيقات الأخرى على فهم قابلية تطوير تطبيقاتك البرمجية. يمكن لبرنامج APM أيضًا مراقبة حركة المرور لتحديد الحالات الشاذة. مراقبة المستخدم التي تُظهر زيادة غير متوقعة في الطلبات قد تكون هجومًا لحجب الخدمة (DoS). وقد يكون عدد كبير من الطلبات من المستخدم مؤشرًا على اختراق الحساب. حتى الطلبات المنخفضة بشكل غير عادي قد تكون سيئة - قد يعني عدم النشاط أو عدم وجود حركة مرور على الإطلاق فشلًا في أي جزء من نظامك تقريبًا.
8. أوقات الاستجابة (المعروفة أيضًا باسم المدة)
من خلال تتبُّع متوسط وقت الاستجابة للطلبات -أي المدة التي يستغرقها التطبيق للرد على طلب الموارد- يمكنك تقييم أداء التطبيق. يمكن أن تتضمن هذه الطلبات المعاملات التي بدأها المستخدمون النهائيون، مثل طلب تحميل صفحة ويب، أو يمكن أن تتضمن طلبات داخلية من جزء واحد من التطبيق إلى جزء آخر، مثل عملية أو خدمة مصغرة تطلب بيانات من القرص أو الذاكرة. يتضمن إجمالي زمن الاستجابة زمن استجابة الخادم (الوقت الذي يستغرقه الخادم لمعالجة الطلب) بالإضافة إلى زمن استجابة الشبكة (إجمالي الوقت الذي يستغرقه الطلب للانتقال عبر الشبكة).
المقياس ذي الصلة هو وقت تحميل الصفحة، والذي يقيس الوقت الذي تستغرقه صفحة ويب لتحميلها في المتصفح. يُتيح تتبُّع أوقات تحميل الصفحات لأدوات مراقبة أداء التطبيقات تحديد المشكلات التي تسبب بطء التحميل، ومن ثم تحسين تجربة المستخدم الرقمية. يمكن أن يعني بطء تحميل الصفحة التخلي عن الصفحة وفقدان الأعمال. يمكن تعيين حلول مراقبة أداء التطبيقات (APM) لمعيار للأداء لهذا المقياس ثم تنبيهك عند عدم استيفاء هذا المعيار.