ما المقصود بإدارة الحوادث؟

شاب يجلس في مقهى صغير مليء بالنباتات الخضراء، يستخدم الكمبيوتر المحمول.

ما المقصود بإدارة الحوادث؟

إدارة الحوادث هي عملية تستخدمها عمليات تقنية المعلومات وفرق عمليات التطوير للاستجابة للأحداث غير المخطط لها ومعالجتها والتي يمكن أن تؤثر على جودة الخدمة أو عمليات الخدمة. وتهدف إدارة الحوادث إلى تحديد المشكلات وتصحيحها مع الحفاظ على الخدمة العادية وتقليل التأثير على الأعمال.

يمكن أن تسبب الحوادث مجموعة من المشكلات للمنظمات، من فترة التعطل المؤقت إلى فقدان البيانات. وعندما تتم إدارة الحوادث بشكل جيد، فيمكنها توفير طريقة كفؤة وفعالة لحل جميع أنواع الحوادث بأقل قدر من الاضطراب وجعل المنظمات أكثر استعدادا للحوادث المستقبلية.

بفضل الجذور التي تعود إلى مكتب خدمات تكنولوجيا المعلومات، على الدوام كانت إدارة الحوادث بمثابة الواجهة الأساسية بين عمليات تكنولوجيا المعلومات (ITOps) والمستخدم النهائي. مع تطور التكنولوجيا وتعقيدها، تطورت أيضًا طريقة نظرة المؤسسات إلى تحديد الحوادث والاستجابة لها. وتوسَّعت هذه الممارسة إلى ما هو أبعد من مساعدة المستخدمين على إصلاح المشكلات لتصبح عملية تهدف إلى الحفاظ على تشغيل التطبيقات بشكل مستمر وتسريع جهود التحسين المستمر.

تصميم ثلاثي الأبعاد لكرات تتدحرج على مسار

أحدث الأخبار والرؤى حول الذكاء الاصطناعي 


تتوفر معارف وأخبار منسقة بمهارة حول الذكاء الاصطناعي والسحابة وغيرها في نشرة Think الإخبارية الأسبوعية. 

إدارة حوادث تكنولوجيا المعلومات

تتناول إدارة الحوادث في عمليات تكنولوجيا المعلومات في الشركة، والتي يُشار إليها غالبًا بإدارة حوادث ITIL، مجموعة واسعة من المشكلات التي قد تؤثِّر في الخدمة وعمليات الأعمال، بدءًا من تعطُّل الكمبيوتر المحمول أو خطأ في الطابعة ووصولًا إلى مشكلات الاتصال بشبكة الواي فاي وتعطُّل الشبكة.

تعمل إدارة الحوادث، ضمن إطار ITSM (إدارة خدمات تكنولوجيا المعلومات)، كأحد عناصر نموذج خدمة ITSM. وبدلًا من التركيز على إنشاء الأنظمة والتقنيات، فإن إدارة الحوادث في مجال تكنولوجيا المعلومات تكون أكثر تركيزًا على المستخدم. فهي تهدف إلى الحفاظ على تشغيل البنية التحتية لتكنولوجيا المعلومات بشكل سليم، سواء أكان ذلك تطبيقًا أم نقطة نهاية مثل جهاز استشعار أم كمبيوتر مكتبيًّا.

Mixture of Experts | 28 أغسطس، الحلقة 70

فك تشفير الذكاء الاصطناعي: تقرير إخباري أسبوعي

انضمّ إلى نخبة من المهندسين والباحثين وقادة المنتجات وغيرهم من الخبراء وهم يقدّمون أحدث الأخبار والرؤى حول الذكاء الاصطناعي، بعيدًا عن الضجيج الإعلامي.

الفرق بين الحوادث وطلبات الخدمة

في إطار إدارة خدمات تقنية المعلومات، يتولى قسم تقنية المعلومات أدوارًا مختلفة، بما في ذلك معالجة المشكلات فور ظهورها، حيث إن خطورة هذه المشكلات هي ما يميز الحادث عن طلب الخدمة.

طلب الخدمة، هو ببساطة، عندما يطلب المستخدم تقديم شيء ما، مثل المشورة أو المعدات. ويمكن أن تتضمن الخدمات طلب المساعدة في إعادة تعيين كلمة المرور أو الحصول على ذاكرة إضافية لجهاز كمبيوتر سطح المكتب.

أما الحادث، من ناحية أخرى، يكون أكثر إلحاحًا ويشير إلى خطأ أساسي يحتاج إلى معالجة.

الفرق بين الحوادث والمشكلات

الحادث هو حدث مفاجئ غير مخطط له يتسبب في انقطاع الخدمة، في حين أن المشكلة هي السبب الجذري لانقطاع الخدمة، ويُمكن أن يكون حادثًا واحدًا أو سلسلة من الحوادث المتتالية.

يكمن الاختلاف في المعالجة وكيفية تعامل المستجيبين مع حل المشكلة. الاستجابة للحوادث تكون تفاعلية، حيث تتلقى فرق إدارة الحوادث إنذارًا وتعالج الحادث. ومع ذلك، عند معالجة مشكلة ما، تحدد فرق تقنية المعلومات السبب الأساسي ثم تصلحه. وتتبع إدارة المشكلات نهجًا استباقيًا، حيث تبحث في أنواع مختلفة من الحوادث والأنماط التي تنشأ لفهم كيفية منع الحوادث المستقبلية.

إدارة الحوادث لعمليات التطوير

تركِّز فِرق عمليات التطوير على إيجاد طرق أكثر كفاءة لبناء البرمجيات واختبارها ونشرها، الأمر الذي يتطلب جزئيًا التعامل مع الحوادث بسرعة. مثل إدارة حوادث ITIL، تهدف إدارة الحوادث في عمليات التطوير إلى حل المشكلات دون التأثير في سير العمليات. على سبيل المثال، قد تعمل فِرق عمليات التطوير على مراقبة مؤشرات انخفاض متوسط الوقت بين الأعطال (MTBF)، والتي قد تُشير إلى وجود مشكلة أساسية تحتاج إلى التحقيق.

نظرًا لأن عمليات التطوير قائمة على التحسين المستمر، يتركز الاهتمام بشكل كبير على تحليل ما بعد الحوادث واتباع ثقافة شفافة خالية من اللوم. والهدف هو تحسين الأداء العام للنظام، وتبسيط معالجة الحوادث وتسريعها، ومنع وقوع الحوادث المستقبلية.

مثل فِرق تكنولوجيا المعلومات الحالية، غالبًا ما تستخدم فِرق عمليات التطوير أدوات التخصيص الآلية، وترتيب أولويات الحوادث، وأدوات تحليل السبب الأساسي المدعومة بالذكاء الاصطناعي لضمان استمرار التشغيل ومعالجة الحوادث الأكثر إلحاحًا أولًا وتعلُّم كيفية حل المشكلات المستقبلية بشكل أسرع. (أو منعها من الحدوث في الأساس).

عملية إدارة الحوادث

عادةً ما تُنشئ المؤسسات عملية إدارة الحوادث التي توثِّق تسلسل الأحداث التي يجب أن يتبعها فريق الاستجابة. يجب أن يكون جميع الأطراف المعنية على دراية بالموظفين المسؤولين عن التعامل مع الحوادث، والمدة المتوقعة لحل المشكلة، ومتى يجب تصعيد الحادث إلى المستوى التالي، وكيفية توثيق الحادث والطريقة التي تم حلّه بها.

بمجرد تحديد العملية، عادةً ما يكون سير عمل إدارة الحوادث كما يلي:

  1. تحديد الحادث: سواء أكان ذلك من خلال قيام المستخدم النهائي بتقديم تذكرة إلى مكتب المساعدة أم من خلال نظام تنبيهات آلي يُخطر الفريق بوجود مشكلة، يحتاج فريق الاستجابة إلى وسيلة لتلقي تقارير المشكلات داخل النظام.

  2. تسجيل الحادث وتصنيفه: ويشمل ذلك إدخال تقرير الحادث في نظام تسجيل الحوادث وتحديد الأولويات، بما في ذلك مستوى الموظفين الذين يجب أن يتعاملوا معه. على سبيل المثال، عادةً ما يتم التعامل مع الحوادث من المستوى الأول من قِبل موظفين أحدث وأقل خبرة، في حين أن الحوادث من المستويين الثاني والثالث تزداد صعوبة حلها وتحتاج إلى المستجيبين الأكثر خبرة.

  3. احتواء المشكلة: إذا كان الأمر يتعلق بحادث أمني، يجب على فِرق الاستجابة أن تتصرف بسرعة لاحتواء المشكلة، سواء أكان هجومًا موزعًا لحجب الخدمة (DDoS) أم اختراقًا لأمن البيانات. وفي جميع الحالات، يجب على الفِرق التأكد من عدم انتشار الحادث وعدم تأثيره في النظام.

  4. تشخيص الحادث: هنا يأتي دور استكشاف الأخطاء وإصلاحها. قد تستخدم فِرق الاستجابة قاعدة معرفة أو أداة ChatOps لاقتراح الأسباب المحتملة وتوفير الوقت.

  5. حل الحادث: بمجرد تحديد السبب، تبدأ الفِرق بالعمل على معالجة الحادث، سواء أكان ذلك من خلال توفير ذاكرة إضافية أم معالجة انقطاع الشبكة.

  6. إغلاق الحادث ومراجعته: تُعَد مراجعات ما بعد معالجة الحادث جانبًا مهمًا لتحسين الموثوقية والتوافر في البيئات الرقمية اليوم. ولا تزيد هذه البيانات من المعرفة المؤسسية للمؤسسة فحسب، بل يمكن استخدامها أيضًا في التعلم الآلي والأدوات التي تدعم الذكاء الاصطناعي للمساعدة على تحديد الحوادث بسرعة أكبر، وحتى إنشاء إشعارات عند احتمال حدوثها. وتساعد المراجعات الشاملة المؤسسات على تنفيذ إجراءات أكثر فاعلية لمعالجة الحوادث.

لماذا يجب استخدام إدارة الحوادث؟

تحتاج جميع المنظمات إلى إصلاح المشكلات وحل الحوادث. إنها الطريقة التي يحافظون بها على سير الأعمال. ولكن هناك أيضًا ميزات واضحة لوجود أدوات فعالة لحل الحوادث - وفرق - يمكنها الاستجابة بسرعة دون تعطيل كبير للأعمال. وتشمل هذه الميزات ما يلي:

حل المشكلات بشكل أسرع

تساعد أدوات إدارة الحوادث والأتمتة والذكاء الاصطناعي لعمليات تكنولوجيا المعلومات (AIOps) الفِرق على تحديد المشكلات وإصلاحها بسرعة. ويؤدي هذا بدوره إلى تحسين الكفاءة من خلال تمكين الفِرق من التركيز على العمليات الأساسية للأعمال بدلًا من التعامل المستمر مع المشكلات الطارئة.

تجربة مستخدم أفضل

عند إصلاح الحوادث بشكل صحيح (وسريع) في المرة الأولى، فإن ذلك يُحسن جودة الخدمة للمستخدم النهائي. يبدأ هذا بنظام واضح وسهل الاستخدام للإبلاغ عن انقطاع الخدمة ويستمر بالتواصل الجيد عند معالجة الحوادث.

زيادة الكفاءة التشغيلية

تُنشئ الاستجابة للحوادث نظامًا يكون فيه للمشكلات مسار واضح للحل وتساعد في بناء المعرفة المؤسسية بمرور الوقت، حيث تساعد هذه المعرفة - إما التي يحتفظ بها الموظفون أو المدمجة في نظام آلي مُعزز بالذكاء الاصطناعي - في توثيق مقاييس الأداء المهمة، مثل متوسط الوقت اللازم للحل (MTTR). وتساعد هذه المقاييس في ضمان حفاظ المؤسسة على مستوىً عالٍ من الخدمة وتوفير تجربة عملاء ممتازة.

معارف أعمق

مع وجود نظام فعال لإدارة الحوادث، يُمكن للفرق معالجة الحوادث الكبرى بشكل أسرع واستخراج معارف لتحليل السبب الرئيسي. وعندما يوثق أعضاء الفريق كيفية حل الحوادث السابقة، يبدأون في إنشاء دليل تشغيل يحتوي على قوالب لحل حوادث مماثلة في المستقبل.

الامتثال لاتفاقية مستوى الخدمة (SLA)

تحدِّد اتفاقية مستوى الخدمة (SLA) مستوى الخدمة الذي يتعين على الشركة تقديمه للعميل. ولذلك، تؤدي الاستجابة للحوادث وإدارتها دورًا رئيسيًا في تحقيق المقاييس ومؤشرات الأداء الرئيسية (KPIs) المحددة في اتفاقية مستوى الخدمة.

أدوات إدارة الحوادث وأتمتتها

لقد أدى التعقيد المتزايد لعمليات تقنية المعلومات، والذي يرجع جزئيًا إلى العديد من التطبيقات التي تعتمد عليها المنظمات في العمليات التجارية اليومية، إلى جعل أدوات الاستجابة للحوادث والأتمتة أكثر أهمية من أي وقت مضى.

تتضمن بعض أدوات إدارة الحوادث الأكثر شيوعًا ما يلي:

  • أدوات المراقبة: تعمل هذه الأدوات على تحديد حالات الانقطاع وإطلاق التنبيهات وتشخيص الحوادث. تساهم أدوات المراقبة أيضًا في خفض التكاليف من خلال تمكين فِرق عمليات التطوير من إدارة دورة حياة البرمجيات بشكل أفضل. 

  • مكاتب الخدمة: هذا هو المكان الذي يمكن للمستخدمين من خلاله تقديم التذاكر، والتواصل مع فريق مكتب الخدمة، ومتابعة تقدُّم تذاكرهم، وأداء بعض المهام ذاتية الخدمة. عادةً ما يتم تشغيل مكتب الخدمة من خلال نظام إدارة يُتيح تنفيذ المهام الأساسية لإدارة الحوادث، مثل تحديد الأولويات والتصنيف.

  • منصات AIOps: باستخدام السجلات والبيانات التاريخية، يمكن لعمليات AIOps تقديم سياق يدعم اتخاذ قرارات أفضل، وتخصيص الموارد بذكاء، والاستجابة للحوادث بسرعة أكبر.

  • التوثيق الافتراضي: نصوص برمجية تعمل على توثيق التغييرات في البيئة تلقائيًا، ما يجعل من السهل تسجيل الحوادث لتحليلها بعد المعالجة. فعلى سبيل المثال، يمكن للفِرق إعداد البرامج النصية PowerCLI لتعمل وفقًا لجدول شهري لتسجيل الحوادث لإجراء تحليل أعمق.
حلول ذات صلة
IBM Turbonomic

توسيع نطاق البنية التحتية الحالية لتكنولوجيا المعلومات لديك تلقائيًا لحسين الأداء بتكاليف أقل.

استكشف IBM Turbonomic
حلول الذكاء الاصطناعي لعمليات تقنية المعلومات

اكتشِف كيف يمكن لاستخدام الذكاء الاصطناعي في عمليات تقنية المعلومات منحك ما تحتاج إليه من معارف لدفع عجلة أداء أعمالك لمستويات استثنائية من التميز.

استكشف حلول الذكاء الاصطناعي لعمليات تقنية المعلومات
الخدمات الاستشارية في مجال الأتمتة

انتقل إلى ما يتجاوز عمليات أتمتة المهام البسيطة لمعالجة العمليات عالية المستوى الموجهة للعملاء وتدرّ الإيرادات من خلال التبني المدمج وتوسيع النطاق.

استكشف خدمات الاستشارات في مجال الأتمتة
اتخِذ الخطوة التالية

اكتشِف كيفية الاستفادة من الذكاء الاصطناعي في عمليات تقنية المعلومات لتوفير الرؤى والمعارف اللازمة لتحقيق أداء استثنائي للأعمال.

استكشف Turbonomic استكشف حلول الذكاء الاصطناعي لعمليات تقنية المعلومات