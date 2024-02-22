ما المقصود بإدارة الحوادث؟

إدارة الحوادث هي عملية تستخدمها عمليات تقنية المعلومات وفرق عمليات التطوير للاستجابة للأحداث غير المخطط لها ومعالجتها والتي يمكن أن تؤثر على جودة الخدمة أو عمليات الخدمة. وتهدف إدارة الحوادث إلى تحديد المشكلات وتصحيحها مع الحفاظ على الخدمة العادية وتقليل التأثير على الأعمال.

يمكن أن تسبب الحوادث مجموعة من المشكلات للمنظمات، من فترة التعطل المؤقت إلى فقدان البيانات. وعندما تتم إدارة الحوادث بشكل جيد، فيمكنها توفير طريقة كفؤة وفعالة لحل جميع أنواع الحوادث بأقل قدر من الاضطراب وجعل المنظمات أكثر استعدادا للحوادث المستقبلية.

بفضل الجذور التي تعود إلى مكتب خدمات تقنية المعلومات، لطالما كانت إدارة الحوادث بمثابة الواجهة الأساسية بين عمليات تقنية المعلومات (ITOps) والمستخدم النهائي. مع التقدم التقني وزيادة تعقيده، تطورت كذلك طريقة تحديد المنظمات للحوادث والاستجابة لها. وتوسعت هذه الممارسة إلى ما هو أبعد من مساعدة المستخدمين في إصلاح المشكلات لتُمثل عملية للحفاظ على مدة تشغيل ثابتة للتطبيق وتسريع جهود التحسين المستمر.
إدارة حوادث تكنولوجيا المعلومات

تعالج إدارة الحوادث ضمن عمليات تقنية المعلومات الخاصة بالشركة، والتي يشار إليها غالبًا بإدارة حوادث ITIL ، مجموعة واسعة من المشكلات التي يمكن أن تؤثر على الخدمة وعمليات الأعمال، بدءًا من تعطل الكمبيوتر المحمول أو خطأ الطابعة إلى مشكلات الاتصال بشبكة wifi وتعطل الشبكة.

تعمل إدارة الحوادث، في إطار إدارة خدمات تقنية المعلومات (ITSM)، كجانب واحد من نموذج خدمة إدارة خدمات تقنية المعلومات. وبدلاً من التركيز على إنشاء الأنظمة والتقنيات، فإن إدارة الحوادث في مجال تقنية المعلومات تكون أكثر تركيزًا على المستخدم، حيث تهدف إلى الحفاظ على تشغيل البنية التحتية لتقنية المعلومات بشكل صحيح، سواء كان تطبيقًا أو نقطة نهاية، مثل جهاز استشعار أو كمبيوتر سطح مكتب.
الفرق بين الحوادث وطلبات الخدمة

في إطار إدارة خدمات تقنية المعلومات، يتولى قسم تقنية المعلومات أدوارًا مختلفة، بما في ذلك معالجة المشكلات فور ظهورها، حيث إن خطورة هذه المشكلات هي ما يميز الحادث عن طلب الخدمة.

طلب الخدمة، هو ببساطة، عندما يطلب المستخدم تقديم شيء ما، مثل المشورة أو المعدات. ويمكن أن تتضمن الخدمات طلب المساعدة في إعادة تعيين كلمة المرور أو الحصول على ذاكرة إضافية لجهاز كمبيوتر سطح المكتب.

أما الحادث، من ناحية أخرى، يكون أكثر إلحاحًا ويشير إلى خطأ أساسي يحتاج إلى معالجة.
الفرق بين الحوادث والمشاكل

الحادث هو حدث مفاجئ غير مخطط له يتسبب في انقطاع الخدمة، في حين أن المشكلة هي السبب الجذري لانقطاع الخدمة، ويُمكن أن يكون حادثًا واحدًا أو سلسلة من الحوادث المتتالية.

يكمن الاختلاف في المعالجة وكيفية تعامل المستجيبين مع حل المشكلة. الاستجابة للحوادث تكون تفاعلية، حيث تتلقى فرق إدارة الحوادث إنذارًا وتعالج الحادث. ومع ذلك، عند معالجة مشكلة ما، تحدد فرق تقنية المعلومات السبب الأساسي ثم تصلحه. وتتبع إدارة المشكلات نهجًا استباقيًا، حيث تبحث في أنواع مختلفة من الحوادث والأنماط التي تنشأ لفهم كيفية منع الحوادث المستقبلية.

تعرف على المزيد حول الاختلافات بين إدارة الحوادث وإدارة المشكلات.
إدارة الحوادث لعمليات التطوير

تركز فرق عمليات التطوير على إيجاد طرق أكثر فاعلية لبناء البرامج واختبارها ونشرها، الأمر الذي يتطلب جزئيًا معالجة الحوادث بسرعة. كما هو حال إدارة حوادث مكتبة البنية التحتية لتقنية المعلومات (ITIL)، تهدف إدارة حوادث عمليات التطوير إلى إصلاح المشكلات دون تعطيل العمل. فعلى سبيل المثال، قد تراقب فرق عمليات التطوير مقاييس متوسط الوقت بين الأعطال (MTBF)، والتي يمكن أن تشير إلى وجود مشكلة أساسية يجب التحقيق فيها.

نظرا لأن عمليات التطوير متجذرة في التحسين المستمر، فهناك تركيز كبير على تحليل ما بعد التجارب وثقافة الشفافية الخالية من اللوم. والهدف هو تحسين الأداء العام للنظام، وتبسيط معالجة الحوادث وتسريعها، ومنع وقوع الحوادث المستقبلية.

كما عليه الحال مع فرق تقنية المعلومات اليوم، غالبًا ما تستخدم فرق عمليات التطوير التزويد الآلي، وتحديد أولويات الحوادث وأدوات تحليل السبب الأساسي المدعومة بالذكاء الاصطناعي (AI) لضمان مدة التشغيل، ومعالجة الحوادث الأكثر إلحاحًا أولاً، ومعرفة كيفية إصلاح المشكلات المستقبلية بشكل أسرع. (أو منعها من الحدوث في الأساس.)
عملية إدارة الحوادث

عادةً ما تنشئ المنظمات عملية إدارة حوادث توثق تسلسل الأحداث التي يجب أن يتخذها فريق الاستجابة. ويجب على جميع الأطراف المعنيين معرفة الموظفين المسؤولين عن التعامل مع الحوادث، والوقت الذي يجب أن يستغرقه حل المشكلة، ومتى يتم تصعيد الحادث إلى المستوى التالي، وكيفية توثيق الحادث وطريقة حله.

بمجرد تحديد العملية، عادةً ما يكون سير عمل إدارة الحوادث كما يلي:
  1. تحديد الحادث: سواء كان ذلك مستخدمًا نهائيًا يرسل تذكرة إلى مكتب المساعدة أو نظام تنبيه آلي يخطر الفريق بمشكلة ما، يحتاج فريق الاستجابة إلى طريقة لتلقي تقارير عن المشكلات داخل النظام.

  2. تسجيل الحادث وتصنيفه: ويشمل ذلك إدخال تقرير الحادث في نظام تسجيل الحوادث وتحديد الأولويات، بما في ذلك مستوى الموظفين الذين يجب أن يتعاملوا معه. على سبيل المثال، عادةً ما يتم التعامل مع حوادث المستوى الأول من قبل موظفين أحدث وأقل خبرة، في حين أن حوادث المستويين الثاني والثالث تزداد صعوبة حلها وتحتاج إلى مستجيبين الأكثر خبرة.

  3. احتواء المشكلة: إذا كان الأمر يتعلق بحادث أمني، يجب على فرق الاستجابة أن تتصرف بسرعة لاحتواء المشكلة، سواء كان هجوم موزع لحجب الخدمة (DDoS) أو اختراق لأمن البيانات. وفي جميع الحالات، يجب على الفرق التأكد من عدم انتشار الحادث وعدم تأثيره على النظام.

  4. تشخيص الحادث: هنا يأتي دور استكشاف الأخطاء وإصلاحها. فقد تستخدم فرق الاستجابة قاعدة معارف أو أداة ChatOps لاقتراح الأسباب المحتملة وتوفير الوقت.

  5. حل الحادث: بمجرد تحديد السبب، تبدأ الفرق في العمل على معالجة الحادث، سواء كان ذلك توفير ذاكرة إضافية أو معالجة انقطاع الشبكة.

  6. إغلاق الحادث ومراجعته: تشكل مراجعات ما بعد معالجة الحادث جانبًا مهمًا لتحسين الموثوقية والتوافر في البيئات الرقمية اليوم. ولا تزيد هذه البيانات من المعرفة المؤسسية للمنظمة فحسب، بل يمكن استخدامها أيضًا في التعلم الآلي والأدوات التي تدعم الذكاء الاصطناعي للمساعدة في تحديد الحوادث بسرعة أكبر، وحتى إنشاء إشعارات في حالة احتمالية حدوثها. وتساعد المراجعات الشاملة المنظمات في تنفيذ إجراءات أكثر فعالية لمعالجة الحوادث.
لماذا يجب استخدام إدارة الحوادث؟

تحتاج جميع المنظمات إلى إصلاح المشكلات وحل الحوادث. إنها الطريقة التي يحافظون بها على سير الأعمال. ولكن هناك أيضًا ميزات واضحة لوجود أدوات فعالة لحل الحوادث - وفرق - يمكنها الاستجابة بسرعة دون تعطيل كبير للأعمال. وتشمل هذه الميزات ما يلي:
حل المشكلات بشكل أسرع

تساعد أدوات إدارة الحوادث والأتمتة و الذكاء الاصطناعي لعمليات تقنية المعلومات الفرق في تحديد المشكلات وإصلاحها بسرعة. ويُحسن هذا بدوره الكفاءة من خلال السماح للفرق بالتركيز على العمليات التجارية الأساسية بدلاً من مكافحة المشكلات باستمرار.
تجربة مستخدم أفضل

عند إصلاح الحوادث بشكل صحيح (وسريع) في المرة الأولى، فإن ذلك يُحسن جودة الخدمة للمستخدم النهائي. يبدأ هذا بنظام واضح وسهل الاستخدام للإبلاغ عن انقطاع الخدمة ويستمر بالتواصل الجيد عند معالجة الحوادث.
زيادة الكفاءة التشغيلية

تُنشئ الاستجابة للحوادث نظامًا يكون فيه للمشكلات مسار واضح للحل وتساعد في بناء المعرفة المؤسسية بمرور الوقت، حيث تساعد هذه المعرفة - إما التي يحتفظ بها الموظفون أو المدمجة في نظام آلي مُعزز بالذكاء الاصطناعي - في توثيق مقاييس الأداء المهمة، مثل متوسط الوقت اللازم للحل (MTTR). وتساعد هذه المقاييس في ضمان حفاظ المؤسسة على مستوىً عالٍ من الخدمة وتوفير تجربة عملاء ممتازة.
معارف أعمق

مع وجود نظام فعال لإدارة الحوادث، يُمكن للفرق معالجة الحوادث الكبرى بشكل أسرع واستخراج معارف لتحليل السبب الرئيسي. وعندما يوثق أعضاء الفريق كيفية حل الحوادث السابقة، يبدأون في إنشاء دليل تشغيل يحتوي على قوالب لحل حوادث مماثلة في المستقبل.
الامتثال لاتفاقية مستوى الخدمة (SLA)

تحدد اتفاقية مستوى الخدمة (SLA) مستوى الخدمة المطلوب من الشركة تقديمها للعميل. ولذلك، تؤدي الاستجابة للحوادث وإدارتها دورًا رئيسيًا في تحقيق المقاييس ومؤشرات الأداء الرئيسية (KPIs) المحددة في اتفاقية مستوى الخدمة.
أدوات إدارة الحوادث والأتمتة

لقد أدى التعقيد المتزايد لعمليات تقنية المعلومات، والذي يرجع جزئيًا إلى العديد من التطبيقات التي تعتمد عليها المنظمات في العمليات التجارية اليومية، إلى جعل أدوات الاستجابة للحوادث والأتمتة أكثر أهمية من أي وقت مضى.

تتضمن بعض أدوات إدارة الحوادث الأكثر شيوعًا ما يلي:

  • أدوات المراقبة: تحدد هذه الأدوات حالات الانقطاع وتطلق التنبيهات وتشخص الحوادث. كما تعمل أدوات المراقبة على تقليل التكاليف عن طريق تحرير فرق عمليات التطوير لإدارة دورة حياة البرنامج بشكل أفضل.

  • مكاتب الخدمة: هذا مكان للمستخدمين لإرسال التذاكر، والدردشة مع فريق مكتب الخدمة، ومراقبة تقدم تذاكرهم وأداء بعض مهام الخدمة الذاتية. وعادةً ما يتم تشغيل مكتب الخدمة من خلال نظام إدارة يتيح مهام إدارة الحوادث الرئيسية، مثل تحديد الأولويات والتصنيف.

  • منصات AlOps : باستخدام السجلات والبيانات التاريخية، يمكن أن يوفر الذكاء الاصطناعي لعمليات تقنية المعلومات سياقًا لاتخاذ قرارات أفضل وتخصيص أكثر ذكاء للموارد واستجابة أسرع للحوادث.

  • التوثيق الافتراضي: هذه هي البرامج النصية التي توثق التغييرات التي تطرأ على البيئة تلقائيًا، مما يسهل تسجيل الحوادث لتحليلها بعد المُعالجة. فعلى سبيل المثال، يمكن للفرق إعداد البرامج النصية PowerCLI لتعمل وفقًا لجدول شهري لتسجيل الحوادث لإجراء تحليل أعمق.
ما المقصود بالاستجابة للحوادث؟
تعرف على الاستجابة للحوادث (تسمى أحيانًا الاستجابة للحوادث الأمنية الإلكترونية) وعمليات وتقنيات المنظمات المستخدمة للكشف عن التهديدات الإلكترونية وعمليات اختراق الأمن أو الهجمات الإلكترونية والاستجابة لها.
ما هي عمليات تقنية المعلومات (ITOps)؟
تعرف على عمليات تكنولوجيا المعلومات، وهي عملية تنفيذ وإدارة وتقديم ودعم خدمات تقنية المعلومات لتلبية احتياجات العمل للمستخدمين الداخليين والخارجيين.
