قابلية الملاحظة هي القدرة على فهم الحالة الداخلية للنظام من خلال تحليل مخرجاته الخارجية ، بشكل أساسي من خلال بيانات القياس عن بعد مثل المقاييس والأحداث والسجلات والتتبعات، والتي يشار إليها مجتمعة باسم "بيانات MELT".
تتخطى قابلية الملاحظة حلول المراقبة التقليدية لتوفر نظرة ثاقبة في أنظمة البرمجيات وبيئات الحوسبة السحابية، مما يساعد فرق تكنولوجيا المعلومات على ضمان التوافر وتحسين الأداء واكتشاف الحالات الشاذة.
تتصرف معظم أنظمة تكنولوجيا المعلومات بشكل حتمي، مما يجعل تحليل السبب الأساسي واضحاً إلى حد ما. عند فشل أحد التطبيقات، يمكن لأدوات قابلية الملاحظة استخدام بيانات MELT لربط الإشارات وتحديد حالات الفشل، وتحديد ما إذا كان ذلك عبارة عن تسرب الذاكرة أو فشل اتصال قاعدة البيانات أو مهلة واجهة برمجة التطبيقات.
لكن النماذج اللغوية الكبيرة (LLMs) وغيرها من تطبيقات الذكاء الاصطناعي التوليدي تزيد من تعقيد قابلية الملاحظة. على عكس البرمجيات التقليدية، تُنتج النماذج اللغوية الكبيرة (LLMs) مخرجات احتمالية، مما يعني أن المدخلات المتطابقة يمكن أن تنتج استجابات مختلفة. هذا النقص في قابلية التفسير- أو صعوبة تتبع كيفية تشكيل الإدخلات للمخرجات - يمكن أن يسبب مشاكل لأدوات قابلية الملاحظة التقليدية. ونتيجة لذلك، يصبح استكشاف المشكلات وحلها وتصحيح الأخطاء ومراقبة الأداء أكثر تعقيدًا بشكل كبير في أنظمة الذكاء الاصطناعي التوليدي.
يوضح Drew Flowers، "قابلية الملاحظة يمكن أن تكتشف ما إذا كانت استجابة الذكاء الاصطناعي تحتوي على معلومات التعريف الشخصية، على سبيل المثال، ولكن لا يمكنها منعها من الحدوث"، قائد مبيعات الأمريكتين لبرنامج Instana. "لا تزال عملية صنع القرار في النموذج بمثابة صندوق أسود".
تسلط ظاهرة "الصندوق الأسود" هذه الضوء على تحدٍ حساس لقابلية ملاحظة النماذج اللغوية الكبيرة (LLMs). في حين أن أدوات قابلية الملاحظة قادرة على اكتشاف المشاكل التي حدثت، إلا أنها لا تستطيع منع تلك المشاكل لأنها تواجه صعوبة في تفسير الذكاء الاصطناعي - أي القدرة على تقديم سبب يمكن فهمه بواسطة البشر لسبب اتخاذ نموذج لقرار معين أو توليد مخرجات معينة.
وإلى أن يتم حل مشكلة قابلية التفسير، يجب أن تعطي حلول قابلية ملاحظة الذكاء الاصطناعي الأولوية للأشياء التي يمكنها قياسها وتحليلها بفعالية. يتضمن ذلك مزيجا من بيانات MELT التقليدية ومقاييس قابلية الملاحظة الخاصة بالذكاء الاصطناعي على وجه التحديد.
على الرغم من أن المقاييس التقليدية لا توفر رؤية كاملة لسلوك النموذج، إلا أنها تظل مكونات أساسية لقابلية ملاحظة الذكاء الاصطناعي. يؤثر أداء وحدة المعالجة المركزية والذاكرة والشبكة بشكل مباشر على وظائف نظام الذكاء الاصطناعي وتجربة المستخدم. ويمكنها أن تساعد المؤسسات على تقييم مدى كفاءة تشغيل أحمال تشغيل الذكاء الاصطناعي وما إذا كانت قيود البنية التحتية تؤثر على أداء النموذج وأوقات الاستجابة.
ومع ذلك، تتطلب قابلية الملاحظة الشاملة للذكاء الاصطناعي مقاييس إضافية تراقب الصفات الخاصة بسلوك نموذج الذكاء الاصطناعي ومخرجاته، بما في ذلك:
الرمز المميز هو وحدة فردية من اللغة - عادةً ما تكون كلمة أو جزء من كلمة - يمكن لنموذج الذكاء الاصطناعي فهمها. يؤثر عدد الرموز المميزة التي يعالجها النموذج لفهم الإدخال أو إنتاج المخرجات بشكل مباشر على تكلفة وأداء التطبيق القائم على النماذج اللغوية الكبيرة (LLMs). قد يؤدي ارتفاع استهلاك الرموز المميزة إلى زيادة النفقات التشغيلية وزمن الانتقال المرتبط بالاستجابة.
المقاييس الرئيسية لتتبع استخدام الرمز المميز تشمل:
يمكن أن تساعد هذه المقاييس المؤسسات في تحديد فرص التحسين لتقليل استهلاك الرموز المميزة، مثل تنقيح الموجِّهات لنقل المزيد من المعلومات في عدد أقل من الرموز المميزة. من خلال تحسين استخدام الرموز المميزة، يمكن للمؤسسات الحفاظ على جودة استجابة عالية مع إمكانية تقليل تكاليف الاستدلال لأحمال تشغيل التعلم الآلي.
على عكس البرامج التقليدية، يمكن لنماذج الذكاء الاصطناعي تغيير سلوكها تدريجيًا بالتزامن مع تطور البيانات في العالم الحقيقي. يمكن أن تؤثر هذه الظاهرة، المعروفة باسم انحراف النموذج، بشكل كبير على موثوقية وأداء نظام الذكاء الاصطناعي.
تتضمن المقاييس الرئيسية لتتبع انحراف النموذج ما يلي:
يمكن لآليات الكشف عن الانحراف أن توفر تحذيرات مبكرة عندما تنخفض دقة النموذج لحالات استخدام محددة، مما يمكّن الفرق من التدخل قبل أن يتسبب النموذج في تعطيل عمليات الأعمال.
تعد مراقبة جودة مخرجات الذكاء الاصطناعي أمرًا ضرورياً للحفاظ على الثقة والموثوقية والامتثال. تتضمن المقاييس الرئيسية لتتبع جودة الاستجابة ما يلي:
في حين أن تتبع هذه المقاييس يمكن أن يساعد في تحديد الاستجابات الشاذة، لا يمكن لأدوات قابلية الملاحظة أن تشرح بشكل كامل سبب حدوث الهلوسة، ولا يمكنها تحديد صحة المحتوى الذي تم إنشاؤه بواسطة الذكاء الاصطناعي تلقائيًا. وهذه تحديات رئيسية تواجه ثقة الذكاء الاصطناعي وحوكمته والتي يجب على أي شخص معالجتها بشكل كامل.
يتطلب ضمان النشر الأخلاقي للذكاء الاصطناعي والامتثال التنظيمي مراقبة شاملة للمحتوى الذي يتم إنشاؤه بواسطة الذكاء الاصطناعي.
تتضمن المقاييس الرئيسية لتتبع الذكاء الاصطناعي المسؤول ما يلي:
يمكن أن يصدر عن لوحات معلومات العروض المصوّرة في الوقت الفعلي المزودة بالكشف التلقائي عن الحالات الشاذة تنبيهات إلى الفرق عندما تنحرف مخرجات الذكاء الاصطناعي عن المعايير المتوقعة. يساعد هذا النهج الاستباقي المؤسسات على معالجة المشكلات بسرعة، ومراقبة الأداء بمرور الوقت، وضمان نشر الذكاء الاصطناعي المسؤول على نطاق واسع.
لقد برز OpenTelemetry (OTel) كإطار العمل القياسي للصناعة لجمع بيانات القياس عن بعد ونقلها، ويمكنه المساعدة في قابلية ملاحظة للذكاء الاصطناعي أيضًا. يوفر هذا المشروع مفتوح المصدر نهجًا محايدًا فيما يتعلق بالبائع لقابلية الملاحظة والذي تظهر قيمته بشدة في الأنظمة البنائية المعقدة للذكاء الاصطناعي.
بالنسبة لمقدمي خدمات الذكاء الاصطناعي، يوفر OpenTelemetry طريقة لتوحيد كيفية مشاركة بيانات الأداء دون الكشف عن تفاصيل النموذج الخاص أو مصدر الرمز. بالنسبة للمؤسسات، فهو يضمن تدفق بيانات قابلية الملاحظة بشكل متسق عبر مسارات الذكاء الاصطناعي المعقدة التي قد تتضمن نماذج متعددة وتبعيات مختلفة وأنظمة التوليد المعزز بالاسترجاع (RAG) .
تتضمن المزايا الرئيسية لإطار عمل OpenTelemetry لقابلية ملاحظة الذكاء الاصطناعي التوليدي ما يلي:
تتطلب تطبيقات الذكاء الاصطناعي استثمارات كبيرة، بداية من تكاليف ترخيص النماذج إلى نفقات البنية التحتية وموارد المطورين. إن المؤسسات التي تؤخر تطبيق قابلية ملاحظة للذكاء الاصطناعي التوليدي تخاطر بإهدار الموارد إذا لم تتمكن من الكشف عن مشكلات الأداء أو المشاكل الأخلاقية أو التطبيقات غير الفعالة.
تقول Flowers: "بالنسبة إلى قابلية ملاحظة الذكاء الاصطناعي، فإن الوقت المناسب للقيمة (TTV) هو كل شيء". "إذا لم أتمكن من البدء في الحصول على الرؤى بسرعة، فإنني بذلك أحرق الأموال بينما أنتظر تحسين نظامي."
تتضمن بعض التحديات الشائعة التي تؤدي إلى إبطاء اعتماد قابلية ملاحظة الذكاء الاصطناعي ما يلي:
للتغلب على هذه التحديات، يجب على المؤسسات النظر في قابلية الملاحظة التي تدعم:
يجب على المؤسسات إعطاء الأولوية لقابلية الملاحظة التي يمكن نشرها بسرعة للحصول على رؤى فورية. يمكن للمنصات التي يتم تكوينها مسبقاً أن تقلل بشكل كبير من وقت الإعداد وتسرّع من عملية اختبار التقنية بشكل كبير، مما يمكّن الفرق من بدء مراقبة أنظمة الذكاء الاصطناعي لديها في أيام بدلاً من أسابيع.
تشمل قدرات قابلية الملاحظة الرئيسية للنشر السريع لقابلية ملاحظة الذكاء الاصطناعي ما يلي:
قد يستغرق التحليل اليدوي لكميات هائلة من البيانات التي تم توليدها باستخدام الذكاء الاصطناعي وقتاً طويلاً وخبرة كبيرة، مما يؤدي في كثير من الأحيان إلى التأخير أو الأخطاء أو تفويت بعض المشكلات. يمكن أن تعمل حلول قابلية الملاحظة على أتمتة هذه العملية، مما يسمح للفرق بالتركيز على قضايا أكثر إلحاحًا من غربلة بيانات القياس عن بُعد الخام.
تتضمن عمليات الأتمتة الرئيسية في حلول قابلية ملاحظة الذكاء الاصطناعي ما يلي:
لا ينبغي أن تكون قابلية الملاحظة فكرة لاحقة. سيؤدي تضمينها طوال دورة حياة تطوير الذكاء الاصطناعي إلى تمكين الفرق في جميع أنحاء المؤسسة من الرؤية المشتركة لأداء نظام الذكاء الاصطناعي، مما يتيح حل المشكلات بشكل أسرع واتخاذ قرارات أكثر استنارة.
بالنسبة إلى قابلية ملاحظة الذكاء الاصطناعي، لا يقتصر الوقت المناسب للقيمة على مدى سرعة تنفيذ أدوات الملاحظة. بل يتعلق الأمر أيضاً بمدى سرعة هذه الأدوات في تقديم رؤى قابلة للتنفيذ لتحسين استثمارات الذكاء الاصطناعي ومنع فترة التعطل.
تتضمن الطرق الرئيسية لدمج قابلية ملاحظة الذكاء الاصطناعي في مهام سير عمل تطوير الذكاء الاصطناعي ما يلي:
مع نضج قابلية ملاحظة الذكاء الاصطناعي، تنتقل المؤسسات من المراقبة التفاعلية إلى الأساليب التنبؤية التي تتوقع المشكلات قبل أن تؤثر على المستخدمين أو نتائج الأعمال. لدعم ذلك، تدمج حلول قابلية الملاحظة الأكثر تقدماً الآن أدوات الذكاء الاصطناعي المتخصصة الخاصة بها لتحليل الأنماط عبر بيانات القياس عن بُعد وتحديد المشكلات قبل أن تصبح حساسة.
تشرح Flowers قائلة "أن الذكاء الاصطناعي الأكثر قيمة في قابلية الملاحظة هو الذكاء الاصطناعي التنبؤي والسببي، وليس الذكاء الاصطناعي التوليدي".
يمكن لأدوات قابلية الملاحظة التي تحتوي على قدرات الذكاء الاصطناعي التنبؤية والسببية تنفيذ ما يلي:
يمثل هذا التحول من المراقبة التفاعلية إلى قابلية الملاحظة التنبؤية الحدود التالية لعمليات الذكاء الاصطناعي، مما يتيح إدارة أكثر استباقية لتطبيقات الذكاء الاصطناعي والبنية التحتية مع ضمان مخرجات متسقة وعالية الجودة.
استنادًا إلى التحديات والحلول التي تمت مناقشتها، إليك خمسة مبادئ أساسية يجب وضعها في الاعتبار عند البحث عن حل قابلية الملاحظة المناسب لتطبيقات الذكاء الاصطناعي التوليدي:
في حين أن قابلية ملاحظة الذكاء الاصطناعي توفر رؤى حساسة حول أنماط الأداء والحالات الشاذة، إلا أنه لا يمكنها أن تفسر بشكل كامل عمليات صناعة القرار الداخلية للنماذج اللغوية الكبيرة. ركز على المقاييس القابلة للقياس التي تشير إلى صحة ومستوى أداء النظام.
تتطلب قابلية ملاحظة الذكاء الاصطناعي التوليدي مراقبة أنماط استخدام الرموز المميزة ومؤشرات انحراف النموذج وعلاقات الموجِّه-الاستجابة إلى جانب مقاييس الأداء التقليدية مثل استخدام وحدة المعالجة المركزية واستهلاك الذاكرة.
اختر منصات قابلية الملاحظة التي توفر قدرات نشر سريعة مع لوحات معلومات مُعدّة مسبقًا وأنظمة تنبيه مؤتمتة لتحقيق عوائد أسرع من استثمارات الذكاء الاصطناعي ومنع حدوث مشكلات تشغيلية مكلفة.
قم بدمج قابلية الملاحظة في وقت مبكر من دورة حياة تطوير البرمجيات لتحديد المشكلات قبل النشر، وإنشاء خطوط أساس للأداء، وإنشاء مسارات ملاحظات تعمل على تحسين جودة نظام الذكاء الاصطناعي.
يساعد توحيد المعايير طبقًا لأطر عمل قابلية الملاحظة المفتوحة على وضع استراتيجيات قابلية الملاحظة الجاهزة للمستقبل مع توفير رؤية شاملة من البداية إلى النهاية عبر أنظمة الذكاء الاصطناعي المعقدة وتجنب الاحتكار لمنتج معين.
بالإضافة إلى ذلك، تذكّر أن تبنّي OpenTelemetry لا يعني بالضرورة أن عليك اختيار حل مفتوح المصدر لقابلية الملاحظة. فالعديد من المنصات التجارية، التي قد تستخدمها مؤسستك بالفعل، تدعم إطار عمل OTel بشكل كامل إلى جانب تقديم قدرات من فئة المؤسسات.
يمكن أن توفر حلول قابلية الملاحظة التجارية قابلية الملاحظة المُدارة بالكامل مع رؤى مستندة إلى الذكاء الاصطناعي ودعم مستمر، مما يقلل من الإعداد اليدوي والصيانة وتحسين الوقت المناسب للقيمة.
تقول Flowers، "إن كنتُ منشغلة ببناء لوحات المعلومات وإنشاء التنبيهات وبناء السياق والبيانات، فأنا أركز حرفيًا على بناء الأدوات. إنني لا أقوم بتحسين النظام. ولا أدعم مبادرات العملاء." "ما أفعله في الأساس لا يساعدني في جني الأموال".
باستخدام حلول قابلية الملاحظة التجارية، يمكن أتمتة الكثير من ذلك الإعداد أو تكوينه مسبقاً. وبدلاً من ذلك، يمكن للفرق التركيز على تحسين أداء وموثوقية نماذج الذكاء الاصطناعي التوليدي الخاصة بهم، مما يزيد من استثماراتهم في قابلية الملاحظة والتأثيرات الواقعية لتطبيقات الذكاء الاصطناعي.
تمكَّن من تحديد مصدر المشكلة وإصلاحه سريعًا. حيث توفِّر البيانات عالية الدقة في الوقت الفعلي رؤية شاملة لبيئات التطبيقات والبنية التحتية الديناميكية.
تمكَّن من رفع مستوى أتمتة وتشغيل تكنولوجيا المعلومات باستخدام الذكاء الاصطناعي التوليدي، مع ضمان توافق كل جانب من جوانب البنية التحتية لتكنولوجيا المعلومات مع أولويات الأعمال.
IBM SevOne Network Performance Management هو برنامج مراقبة وتحليلات يوفر رؤية ومعارف في الوقت الفعلي للشبكات المعقدة.