ما المقصود بقابلية ملاحظة النماذج اللغوية الكبرى؟

المؤلفون

Joshua Noble

Data Scientist

Shalini Harkar

Lead AI Advocate

تعريف قابلية ملاحظة النماذج اللغوية الكبرى

قابلية ملاحظة النماذج اللغوية الكبرى هي عملية جمع البيانات في الوقت الفعلي من النماذج اللغوية الكبرى أو تطبيقاتها حول خصائصها السلوكية وأدائها ومخرجاتها. ونظرًا إلى أن النماذج اللغوية الكبرى تتسم بالتعقيد، يمكننا مراقبتها بناءً على أنماط ما تنتجه.1

يتكون الحل الجيد لقابلية الملاحظة من جمع المقاييس والآثار والسجلات ذات الصلة من تطبيقات النماذج اللغوية الكبرى وواجهات برمجة التطبيقات (APIs) وسير العمل، ما يسمح للمطورين بمراقبة التطبيقات وتصحيح أخطائها وتحسينها بكفاءة واستباقية وعلى نطاق واسع. 

النماذج اللغوية الكبرى (LLMs) ومنصات الذكاء الاصطناعي التوليدي مثل IBM watsonx.ai® ومجموعة متزايدة من النماذج مفتوحة المصدر تتزايد انتشارًا عبر المجالات. وبسبب هذه الزيادة، أصبح من المهم أكثر من أي وقت مضى الحفاظ على موثوقية وسلامة وكفاءة النماذج والتطبيقات بعد تبنيها. وهنا تصبح قابلية ملاحظة النماذج اللغوية الكبرى ضرورية.

أحدث الأخبار التقنية، مدعومة برؤى خبراء

ابقَ على اطلاع دومًا بأهم—اتجاهات المجال وأكثرها إثارة للفضول—بشأن الذكاء الاصطناعي والأتمتة والبيانات وغيرها الكثير مع نشرة Think الإخبارية. راجع بيان الخصوصية لشركة IBM.

شكرًا لك! أنت مشترك.

سيتم تسليم اشتراكك باللغة الإنجليزية. ستجد رابط إلغاء الاشتراك في كل رسالة إخبارية. يمكنك إدارة اشتراكاتك أو إلغاء اشتراكك هنا. راجع بيان خصوصية IBM لمزيد من المعلومات.

ما أهمية قابلية ملاحظة النماذج اللغوية الكبرى؟

  • مراقبة جودة ومخرجات النماذج اللغوية الكبرى:
    يمكن تصنيف التقييم المستمر للمخرجات التي تنتجها النماذج اللغوية الكبرى إلى عدة أبعاد للجودة، وهو أمر مفيد وقابل للتطبيق بالنسبة إلى المستخدمين. تتضمن هذه الأبعاد الصحة والملاءمة والترابط والاتساق الواقعي مع مقاييس التقييم المحددة. يساعد التحقق الدوري من أبعاد الأداء هذه على منع التأخيرات أو المشكلات التي قد تتسبب في فقدان المستخدمين الثقة في البرنامج وصعوبة استخدام النماذج اللغوية الكبرى بكفاءة.

  • تحليل سريع للأسباب الأساسية واستكشاف الأخطاء وإصلاحها:
    عندما يحدث عطل كبير أو سلوك غير متوقع في تطبيقات النماذج اللغوية الكبرى، يمكن لأداة قابلية الملاحظة أن توفر معارف مفيدة لتحديد السبب (أو الأسباب) الأساسي لظهور المشكلة بسرعة. سيسمح هذا المستوى من القياس عن بُعد الدقيق للأطراف المعنية عمومًا بالتعرف على المشكلات بمستويات أعلى من الثقة في العديد من المجالات. على سبيل المثال، بيانات التدريب التالفة، أو عملية الضبط الدقيق سيئة التصميم، أو استدعاءات واجهة برمجة التطبيقات الخارجية الفاشلة، أو تعطل الواجهة الخلفية بسبب تعطل مقدم الخدمة الخارجي.

  • تحسين التطبيقات، وتفاعل المستخدمين، وكفاءة النظام:
    تسمح قابلية ملاحظة النماذج اللغوية الكبرى بتحسين أداء التطبيقات وتفاعل المستخدمين من خلال المراقبة المستمرة لمجموعة النماذج اللغوية الكبرى بأكملها. يُجرى تتبع المقاييس مثل زمن الانتقال، والرموز المميزة المستخدمة، وزمن الاستجابة، وسرعة الإنتاج، لتحديد العوائق والعوامل المقيدة للسماح بتحسين الأداء وتقليل التكاليف، خاصة في سير العمل التوليد المعزز بالاسترجاع (RAG). يساعد تتبع التفاعلات وتعليقات المستخدمين في الوقت الفعلي على توفير معارف حول حالات توليد مخرجات منخفضة الجودة، وحل المشكلات عند ظهورها، واكتشاف الأسباب الأساسية. يتيح هذا التكيف المستمر مع سلوك المستخدم للنماذج اللغوية الكبرى إنتاج استجابات مخصصة، وتحسين سير العمل، والتوسع لتلبية الطلب من دون التأثير سلبًا في الأداء.3
Mixture of Experts | 28 أغسطس، الحلقة 70

فك تشفير الذكاء الاصطناعي: تقرير إخباري أسبوعي

انضمّ إلى نخبة من المهندسين والباحثين وقادة المنتجات وغيرهم من الخبراء وهم يقدّمون أحدث الأخبار والرؤى حول الذكاء الاصطناعي، بعيدًا عن الضجيج الإعلامي.

المقاييس الرئيسية لقابلية الملاحظة

يمكن تصنيف مقاييس قابلية ملاحظة النماذج اللغوية الكبرى إلى ثلاثة أبعاد أساسية.

لا يمكن أن تحدث قابلية الملاحظة الشاملة للنماذج اللغوية الكبرى (LLMs) إلا إذا تتبعنا مقاييس قابلية الملاحظة التي تتبع أداء النظام، واستخدام الموارد، وسلوك النماذج.4

مقاييس أداء النظام:

  • زمن الانتقال: يمثل المدة من الإدخال إلى المخرجات والتي تمثل زمن استجابة النموذج.

  • الإنتاجية: عدد الطلبات التي يعالجها النموذج في مدة محددة؛ وهو مقياس لحمل النموذج.

  • معدل الخطأ: معدل حالات الفشل أو الاستجابات غير الصالحة؛ ويعكس مدى موثوقية النموذج.

مقاييس استخدام الموارد:

  • استخدام وحدة المعالجة المركزية/وحدة معالجة الرسومات: قياس الموارد المستهلكة في أثناء عملية الاستنتاج، مع مراعاة التكلفة والكفاءة.

  • استخدام الذاكرة: المساحة المستهلكة من ذاكرة الوصول العشوائي أو وحدة التخزين في أثناء المعالجة. ورغم أهميته للأداء وقابلية التوسع، فإن هذا الاستخدام يُعد ثانويًا بالنسبة إلى المهمة العامة.

  • استخدام الرموز المميزة: تتبع الرموز المميزة المُعالَجَة. تُعد هذه الخطوة مهمة بشكل خاص عندما تكون الرموز المميزة مرتبطة بالتكلفة في النماذج.

  • نسبة الإنتاجية إلى زمن الانتقال: تصف الإنتاجية أحمال تشغيل النظام مقارنةً بسرعة استجابته؛ ويُعد تحقيق توازن جيد بين هذين الأمرين أمرًا أساسيًا لتحقيق الكفاءة.

مقاييس سلوك النموذج:

  • الصحة: يراقب معدل إصدار النموذج لاستجابة صحيحة.

  • الصحة الواقعية: يُقيّم ما إذا كان النموذج يقدم مخرجات واقعية "صحيحة".

  • تفاعل المستخدمين: يقيس مدة التفاعل، والتعليقات، والرضا لتقييم التجربة.

  • جودة الاستجابة: يقيس مدى اتساق المخرجات ووضوحها وملاءمتها.5

مقارنة بين قابلية الملاحظة اليدوية وقابلية الملاحظة التلقائية القائمة على الوكلاء 

من الصعب مراقبة النماذج اللغوية الكبرى يدويًا نظرًا إلى كمية البيانات الكبيرة وبنية النظام المعقدة والحاجة إلى التتبع في الوقت الفعلي. وكثرة السجلات والمقاييس تصعب تحديد المشكلات بسرعة. علاوة على ذلك، تتطلب المراقبة اليدوية موارد كثيفة، وتكون عرضة للأخطاء، ولا يمكن أن تتوسع بفعالية مع توسع الأنظمة، ما يؤدي إلى بطء اكتشاف المشكلات وعدم كفاءة استكشاف المشكلات وإصلاحها.

 تُظهر هذه القيود مدى صعوبة المتابعة في قابلية الملاحظة يدويًا في النماذج اللغوية الكبرى، ما يسلط الضوء على الحاجة إلى حلول أكثر تطورًا واستقلالية في بيئات المؤسسات.6

عملية استكشاف الأخطاء وإصلاحها التلقائية والقائمة على الوكلاء 

يشير استكشاف الأخطاء وإصلاحها بشكل تلقائي إلى الأنظمة التي يمكنها تحديد المشكلات وتشخيصها وحلها بشكل مستقل من دون الحاجة إلى تدخل بشري من خلال استخدام طرق مراقبة متقدمة تعتمد على أنظمة قائمة على الوكلاء. يراقب الوكلاء الأداء ويرصدون الحالات الشاذة وينفذون عمليات تشخيص في الوقت الفعلي، ما يسمح بتشغيل الأنظمة من دون إشراف ومن دون أي تدخل بشري.7

تساعد عملية استكشاف الأخطاء وإصلاحها التلقائية والقائمة على الوكلاء على ما يلي:

  • الكشف في الوقت الفعلي: تحديد المشكلات فورًا من دون الحاجة إلى إدخال يدوي.

  • تحليل الأسباب الأساسية: تحديد مصدر المشكلات باستخدام معارف مستندة إلى الذكاء الاصطناعي. 

  • الحل الآلي: تطبيق حلول محددة مسبقًا وجاهزة للاستخدام الفوري لحل المشكلات.

  • المراقبة المستمرة: التكيف والتعلم من البيانات لتحسين عملية استكشاف الأخطاء وإصلاحها بمرور الوقت.

  • قابلية التوسع: التعامل مع البيئات المعقدة واسعة النطاق بكفاءة من خلال تقليل العمل اليدوي بشكل كبير.

  • الصيانة التنبئية: توقع المشكلات المحتملة قبل ظهورها، وهو ما يمكن أن يكون ذا قيمة كبيرة خلال دورات ذروة الأداء. 

  • التكامل مع قابلية الملاحظة: تستخدم أدوات قابلية الملاحظة الأخرى لحل المشكلات بشكل أسرع.

الحل المؤسسي 

مصممة للتوسع، تقدم IBM® Instana® رؤية فورية وإمكانية استكشاف الأخطاء وإصلاحها بشكل تلقائي بما يتناسب مع قابلية الملاحظة المعقدة في المؤسسات اليوم.

من خلال عملية مكونة من ثلاث خطوات—الكشف، والتشخيص المستند إلى الذكاء الاصطناعي، والمعالجة التلقائية—توفر Instana عملية استكشاف الأخطاء وإصلاحها بشكل تلقائي وشامل لضمان اكتشاف المشكلات وإصلاحها قبل أن تؤثر في الأداء.8

لمعرفة المزيد عن هذه الإمكانات، سجّل في قائمة انتظار الذكاء الاصطناعي الوكيل من Instana.

الخاتمة

يشمل توسيع نطاق الذكاء الاصطناعي التوليدي استكشاف الأخطاء وإصلاحها بشكل تلقائي باستخدام أدوات ذكية، ومراقبة النماذج اللغوية الكبرى في الوقت الفعلي، والتنسيق الفعال. يُعد تحسين مجموعات البيانات، ومخرجات النماذج، واستجابة النماذج اللغوية الكبرى بالإضافة إلى الصيانة الفائقة لأداء النماذج من خلال مسارات محسنة واختبار النماذج اللغوية الكبرى في الوقت الفعلي أمرًا بالغ الأهمية لتجربة مستخدم سلسة عبر حالات الاستخدام المختلفة مثل روبوتات المحادثة. يزداد استخدام النماذج اللغوية الكبرى مفتوحة المصدر وسير عمل التعلم الآلي بشكل مستمر بالاستفادة من تقنيات التضمين ومراقبة استدعاءات النماذج اللغوية الكبرى باستخدام مجموعة من الأدوات. أدوات مثل OpenTelemetry وغيرها من الأدوات التي تدمج أدوات متطورة لقابلية ملاحظة النماذج اللغوية الكبرى في منصات ولوحات معلومات متكاملة لقابلية الملاحظة ستكون ضرورية لتطوير أنظمة ذكاء اصطناعي قابلة للتوسع ومستقرة وتوفر الأداء الأمثل.9، 10

حلول ذات صلة
قابلية ملاحظة الأداء المؤتمتة في الواجهة الأمامية والخلفية للتطبيقات (Full Stack)

تمكَّن من تحديد مصدر المشكلة وإصلاحه سريعًا. حيث توفِّر البيانات عالية الدقة في الوقت الفعلي رؤية شاملة لبيئات التطبيقات والبنية التحتية الديناميكية.

تعرَّف على المزيد عن قابلية الملاحظة المؤتمتة للواجهة الأمامية والخلفية للتطبيقات (Full Stack)
استشارات الذكاء الاصطناعي لعمليات تكنولوجيا المعلومات

تمكَّن من رفع مستوى أتمتة وتشغيل تكنولوجيا المعلومات باستخدام الذكاء الاصطناعي التوليدي، مع ضمان توافق كل جانب من جوانب البنية التحتية لتكنولوجيا المعلومات مع أولويات الأعمال.

تعرَّف على المزيد عن استشارات الذكاء الاصطناعي لعمليات تكنولوجيا المعلومات
IBM SevOne Network Performance Management

IBM SevOne Network Performance Management هو برنامج مراقبة وتحليلات يوفر رؤية ومعارف في الوقت الفعلي للشبكات المعقدة.

مراقبة أداء الشبكة
اتخِذ الخطوة التالية

اكتشِف كيف يمكن لاستخدام الذكاء الاصطناعي في عمليات تقنية المعلومات منحك ما تحتاج إليه من معارف لدفع عجلة أداء أعمالك لمستويات استثنائية من التميز.

استكشف حلول الذكاء الاصطناعي لعمليات تقنية المعلومات احجز عرضًا توضيحيًا مباشرًا
الحواشي السفلية:

1 Kumar, S., & Singh, R. (2024). لا لوم على المستخدم: نحو وسائل لمصادقة عملية وقابلة للاستخدام. Communications of the ACM, 67(4), 78–85. https://dl.acm.org/doi/10.1145/3706599.3719914

2 Datadog. (n.d.). ما المقصود بقابلية ملاحظة ومراقبة النماذج اللغوية الكبرى (LLM)؟ مطلع عليه بتاريخ 19 مايو 2025، من https://www.datadoghq.com/knowledge center/llm-observability/.

3 قابلية ملاحظة النماذج اللغوية الكبرى، GitHub. مطلع عليه بتاريخ 19 مايو 2025، من https://github.com/DataDog/llm-observability، Datadog. (n.d.).

4 Dong, L., Lu, Q., & Zhu, L. (2024). AgentOps: تمكين قابلية ملاحظة وكلاء النماذج اللغوية الكبرى. arXiv. https://arxiv.org/abs/2411.05285.

5 LangChain. (n.d.). Datadog LLM Observability - LangChain, Langsmith .js. مطلع عليه بتاريخ 19 مايو 2025، من https://js.langchain.com/docs/integrations/callbacks/datadog_tracer/.

6 تحسين دقة النماذج اللغوية الكبرى، مطلع عليه بتاريخ 19 مايو 2025، من https://platform.openai.com/docs/guides/optimizing-llm-accuracy.

7 IBM Instana Observability. مطلع عليه بتاريخ 19 مايو 2025، من https://www.ibm.com/sa-ar/products/instana.

8 مراقبة وكلاء الذكاء الاصطناعي. IBM Documentation. مطلع عليه بتاريخ 19 مايو 2025، من https://www.ibm.com/docs/en/instana-observability/1.0.290?topic=applications-monitoring-ai-agents

9 Zhou, Y., Yang, Y., & Zhu, Q. (2023 LLMGuard: منع هجمات حقن الموجِّهات على النماذج اللغوية الكبرى عبر الكشف في وقت التشغيل. arXiv preprint arXiv:2307.15043. https://arxiv.org/abs/2307.15043.

10 Vesely, K., & Lewis, M. (2024). المراقبة والتشخيص في الوقت الفعلي لمسارات التعليم الآلي. Journal of Systems and Software, 185, 111136.