ما المقصود بقابلية ملاحظة النماذج اللغوية الكبرى؟

المؤلفون

Joshua Noble

Data Scientist

Shalini Harkar

Lead AI Advocate

تعريف قابلية ملاحظة النماذج اللغوية الكبرى

قابلية ملاحظة النماذج اللغوية الكبرى هي عملية جمع البيانات في الوقت الفعلي من النماذج اللغوية الكبرى أو تطبيقاتها حول خصائصها السلوكية وأدائها ومخرجاتها. ونظرًا إلى أن النماذج اللغوية الكبرى تتسم بالتعقيد، يمكننا مراقبتها بناءً على أنماط ما تنتجه.1

يتكون الحل الجيد لقابلية الملاحظة من جمع المقاييس والآثار والسجلات ذات الصلة من تطبيقات النماذج اللغوية الكبرى وواجهات برمجة التطبيقات (APIs) وسير العمل، ما يسمح للمطورين بمراقبة التطبيقات وتصحيح أخطائها وتحسينها بكفاءة واستباقية وعلى نطاق واسع. 

النماذج اللغوية الكبرى (LLMs) ومنصات الذكاء الاصطناعي التوليدي مثل IBM watsonx.ai® ومجموعة متزايدة من النماذج مفتوحة المصدر تتزايد انتشارًا عبر المجالات. وبسبب هذه الزيادة، أصبح من المهم أكثر من أي وقت مضى الحفاظ على موثوقية وسلامة وكفاءة النماذج والتطبيقات بعد تبنيها. وهنا تصبح قابلية ملاحظة النماذج اللغوية الكبرى ضرورية.

ما أهمية قابلية ملاحظة النماذج اللغوية الكبرى؟

  • مراقبة جودة ومخرجات النماذج اللغوية الكبرى:
    يمكن تصنيف التقييم المستمر للمخرجات التي تنتجها النماذج اللغوية الكبرى إلى عدة أبعاد للجودة، وهو أمر مفيد وقابل للتطبيق بالنسبة إلى المستخدمين. تتضمن هذه الأبعاد الصحة والملاءمة والترابط والاتساق الواقعي مع مقاييس التقييم المحددة. يساعد التحقق الدوري من أبعاد الأداء هذه على منع التأخيرات أو المشكلات التي قد تتسبب في فقدان المستخدمين الثقة في البرنامج وصعوبة استخدام النماذج اللغوية الكبرى بكفاءة.

  • تحليل سريع للأسباب الأساسية واستكشاف الأخطاء وإصلاحها:
    عندما يحدث عطل كبير أو سلوك غير متوقع في تطبيقات النماذج اللغوية الكبرى، يمكن لأداة قابلية الملاحظة أن توفر معارف مفيدة لتحديد السبب (أو الأسباب) الأساسي لظهور المشكلة بسرعة. سيسمح هذا المستوى من القياس عن بُعد الدقيق للأطراف المعنية عمومًا بالتعرف على المشكلات بمستويات أعلى من الثقة في العديد من المجالات. على سبيل المثال، بيانات التدريب التالفة، أو عملية الضبط الدقيق سيئة التصميم، أو استدعاءات واجهة برمجة التطبيقات الخارجية الفاشلة، أو تعطل الواجهة الخلفية بسبب تعطل مقدم الخدمة الخارجي.

  • تحسين التطبيقات، وتفاعل المستخدمين، وكفاءة النظام:
    تسمح قابلية ملاحظة النماذج اللغوية الكبرى بتحسين أداء التطبيقات وتفاعل المستخدمين من خلال المراقبة المستمرة لمجموعة النماذج اللغوية الكبرى بأكملها. يُجرى تتبع المقاييس مثل زمن الانتقال، والرموز المميزة المستخدمة، وزمن الاستجابة، وسرعة الإنتاج، لتحديد العوائق والعوامل المقيدة للسماح بتحسين الأداء وتقليل التكاليف، خاصة في سير العمل التوليد المعزز بالاسترجاع (RAG). يساعد تتبع التفاعلات وتعليقات المستخدمين في الوقت الفعلي على توفير معارف حول حالات توليد مخرجات منخفضة الجودة، وحل المشكلات عند ظهورها، واكتشاف الأسباب الأساسية. يتيح هذا التكيف المستمر مع سلوك المستخدم للنماذج اللغوية الكبرى إنتاج استجابات مخصصة، وتحسين سير العمل، والتوسع لتلبية الطلب من دون التأثير سلبًا في الأداء.3
IBM DevOps

ما المقصود بعمليات التطوير؟

تشرح Andrea Crawford مفهوم عمليات التطوير، وقيمتها، وكيفية مساهمة الممارسات والأدوات الخاصة بها في المساعدة على نقل التطبيقات عبر مسار تسليم البرمجيات بأكمله؛ بدءًا من الفكرة ووصولًا إلى الإنتاج. يتولى أبرز قادة الفكر في IBM هذا المنهج، ويهدف إلى مساعدة قادة الأعمال على اكتساب المعرفة اللازمة لتحديد أولويات الاستثمارات في الذكاء الاصطناعي التي يمكنها تعزيز النمو.

المقاييس الرئيسية لقابلية الملاحظة

يمكن تصنيف مقاييس قابلية ملاحظة النماذج اللغوية الكبرى إلى ثلاثة أبعاد أساسية.

لا يمكن أن تحدث قابلية الملاحظة الشاملة للنماذج اللغوية الكبرى (LLMs) إلا إذا تتبعنا مقاييس قابلية الملاحظة التي تتبع أداء النظام، واستخدام الموارد، وسلوك النماذج.4

مقاييس أداء النظام:

  • زمن الانتقال: يمثل المدة من الإدخال إلى المخرجات والتي تمثل زمن استجابة النموذج.

  • الإنتاجية: عدد الطلبات التي يعالجها النموذج في مدة محددة؛ وهو مقياس لحمل النموذج.

  • معدل الخطأ: معدل حالات الفشل أو الاستجابات غير الصالحة؛ ويعكس مدى موثوقية النموذج.

مقاييس استخدام الموارد:

  • استخدام وحدة المعالجة المركزية/وحدة معالجة الرسومات: قياس الموارد المستهلكة في أثناء عملية الاستنتاج، مع مراعاة التكلفة والكفاءة.

  • استخدام الذاكرة: المساحة المستهلكة من ذاكرة الوصول العشوائي أو وحدة التخزين في أثناء المعالجة. ورغم أهميته للأداء وقابلية التوسع، فإن هذا الاستخدام يُعد ثانويًا بالنسبة إلى المهمة العامة.

  • استخدام الرموز المميزة: تتبع الرموز المميزة المُعالَجَة. تُعد هذه الخطوة مهمة بشكل خاص عندما تكون الرموز المميزة مرتبطة بالتكلفة في النماذج.

  • نسبة الإنتاجية إلى زمن الانتقال: تصف الإنتاجية أحمال تشغيل النظام مقارنةً بسرعة استجابته؛ ويُعد تحقيق توازن جيد بين هذين الأمرين أمرًا أساسيًا لتحقيق الكفاءة.

مقاييس سلوك النموذج:

  • الصحة: يراقب معدل إصدار النموذج لاستجابة صحيحة.

  • الصحة الواقعية: يُقيّم ما إذا كان النموذج يقدم مخرجات واقعية "صحيحة".

  • تفاعل المستخدمين: يقيس مدة التفاعل، والتعليقات، والرضا لتقييم التجربة.

  • جودة الاستجابة: يقيس مدى اتساق المخرجات ووضوحها وملاءمتها.5

مقارنة بين قابلية الملاحظة اليدوية وقابلية الملاحظة التلقائية القائمة على الوكلاء 

من الصعب مراقبة النماذج اللغوية الكبرى يدويًا نظرًا إلى كمية البيانات الكبيرة وبنية النظام المعقدة والحاجة إلى التتبع في الوقت الفعلي. وكثرة السجلات والمقاييس تصعب تحديد المشكلات بسرعة. علاوة على ذلك، تتطلب المراقبة اليدوية موارد كثيفة، وتكون عرضة للأخطاء، ولا يمكن أن تتوسع بفعالية مع توسع الأنظمة، ما يؤدي إلى بطء اكتشاف المشكلات وعدم كفاءة استكشاف المشكلات وإصلاحها.

 تُظهر هذه القيود مدى صعوبة المتابعة في قابلية الملاحظة يدويًا في النماذج اللغوية الكبرى، ما يسلط الضوء على الحاجة إلى حلول أكثر تطورًا واستقلالية في بيئات المؤسسات.6

عملية استكشاف الأخطاء وإصلاحها التلقائية والقائمة على الوكلاء 

يشير استكشاف الأخطاء وإصلاحها بشكل تلقائي إلى الأنظمة التي يمكنها تحديد المشكلات وتشخيصها وحلها بشكل مستقل من دون الحاجة إلى تدخل بشري من خلال استخدام طرق مراقبة متقدمة تعتمد على أنظمة قائمة على الوكلاء. يراقب الوكلاء الأداء ويرصدون الحالات الشاذة وينفذون عمليات تشخيص في الوقت الفعلي، ما يسمح بتشغيل الأنظمة من دون إشراف ومن دون أي تدخل بشري.7

تساعد عملية استكشاف الأخطاء وإصلاحها التلقائية والقائمة على الوكلاء على ما يلي:

  • الكشف في الوقت الفعلي: تحديد المشكلات فورًا من دون الحاجة إلى إدخال يدوي.

  • تحليل الأسباب الأساسية: تحديد مصدر المشكلات باستخدام معارف مستندة إلى الذكاء الاصطناعي. 

  • الحل الآلي: تطبيق حلول محددة مسبقًا وجاهزة للاستخدام الفوري لحل المشكلات.

  • المراقبة المستمرة: التكيف والتعلم من البيانات لتحسين عملية استكشاف الأخطاء وإصلاحها بمرور الوقت.

  • قابلية التوسع: التعامل مع البيئات المعقدة واسعة النطاق بكفاءة من خلال تقليل العمل اليدوي بشكل كبير.

  • الصيانة التنبئية: توقع المشكلات المحتملة قبل ظهورها، وهو ما يمكن أن يكون ذا قيمة كبيرة خلال دورات ذروة الأداء. 

  • التكامل مع قابلية الملاحظة: تستخدم أدوات قابلية الملاحظة الأخرى لحل المشكلات بشكل أسرع.

الحل المؤسسي 

مصممة للتوسع، تقدم IBM® Instana® رؤية فورية وإمكانية استكشاف الأخطاء وإصلاحها بشكل تلقائي بما يتناسب مع قابلية الملاحظة المعقدة في المؤسسات اليوم.

من خلال عملية مكونة من ثلاث خطوات—الكشف، والتشخيص المستند إلى الذكاء الاصطناعي، والمعالجة التلقائية—توفر Instana عملية استكشاف الأخطاء وإصلاحها بشكل تلقائي وشامل لضمان اكتشاف المشكلات وإصلاحها قبل أن تؤثر في الأداء.8

لمعرفة المزيد عن هذه الإمكانات، سجّل في قائمة انتظار الذكاء الاصطناعي الوكيل من Instana.

الخاتمة

يشمل توسيع نطاق الذكاء الاصطناعي التوليدي استكشاف الأخطاء وإصلاحها بشكل تلقائي باستخدام أدوات ذكية، ومراقبة النماذج اللغوية الكبرى في الوقت الفعلي، والتنسيق الفعال. يُعد تحسين مجموعات البيانات، ومخرجات النماذج، واستجابة النماذج اللغوية الكبرى بالإضافة إلى الصيانة الفائقة لأداء النماذج من خلال مسارات محسنة واختبار النماذج اللغوية الكبرى في الوقت الفعلي أمرًا بالغ الأهمية لتجربة مستخدم سلسة عبر حالات الاستخدام المختلفة مثل روبوتات المحادثة. يزداد استخدام النماذج اللغوية الكبرى مفتوحة المصدر وسير عمل التعلم الآلي بشكل مستمر بالاستفادة من تقنيات التضمين ومراقبة استدعاءات النماذج اللغوية الكبرى باستخدام مجموعة من الأدوات. أدوات مثل OpenTelemetry وغيرها من الأدوات التي تدمج أدوات متطورة لقابلية ملاحظة النماذج اللغوية الكبرى في منصات ولوحات معلومات متكاملة لقابلية الملاحظة ستكون ضرورية لتطوير أنظمة ذكاء اصطناعي قابلة للتوسع ومستقرة وتوفر الأداء الأمثل.9، 10

حلول ذات صلة
IBM Instana Observability

استفِد من إمكانات الذكاء الاصطناعي والأتمتة لحل المشكلات بشكل استباقي عبر مجموعة التطبيقات.

استكشف IBM Instana Observability
حلول قابلية الملاحظة من IBM

عزّز مرونتك التشغيلية إلى أقصى حد، واضمن سلامة تطبيقات السحابة الأصلية عبر قابلية الملاحظة المدعومة بالذكاء الاصطناعي.

استكشف حلول IBM Observability
الذكاء الاصطناعي لعمليات تقنية المعلومات من IBM Consulting®

تمكَّن من رفع مستوى أتمتة وتشغيل تكنولوجيا المعلومات باستخدام الذكاء الاصطناعي التوليدي، مع ضمان توافق كل جانب من جوانب البنية التحتية لتكنولوجيا المعلومات مع أولويات الأعمال.

اكتشِف الذكاء الاصطناعي لعمليات تقنية المعلومات من IBM Consulting
اتخذ الخطوة التالية

اكتشِف كيف توفِّر IBM Instana مراقبة أداء التطبيقات في الوقت الفعلي ورؤًى مدعومة بالذكاء الاصطناعي، متاحة كخدمة SaaS أو للتشغيل الداخلي.

  1. استكشف IBM Instana Observability
  2. شاهد الميزة بصورة عملية
الحواشي السفلية:

1 Kumar, S., & Singh, R. (2024). لا لوم على المستخدم: نحو وسائل لمصادقة عملية وقابلة للاستخدام. Communications of the ACM, 67(4), 78–85. https://dl.acm.org/doi/10.1145/3706599.3719914

2 Datadog. (n.d.). ما المقصود بقابلية ملاحظة ومراقبة النماذج اللغوية الكبرى (LLM)؟ مطلع عليه بتاريخ 19 مايو 2025، من https://www.datadoghq.com/knowledge center/llm-observability/.

3 قابلية ملاحظة النماذج اللغوية الكبرى، GitHub. مطلع عليه بتاريخ 19 مايو 2025، من https://github.com/DataDog/llm-observability، Datadog. (n.d.).

4 Dong, L., Lu, Q., & Zhu, L. (2024). AgentOps: تمكين قابلية ملاحظة وكلاء النماذج اللغوية الكبرى. arXiv. https://arxiv.org/abs/2411.05285.

5 LangChain. (n.d.). Datadog LLM Observability - LangChain, Langsmith .js. مطلع عليه بتاريخ 19 مايو 2025، من https://js.langchain.com/docs/integrations/callbacks/datadog_tracer/.

6 تحسين دقة النماذج اللغوية الكبرى، مطلع عليه بتاريخ 19 مايو 2025، من https://platform.openai.com/docs/guides/optimizing-llm-accuracy.

7 IBM Instana Observability. مطلع عليه بتاريخ 19 مايو 2025، من https://www.ibm.com/qa-ar/products/instana.

8 مراقبة وكلاء الذكاء الاصطناعي. IBM Documentation. مطلع عليه بتاريخ 19 مايو 2025، من https://www.ibm.com/docs/en/instana-observability/1.0.290?topic=applications-monitoring-ai-agents

9 Zhou, Y., Yang, Y., & Zhu, Q. (2023 LLMGuard: منع هجمات حقن الموجِّهات على النماذج اللغوية الكبرى عبر الكشف في وقت التشغيل. arXiv preprint arXiv:2307.15043. https://arxiv.org/abs/2307.15043.

10 Vesely, K., & Lewis, M. (2024). المراقبة والتشخيص في الوقت الفعلي لمسارات التعليم الآلي. Journal of Systems and Software, 185, 111136.