ما المقصود بقابلية ملاحظة النماذج اللغوية الكبرى؟

المؤلفون

Data Scientist

Lead AI Advocate

PMM Intern

تعريف قابلية ملاحظة النماذج اللغوية الكبرى

قابلية ملاحظة النماذج اللغوية الكبرى هي عملية جمع البيانات في الوقت الفعلي من النماذج اللغوية الكبرى أو تطبيقاتها حول خصائصها السلوكية وأدائها ومخرجاتها. ونظرًا إلى أن النماذج اللغوية الكبرى تتسم بالتعقيد، يمكننا مراقبتها بناءً على أنماط ما تنتجه.¹

يتكون الحل الجيد لقابلية الملاحظة من جمع المقاييس والآثار والسجلات ذات الصلة من تطبيقات النماذج اللغوية الكبرى وواجهات برمجة التطبيقات (APIs) وسير العمل، ما يسمح للمطورين بمراقبة التطبيقات وتصحيح أخطائها وتحسينها بكفاءة واستباقية وعلى نطاق واسع.

النماذج اللغوية الكبرى (LLMs) ومنصات الذكاء الاصطناعي التوليدي مثل IBM watsonx.ai® ومجموعة متزايدة من النماذج مفتوحة المصدر تتزايد انتشارًا عبر المجالات. وبسبب هذه الزيادة، أصبح من المهم أكثر من أي وقت مضى الحفاظ على موثوقية وسلامة وكفاءة النماذج والتطبيقات بعد تبنيها. وهنا تصبح قابلية ملاحظة النماذج اللغوية الكبرى ضرورية.

النشرة الإخبارية الخاصة بالمجال

أحدث الأخبار التقنية، مدعومة برؤى خبراء

ابقَ على اطلاع دائم على أبرز الاتجاهات في مجالات الذكاء الاصطناعي، والأتمتة، والبيانات، وغيرها الكثير من خلال رسالة Think الإخبارية. راجع بيان الخصوصية لشركة IBM.

ما أهمية قابلية ملاحظة النماذج اللغوية الكبرى؟

مراقبة جودة ومخرجات النماذج اللغوية الكبرى:
يمكن تصنيف التقييم المستمر للمخرجات التي تنتجها النماذج اللغوية الكبرى إلى عدة أبعاد للجودة، وهو أمر مفيد وقابل للتطبيق بالنسبة إلى المستخدمين. تتضمن هذه الأبعاد الصحة والملاءمة والترابط والاتساق الواقعي مع مقاييس التقييم المحددة. يساعد التحقق الدوري من أبعاد الأداء هذه على منع التأخيرات أو المشكلات التي قد تتسبب في فقدان المستخدمين الثقة في البرنامج وصعوبة استخدام النماذج اللغوية الكبرى بكفاءة.
تحليل سريع للأسباب الأساسية واستكشاف الأخطاء وإصلاحها:
عندما يحدث عطل كبير أو سلوك غير متوقع في تطبيقات النماذج اللغوية الكبرى، يمكن لأداة قابلية الملاحظة أن توفر معارف مفيدة لتحديد السبب (أو الأسباب) الأساسي لظهور المشكلة بسرعة. سيسمح هذا المستوى من القياس عن بُعد الدقيق للأطراف المعنية عمومًا بالتعرف على المشكلات بمستويات أعلى من الثقة في العديد من المجالات. على سبيل المثال، بيانات التدريب التالفة، أو عملية الضبط الدقيق سيئة التصميم، أو استدعاءات واجهة برمجة التطبيقات الخارجية الفاشلة، أو تعطل الواجهة الخلفية بسبب تعطل مقدم الخدمة الخارجي.
تحسين التطبيقات، وتفاعل المستخدمين، وكفاءة النظام:
تسمح قابلية ملاحظة النماذج اللغوية الكبرى بتحسين أداء التطبيقات وتفاعل المستخدمين من خلال المراقبة المستمرة لمجموعة النماذج اللغوية الكبرى بأكملها. يُجرى تتبع المقاييس مثل زمن الانتقال، والرموز المميزة المستخدمة، وزمن الاستجابة، وسرعة الإنتاج، لتحديد العوائق والعوامل المقيدة للسماح بتحسين الأداء وتقليل التكاليف، خاصة في سير العمل التوليد المعزز بالاسترجاع (RAG). يساعد تتبع التفاعلات وتعليقات المستخدمين في الوقت الفعلي على توفير معارف حول حالات توليد مخرجات منخفضة الجودة، وحل المشكلات عند ظهورها، واكتشاف الأسباب الأساسية. يتيح هذا التكيف المستمر مع سلوك المستخدم للنماذج اللغوية الكبرى إنتاج استجابات مخصصة، وتحسين سير العمل، والتوسع لتلبية الطلب من دون التأثير سلبًا في الأداء.^2،³

IBM DevOps

ما المقصود بعمليات التطوير؟

تشرح Andrea Crawford مفهوم عمليات التطوير، وقيمتها، وكيفية مساهمة الممارسات والأدوات الخاصة بها في المساعدة على نقل التطبيقات عبر مسار تسليم البرمجيات بأكمله؛ بدءًا من الفكرة ووصولًا إلى الإنتاج. يتولى أبرز قادة الفكر في IBM هذا المنهج، ويهدف إلى مساعدة قادة الأعمال على اكتساب المعرفة اللازمة لتحديد أولويات الاستثمارات في الذكاء الاصطناعي التي يمكنها تعزيز النمو.

استكشف عمليات التطوير

المقاييس الرئيسية لقابلية الملاحظة

يمكن تصنيف مقاييس قابلية ملاحظة النماذج اللغوية الكبرى إلى ثلاثة أبعاد أساسية.

لا يمكن أن تحدث قابلية الملاحظة الشاملة للنماذج اللغوية الكبرى (LLMs) إلا إذا تتبعنا مقاييس قابلية الملاحظة التي تتبع أداء النظام، واستخدام الموارد، وسلوك النماذج.⁴

مقاييس أداء النظام:

زمن الانتقال: يمثل المدة من الإدخال إلى المخرجات والتي تمثل زمن استجابة النموذج.
الإنتاجية: عدد الطلبات التي يعالجها النموذج في مدة محددة؛ وهو مقياس لحمل النموذج.
معدل الخطأ: معدل حالات الفشل أو الاستجابات غير الصالحة؛ ويعكس مدى موثوقية النموذج.

مقاييس استخدام الموارد:

استخدام وحدة المعالجة المركزية/وحدة معالجة الرسومات: قياس الموارد المستهلكة في أثناء عملية الاستنتاج، مع مراعاة التكلفة والكفاءة.
استخدام الذاكرة: المساحة المستهلكة من ذاكرة الوصول العشوائي أو وحدة التخزين في أثناء المعالجة. ورغم أهميته للأداء وقابلية التوسع، فإن هذا الاستخدام يُعد ثانويًا بالنسبة إلى المهمة العامة.
استخدام الرموز المميزة: تتبع الرموز المميزة المُعالَجَة. تُعد هذه الخطوة مهمة بشكل خاص عندما تكون الرموز المميزة مرتبطة بالتكلفة في النماذج.
نسبة الإنتاجية إلى زمن الانتقال: تصف الإنتاجية أحمال تشغيل النظام مقارنةً بسرعة استجابته؛ ويُعد تحقيق توازن جيد بين هذين الأمرين أمرًا أساسيًا لتحقيق الكفاءة.

مقاييس سلوك النموذج:

الصحة: يراقب معدل إصدار النموذج لاستجابة صحيحة.
الصحة الواقعية: يُقيّم ما إذا كان النموذج يقدم مخرجات واقعية "صحيحة".
تفاعل المستخدمين: يقيس مدة التفاعل، والتعليقات، والرضا لتقييم التجربة.
جودة الاستجابة: يقيس مدى اتساق المخرجات ووضوحها وملاءمتها.⁵

مقارنة بين قابلية الملاحظة اليدوية وقابلية الملاحظة التلقائية القائمة على الوكلاء

من الصعب مراقبة النماذج اللغوية الكبرى يدويًا نظرًا إلى كمية البيانات الكبيرة وبنية النظام المعقدة والحاجة إلى التتبع في الوقت الفعلي. وكثرة السجلات والمقاييس تصعب تحديد المشكلات بسرعة. علاوة على ذلك، تتطلب المراقبة اليدوية موارد كثيفة، وتكون عرضة للأخطاء، ولا يمكن أن تتوسع بفعالية مع توسع الأنظمة، ما يؤدي إلى بطء اكتشاف المشكلات وعدم كفاءة استكشاف المشكلات وإصلاحها.

 تُظهر هذه القيود مدى صعوبة المتابعة في قابلية الملاحظة يدويًا في النماذج اللغوية الكبرى، ما يسلط الضوء على الحاجة إلى حلول أكثر تطورًا واستقلالية في بيئات المؤسسات.⁶

عملية استكشاف الأخطاء وإصلاحها التلقائية والقائمة على الوكلاء

يشير استكشاف الأخطاء وإصلاحها بشكل تلقائي إلى الأنظمة التي يمكنها تحديد المشكلات وتشخيصها وحلها بشكل مستقل من دون الحاجة إلى تدخل بشري من خلال استخدام طرق مراقبة متقدمة تعتمد على أنظمة قائمة على الوكلاء. يراقب الوكلاء الأداء ويرصدون الحالات الشاذة وينفذون عمليات تشخيص في الوقت الفعلي، ما يسمح بتشغيل الأنظمة من دون إشراف ومن دون أي تدخل بشري.⁷

تساعد عملية استكشاف الأخطاء وإصلاحها التلقائية والقائمة على الوكلاء على ما يلي:

الكشف في الوقت الفعلي: تحديد المشكلات فورًا من دون الحاجة إلى إدخال يدوي.
تحليل الأسباب الأساسية: تحديد مصدر المشكلات باستخدام معارف مستندة إلى الذكاء الاصطناعي.
الحل الآلي: تطبيق حلول محددة مسبقًا وجاهزة للاستخدام الفوري لحل المشكلات.
المراقبة المستمرة: التكيف والتعلم من البيانات لتحسين عملية استكشاف الأخطاء وإصلاحها بمرور الوقت.
قابلية التوسع: التعامل مع البيئات المعقدة واسعة النطاق بكفاءة من خلال تقليل العمل اليدوي بشكل كبير.
الصيانة التنبئية: توقع المشكلات المحتملة قبل ظهورها، وهو ما يمكن أن يكون ذا قيمة كبيرة خلال دورات ذروة الأداء.
التكامل مع قابلية الملاحظة: تستخدم أدوات قابلية الملاحظة الأخرى لحل المشكلات بشكل أسرع.

الحل المؤسسي

مصممة للتوسع، تقدم IBM® Instana® رؤية فورية وإمكانية استكشاف الأخطاء وإصلاحها بشكل تلقائي بما يتناسب مع قابلية الملاحظة المعقدة في المؤسسات اليوم.

من خلال عملية مكونة من ثلاث خطوات—الكشف، والتشخيص المستند إلى الذكاء الاصطناعي، والمعالجة التلقائية—توفر Instana عملية استكشاف الأخطاء وإصلاحها بشكل تلقائي وشامل لضمان اكتشاف المشكلات وإصلاحها قبل أن تؤثر في الأداء.⁸

لمعرفة المزيد عن هذه الإمكانات، سجّل في قائمة انتظار الذكاء الاصطناعي الوكيل من Instana.

الخاتمة

يشمل توسيع نطاق الذكاء الاصطناعي التوليدي استكشاف الأخطاء وإصلاحها بشكل تلقائي باستخدام أدوات ذكية، ومراقبة النماذج اللغوية الكبرى في الوقت الفعلي، والتنسيق الفعال. يُعد تحسين مجموعات البيانات، ومخرجات النماذج، واستجابة النماذج اللغوية الكبرى بالإضافة إلى الصيانة الفائقة لأداء النماذج من خلال مسارات محسنة واختبار النماذج اللغوية الكبرى في الوقت الفعلي أمرًا بالغ الأهمية لتجربة مستخدم سلسة عبر حالات الاستخدام المختلفة مثل روبوتات المحادثة. يزداد استخدام النماذج اللغوية الكبرى مفتوحة المصدر وسير عمل التعلم الآلي بشكل مستمر بالاستفادة من تقنيات التضمين ومراقبة استدعاءات النماذج اللغوية الكبرى باستخدام مجموعة من الأدوات. أدوات مثل OpenTelemetry وغيرها من الأدوات التي تدمج أدوات متطورة لقابلية ملاحظة النماذج اللغوية الكبرى في منصات ولوحات معلومات متكاملة لقابلية الملاحظة ستكون ضرورية لتطوير أنظمة ذكاء اصطناعي قابلة للتوسع ومستقرة وتوفر الأداء الأمثل.^{9، 10}

تسليم البرامج بكفاءة

يُعَد تحسين كفاءة تسليم البرامج أمرًا حاسمًا للمؤسسات التي تواجه تحديات اقتصادية، والتركيز على أتمتة عمليات التطوير هو العامل الرئيسي لذلك.

الموارد

تحسين أداء الأعمال باستخدام التحليلات المدعومة بالذكاء الاصطناعي

سجِّل الآن لتتعرف على كيفية استخدام تحليلات الذكاء الاصطناعي المتقدمة لفتح آفاق جديدة للنمو والابتكار في عملك. احصل على رؤى الخبراء واكتشف كيفية تحسين الكفاءة التشغيلية، وتحسين استخدام الموارد، وتحقيق نتائج ملموسة للأعمال باستخدام حلول الذكاء الاصطناعي.

تحديث تطبيقات الكمبيوتر المركزي باستخدام أنماط السحابة الهجينة

اكتشف أحدث منشورات IBM Redbooks حول تحديث الكمبيوتر المركزي لبيئات السحابة الهجينة. تعرَّف على استراتيجيات قابلة للتنفيذ، وحلول للبنية، وتقنيات تكامل لتعزيز المرونة والابتكار وتحقيق نجاح الأعمال.

تعزيز عمليات تطوير z/OS باستخدام الأتمتة والتحديث

اكتشف كيفية استخدام IBM Wazi Deploy وميزات اللغات الحديثة لتبسيط عمليات تطوير z/OS. تعرَّف على كيفية مساهمة الأتمتة والأدوات مفتوحة المصدر في تحسين الكفاءة عبر المنصات المختلفة.

برنامج تسريع عمليات التطوير

ابدأ رحلتك في تحول عمليات التطوير لديك مع برنامج DevOps Acceleration من IBM. يرشد هذا البرنامج الشركات عبر المراحل الحيوية مثل التقييم، والتدريب، والنشر، والتبني لتحقيق تنفيذ سلس لعمليات التطوير.

تقرير Magic Quadrant من Gartner لعام 2024 لأدوات تكامل البيانات

تم اختيار IBM كشركة رائدة للعام التاسع عشر على التوالي في تقرير Magic Quadrant من Gartner لعام 2024 لأدوات تكامل البيانات.

حلول ذات صلة

IBM DevOps Accelerate

أتمتة تسليم البرامج لأي تطبيق محليًا أو على السحابة أو الكمبيوتر المركزي.

استكشف DevOps Accelerate

حلول عمليات التطوير

استخدم أدوات وبرمجيات عمليات التطوير لإنشاء تطبيقات السحابة الأصلية ونشرها وإدارتها عبر أجهزة وبيئات متعددة.

استكشف حلول عمليات التطوير

خدمات الاستشارات السحابية

أطلق العنان للقدرات الجديدة وحفِّز مرونة الأعمال من خلال خدمات الاستشارات السحابية من IBM. اكتشف كيفية المشاركة في إنشاء الحلول وتسريع التحول الرقمي وتحسين الأداء من خلال إستراتيجيات السحابة الهجينة والشراكات مع الخبراء.

الخدمات السحابية

اتخِذ الخطوة التالية

تحقيق أقصى استفادة من إمكانات عمليات التطوير لإنشاء تطبيقات السحابة الأصلية الآمنة واختبارها ونشرها من خلال التكامل المستمر والتسليم المستمر.

استكشف حلول عمليات التطوير

اكتشف عمليات التطوير أثناء العمل

الحواشي السفلية:

¹ Kumar, S., & Singh, R. (2024). لا لوم على المستخدم: نحو وسائل لمصادقة عملية وقابلة للاستخدام. Communications of the ACM, 67(4), 78–85. https://dl.acm.org/doi/10.1145/3706599.3719914.

² Datadog. (n.d.). ما المقصود بقابلية ملاحظة ومراقبة النماذج اللغوية الكبرى (LLM)؟ مطلع عليه بتاريخ 19 مايو 2025، من https://www.datadoghq.com/knowledge center/llm-observability/.

³ قابلية ملاحظة النماذج اللغوية الكبرى، GitHub. مطلع عليه بتاريخ 19 مايو 2025، من https://github.com/DataDog/llm-observability، Datadog. (n.d.).

⁴ Dong, L., Lu, Q., & Zhu, L. (2024). AgentOps: تمكين قابلية ملاحظة وكلاء النماذج اللغوية الكبرى. arXiv. https://arxiv.org/abs/2411.05285.

⁵ LangChain. (n.d.). Datadog LLM Observability - LangChain, Langsmith .js. مطلع عليه بتاريخ 19 مايو 2025، من https://js.langchain.com/docs/integrations/callbacks/datadog_tracer/.

⁶ تحسين دقة النماذج اللغوية الكبرى، مطلع عليه بتاريخ 19 مايو 2025، من https://platform.openai.com/docs/guides/optimizing-llm-accuracy.

⁷ IBM Instana Observability. مطلع عليه بتاريخ 19 مايو 2025، من https://www.ibm.com/sa-ar/products/instana.

⁸ مراقبة وكلاء الذكاء الاصطناعي. IBM Documentation. مطلع عليه بتاريخ 19 مايو 2025، من https://www.ibm.com/docs/en/instana-observability/1.0.290?topic=applications-monitoring-ai-agents.

⁹ Zhou, Y., Yang, Y., & Zhu, Q. (2023 LLMGuard: منع هجمات حقن الموجِّهات على النماذج اللغوية الكبرى عبر الكشف في وقت التشغيل. arXiv preprint arXiv:2307.15043. https://arxiv.org/abs/2307.15043.

¹⁰ Vesely, K., & Lewis, M. (2024). المراقبة والتشخيص في الوقت الفعلي لمسارات التعليم الآلي. Journal of Systems and Software, 185, 111136.