أحدث الأخبار التقنية، مدعومة برؤى خبراء
ابقَ على اطلاع دائم على أبرز الاتجاهات في مجالات الذكاء الاصطناعي، والأتمتة، والبيانات، وغيرها الكثير من خلال رسالة Think الإخبارية. راجع بيان الخصوصية لشركة IBM.
قابلية ملاحظة النماذج اللغوية الكبرى هي عملية جمع البيانات في الوقت الفعلي من النماذج اللغوية الكبرى أو تطبيقاتها حول خصائصها السلوكية وأدائها ومخرجاتها. ونظرًا إلى أن النماذج اللغوية الكبرى تتسم بالتعقيد، يمكننا مراقبتها بناءً على أنماط ما تنتجه.1
يتكون الحل الجيد لقابلية الملاحظة من جمع المقاييس والآثار والسجلات ذات الصلة من تطبيقات النماذج اللغوية الكبرى وواجهات برمجة التطبيقات (APIs) وسير العمل، ما يسمح للمطورين بمراقبة التطبيقات وتصحيح أخطائها وتحسينها بكفاءة واستباقية وعلى نطاق واسع.
النماذج اللغوية الكبرى (LLMs) ومنصات الذكاء الاصطناعي التوليدي مثل IBM watsonx.ai® ومجموعة متزايدة من النماذج مفتوحة المصدر تتزايد انتشارًا عبر المجالات. وبسبب هذه الزيادة، أصبح من المهم أكثر من أي وقت مضى الحفاظ على موثوقية وسلامة وكفاءة النماذج والتطبيقات بعد تبنيها. وهنا تصبح قابلية ملاحظة النماذج اللغوية الكبرى ضرورية.
ابقَ على اطلاع دائم على أبرز الاتجاهات في مجالات الذكاء الاصطناعي، والأتمتة، والبيانات، وغيرها الكثير من خلال رسالة Think الإخبارية. راجع بيان الخصوصية لشركة IBM.
يمكن تصنيف مقاييس قابلية ملاحظة النماذج اللغوية الكبرى إلى ثلاثة أبعاد أساسية.
لا يمكن أن تحدث قابلية الملاحظة الشاملة للنماذج اللغوية الكبرى (LLMs) إلا إذا تتبعنا مقاييس قابلية الملاحظة التي تتبع أداء النظام، واستخدام الموارد، وسلوك النماذج.4
مقاييس أداء النظام:
مقاييس استخدام الموارد:
مقاييس سلوك النموذج:
من الصعب مراقبة النماذج اللغوية الكبرى يدويًا نظرًا إلى كمية البيانات الكبيرة وبنية النظام المعقدة والحاجة إلى التتبع في الوقت الفعلي. وكثرة السجلات والمقاييس تصعب تحديد المشكلات بسرعة. علاوة على ذلك، تتطلب المراقبة اليدوية موارد كثيفة، وتكون عرضة للأخطاء، ولا يمكن أن تتوسع بفعالية مع توسع الأنظمة، ما يؤدي إلى بطء اكتشاف المشكلات وعدم كفاءة استكشاف المشكلات وإصلاحها.
تُظهر هذه القيود مدى صعوبة المتابعة في قابلية الملاحظة يدويًا في النماذج اللغوية الكبرى، ما يسلط الضوء على الحاجة إلى حلول أكثر تطورًا واستقلالية في بيئات المؤسسات.6
يشير استكشاف الأخطاء وإصلاحها بشكل تلقائي إلى الأنظمة التي يمكنها تحديد المشكلات وتشخيصها وحلها بشكل مستقل من دون الحاجة إلى تدخل بشري من خلال استخدام طرق مراقبة متقدمة تعتمد على أنظمة قائمة على الوكلاء. يراقب الوكلاء الأداء ويرصدون الحالات الشاذة وينفذون عمليات تشخيص في الوقت الفعلي، ما يسمح بتشغيل الأنظمة من دون إشراف ومن دون أي تدخل بشري.7
تساعد عملية استكشاف الأخطاء وإصلاحها التلقائية والقائمة على الوكلاء على ما يلي:
مصممة للتوسع، تقدم IBM® Instana® رؤية فورية وإمكانية استكشاف الأخطاء وإصلاحها بشكل تلقائي بما يتناسب مع قابلية الملاحظة المعقدة في المؤسسات اليوم.
من خلال عملية مكونة من ثلاث خطوات—الكشف، والتشخيص المستند إلى الذكاء الاصطناعي، والمعالجة التلقائية—توفر Instana عملية استكشاف الأخطاء وإصلاحها بشكل تلقائي وشامل لضمان اكتشاف المشكلات وإصلاحها قبل أن تؤثر في الأداء.8
لمعرفة المزيد عن هذه الإمكانات، سجّل في قائمة انتظار الذكاء الاصطناعي الوكيل من Instana.
يشمل توسيع نطاق الذكاء الاصطناعي التوليدي استكشاف الأخطاء وإصلاحها بشكل تلقائي باستخدام أدوات ذكية، ومراقبة النماذج اللغوية الكبرى في الوقت الفعلي، والتنسيق الفعال. يُعد تحسين مجموعات البيانات، ومخرجات النماذج، واستجابة النماذج اللغوية الكبرى بالإضافة إلى الصيانة الفائقة لأداء النماذج من خلال مسارات محسنة واختبار النماذج اللغوية الكبرى في الوقت الفعلي أمرًا بالغ الأهمية لتجربة مستخدم سلسة عبر حالات الاستخدام المختلفة مثل روبوتات المحادثة. يزداد استخدام النماذج اللغوية الكبرى مفتوحة المصدر وسير عمل التعلم الآلي بشكل مستمر بالاستفادة من تقنيات التضمين ومراقبة استدعاءات النماذج اللغوية الكبرى باستخدام مجموعة من الأدوات. أدوات مثل OpenTelemetry وغيرها من الأدوات التي تدمج أدوات متطورة لقابلية ملاحظة النماذج اللغوية الكبرى في منصات ولوحات معلومات متكاملة لقابلية الملاحظة ستكون ضرورية لتطوير أنظمة ذكاء اصطناعي قابلة للتوسع ومستقرة وتوفر الأداء الأمثل.9، 10
استفِد من إمكانات الذكاء الاصطناعي والأتمتة لحل المشكلات بشكل استباقي عبر مجموعة التطبيقات.
عزّز مرونتك التشغيلية إلى أقصى حد، واضمن سلامة تطبيقات السحابة الأصلية عبر قابلية الملاحظة المدعومة بالذكاء الاصطناعي.
تمكَّن من رفع مستوى أتمتة وتشغيل تكنولوجيا المعلومات باستخدام الذكاء الاصطناعي التوليدي، مع ضمان توافق كل جانب من جوانب البنية التحتية لتكنولوجيا المعلومات مع أولويات الأعمال.
1 Kumar, S., & Singh, R. (2024). لا لوم على المستخدم: نحو وسائل لمصادقة عملية وقابلة للاستخدام. Communications of the ACM, 67(4), 78–85. https://dl.acm.org/doi/10.1145/3706599.3719914.
2 Datadog. (n.d.). ما المقصود بقابلية ملاحظة ومراقبة النماذج اللغوية الكبرى (LLM)؟ مطلع عليه بتاريخ 19 مايو 2025، من https://www.datadoghq.com/knowledge center/llm-observability/.
3 قابلية ملاحظة النماذج اللغوية الكبرى، GitHub. مطلع عليه بتاريخ 19 مايو 2025، من https://github.com/DataDog/llm-observability، Datadog. (n.d.).
4 Dong, L., Lu, Q., & Zhu, L. (2024). AgentOps: تمكين قابلية ملاحظة وكلاء النماذج اللغوية الكبرى. arXiv. https://arxiv.org/abs/2411.05285.
5 LangChain. (n.d.). Datadog LLM Observability - LangChain, Langsmith .js. مطلع عليه بتاريخ 19 مايو 2025، من https://js.langchain.com/docs/integrations/callbacks/datadog_tracer/.
6 تحسين دقة النماذج اللغوية الكبرى، مطلع عليه بتاريخ 19 مايو 2025، من https://platform.openai.com/docs/guides/optimizing-llm-accuracy.
7 IBM Instana Observability. مطلع عليه بتاريخ 19 مايو 2025، من https://www.ibm.com/qa-ar/products/instana.
8 مراقبة وكلاء الذكاء الاصطناعي. IBM Documentation. مطلع عليه بتاريخ 19 مايو 2025، من https://www.ibm.com/docs/en/instana-observability/1.0.290?topic=applications-monitoring-ai-agents.
9 Zhou, Y., Yang, Y., & Zhu, Q. (2023 LLMGuard: منع هجمات حقن الموجِّهات على النماذج اللغوية الكبرى عبر الكشف في وقت التشغيل. arXiv preprint arXiv:2307.15043. https://arxiv.org/abs/2307.15043.
10 Vesely, K., & Lewis, M. (2024). المراقبة والتشخيص في الوقت الفعلي لمسارات التعليم الآلي. Journal of Systems and Software, 185, 111136.