ما عمليات النماذج اللغوية الكبيرة (LLMOps)؟
استكشف حل عمليات النماذج اللغوية الكبيرة الذي يقدمه IBM سجل للتعرف على تحديثات الذكاء الاصطناعي
رسم توضيحي يحتوي على مجموعة من الرموز التوضيحية على شكل سُحُب، ومخطط دائري، ورسم بياني من الرموز التوضيحية
 ما عمليات النماذج اللغوية الكبيرة؟

إن LLMOps هو اختصار "عمليات النماذج اللغوية الكبيرة"، ويشير إلى الممارسات المتخصصة وسير العمل الذي يسرع تطوير نماذج الذكاء الاصطناعي ونشرها وإدارتها طوال دورة حياتها. 

يمكن لمنصات عمليات النماذج اللغوية الكبيرة تقديم إدارة أكثر كفاءة للمكتبات، وخفض التكاليف التشغيلية وتمكين عدد أقل من الموظفين التقنيين من إكمال المهام. وتشمل هذه العمليات المعالجة المسبقة للبيانات، والتدريب على النماذج اللغوية، والمراقبة، والضبط الدقيق والنشر. وكما هو الحال مع عمليات التعلم الآلي (MLOps)، فقد بنيت  عمليات النماذج اللغوية الكبيرة  بناءً على التعاون بين علماء البيانات ومهندسي عمليات التطوير ومتخصصي تكنولوجيا المعلومات. 

تمثل النماذج اللغوية الكبيرة مثل ChatGPT من OpenAI باستخدام GPT-4 وBERT من Google فئة جديدة وأكثر تقدمًا من نماذج معالجة اللغة الطبيعية (NLP) التي يمكنها الإجابة بسرعة عن أسئلة اللغة الطبيعية، وتوفير التلخيصات واتباع التعليمات المعقدة. 

تجمع منصة  عمليات النماذج اللغوية الكبيرة بين علم البيانات وهندسة البرمجيات في بيئة تعاونية للقيام باستكشاف البيانات، وتتبع التجارب في الوقت الفعلي، والهندسة السريعة، بالإضافة إلى إدارة النماذج والمسارات. تعمل عمليات النماذج اللغوية الكبيرة على أتمتة المهام التشغيلية ومهام المراقبة في دورة حياة التعلم الآلي.

بناء سير عمل الذكاء الاصطناعي المسؤول مع حوكمة الذكاء الاصطناعي (Build responsible AI workflows with AI governance)

تعرّف على العناصر الأساسية وأفضل الممارسات لمساعدة فِرق عملك على تسريع الذكاء الاصطناعي المسؤول.

محتوى ذو صلة التسجيل للحصول على المستند التقني حول حوكمة الذكاء الاصطناعي
مقارنة بين عمليات النماذج اللغوية الكبيرة (LLMOps) وعمليات التعلم الآلي (MLOps)

نظرًا لأن عمليات النماذج اللغوية الكبيرة تقع ضمن نطاق عمليات التعلم الآلي، فقد يتم التغاضي عنها أو حتى الإشارة إليها باسم "عمليات التعلم الآلي من أجل النماذج اللغوية الكبيرة"، ومع ذلك يجب النظر إلى عمليات النماذج اللغوية الكبيرة بشكل منفصل لأنها تركز بشكل خاص على تبسيط تطوير النماذج اللغوية الكبيرة. فيما يلي طريقتان تتغير بهما مهام سير عمل التعلم الآلي (ML) ومتطلباته مع النماذج اللغوية الكبيرة بشكل خاص.

  • توفير التكاليف مع ضبط المعلمات الفائقة: في التعلّم الآلي، غالبًا ما يركز ضبط المعلمات الفائقة على تحسين الدقة أو المقاييس الأخرى. أما بالنسبة إلى النماذج اللغوية الكبيرة، يصبح الضبط مهمًا أيضًا لخفض التكلفة ولمتطلبات القوة الحاسوبية للتدريب والاستدلال. يمكن القيام بذلك عن طريق تعديل أحجام الدفعات. ونظرًا لإمكانية بداية النماذج اللغوية الكبيرة بنموذج أساسي، ثم ضبطها بالبيانات الجديدة لإجراء تحسينات خاصة بالمجال، فيمكنها تقديم أداء أعلى مقابل تكلفة أقل.

  • مقاييس الأداء: غالبًا ما تحتوي نماذج التعلم الآلي على مقاييس أداء محددة بوضوح وسهلة الحساب، بما في ذلك الدقة والمساحة تحت المنحنى (AUC) ودرجة F1. ولكن عند تقييم النماذج اللغوية الكبيرة، فهناك حاجة إلى مجموعة مختلفة من المعايير القياسية والتقييم، مثل مقياس BLEU (بديل التقييم ثنائي اللغة) ومقياس ROUGE (بديل الدراسة الموجه نحو الاستدعاء لتقييم Gisting). وتتطلب هذه مزيدًا من الدراسة أثناء التنفيذ.

بالإضافة إلى ذلك، يمكن أن توفر منصات عمليات النماذج اللغوية الكبيرة ما يعتقد أنها وظائف عمليات التعلم الآلي النموذجية:

  • إدارة البيانات
  • عملية النشر
  • اختبار النماذج وتدريبها
  • المراقبة وقابلية الملاحظة
  • دعم الأمن والامتثال
حالات الاستخدام

يمكن أن تحقق عمليات النماذج اللغوية الكبيرة كفاءة أكبر لمجموعة واسعة من المهام، بما في ذلك:

  • بناء قواعد البيانات الموجهة لاسترداد المعلومات ذات الصلة بالسياق.

  • التكامل والتسليم المستمران (CI/CD)، حيث تعمل مسارات CI/CD على أتمتة عملية تطوير النماذج وتبسيط الاختبار والنشر. وتساعد أدوات مثل Jenkins GitLab CI/CD وGitHub Action على إدارة هذه المسارات، ما يضمن سير العمل بسلاسة وفعالية. يتيح ذلك إمكانية إجراء تحديثات النماذج واسترجاعها بسلاسة، ما يقلل من تعطيل المستخدمين. يمكن أن يساعد إصدار النماذج ودمج ممارسات الاختبار الشاملة في اكتشاف المشكلات مبكرًا، ما يضمن نشر النماذج ذات الأداء الجيد فقط.

  • جمع البيانات وإعدادها وهندسة المدخلات، مستمدة من مجموعة متنوعة كافية من المصادر والمجالات واللغات.

  • تسمية البيانات ووضع التعليقات التوضيحية عليها من المدخلات البشرية لتوفير حكم معقد وخاص بالمجال.

  • تخزين البيانات وتنظيمها وإصدارها—مع حلول مناسبة لقواعد البيانات والتخزين للمساعدة في تخزين البيانات واسترجاعها ومعالجتها طوال دورة حياة النماذج اللغوية الكبيرة.

  • تحليل البيانات الاستكشافية (EDA) لاستكشاف بيانات محددة لدورة حياة نموذج التعلم الآلي وإعدادها ومشاركتها عند إنشاء مجموعات بيانات وجداول وصور مرئية قابلة للتحرير والمشاركة.

  • ضبط دقيق للنموذج لتحسين النماذج لمهام أو مجالات محددة.

  • يمكن للاستدلال على النماذج وتقديمها إدارة تفاصيل الإنتاج الخاصة بالاختبار وضمان الجودة مثل تكرار تحديث النموذج وأوقات طلب الاستدلال. قم بتمكين نقاط نهاية نموذج REST API باستخدام تسريع GPU.

  • مراجعة النماذج والحوكمة لتتبع إصدارات النماذج والمسارات وإدارة دورة حياتها الكاملة. يمكن أن يتيح ذلك إمكانية التعاون عبر نماذج التعلم الآلي باستخدام منصة مفتوحة المصدر لعمليات التعلم الآلي مثل MLflow.

  • مراقبة النماذج، بما في ذلك التعليقات البشرية على تطبيقات النماذج اللغوية الكبيرة الخاصة بك. تحديد الهجمات الضارة المحتملة ونمذجة الانجراف وتحديد المجالات التي يمكن تحسينها.

  • التحليلات الفورية والتسجيل والاختبار.

  • هندسة التلقين، باستخدام أدوات لتمكين التعلم في السياق بدلاً من الضبط الدقيق باستخدام البيانات الحساسة.
  • التنفيذ الفوري للتمكين من تحسين النموذج.
     
  • إنشاء النصوص و المخرجات (الرابط موجود خارج موقع ibm.com) عبر مجموعة من الوظائف. يمكن للنماذج اللغوية الكبيرة إنشاء تعليمات برمجية، بما في ذلك البرمجة النصية والأتمتة لتشغيل البنية التحتية. فهي تنشئ النصوص -مثل نصوص توثيق التعليمات البرمجية أو العمليات- وتترجم اللغات.
المزايا

يمكن تجميع الفوائد الأساسية لعمليات النماذج اللغوية الكبيرة تحت ثلاثة عناوين رئيسية: الكفاءة والحد من المخاطر وقابلية التوسع.

الفاعلية

تمكن عمليات النماذج اللغوية الكبيرة فرقك من إنجاز المزيد بموارد أقل، بدءًا من تعاون الفريق. يمكن تبسيط الجهود عندما يتمكن علماء البيانات ومهندسو التعلم الآلي والمعنيون بعمليات التطوير والأطراف المعنية من التعاون بسرعة أكبر على منصة موحدة للاتصال ومشاركة المعارف وتطوير النماذج ونشرها—وكل ذلك يؤدي إلى تسليم أسرع. 

يمكن خفض التكاليف الحسابية عن طريق تحسين تدريب النموذج واختيار الهياكل المناسبة واستخدام التقنيات بما في ذلك تقليم النماذج والتكميم. يمكن أن تساعد عمليات النماذج اللغوية الكبيرة في ضمان الوصول إلى موارد الأجهزة المناسبة مثل وحدات معالجة الرسومات، من أجل الضبط الدقيق الفعال ومراقبة استخدام الموارد وتحسينها. بالإضافة إلى ذلك، يمكن تبسيط إدارة البيانات عندما تعزز عمليات النماذج اللغوية الكبيرة ممارسات إدارة البيانات الفعالة، للمساعدة على ضمان توريد مجموعات البيانات عالية الجودة وتنظيفها واستخدامها للتدريب.

يمكن تحسين المعلمات الفائقة، بما في ذلك معدلات التعلم وأحجام الدفعات لتقديم الأداء الأمثل، بينما يمكن للتكامل مع عمليات البيانات أن تسهل تدفق البيانات بسلاسة من الاستيعاب إلى نشر النماذج—وتمكين اتخاذ القرارات القائمة على البيانات. 

يمكن تسريع حلقات التكرار والتعليقات من خلال أتمتة المهام المتكررة وتمكين التجريب السريع. باستخدام إدارة النماذج، يمكن لعمليات النماذج اللغوية الكبيرة أن تبسط عمليات النماذج اللغوية الكبيرة من بدايتها إلى نهايتها، ما يساعد على ضمان إنشاء النماذج وتدريبها وتقييمها ونشرها على النحو الأمثل. 

يمكن تحسين أداء النماذج باستخدام بيانات التدريب عالية الجودة وذات صلة بالمجال. بالإضافة إلى ذلك، عند مراقبة النماذج وتحديثها باستمرار، يمكن لعمليات النماذج اللغوية الكبيرة ضمان أفضل أداء. يمكن تسريع تطوير النماذج والمسارات لتقديم نماذج عالية الجودة ونشر النماذج اللغوية الكبيرة للإنتاج بشكل أسرع.

الحد من المخاطر

يمكنك تحسين الأمان والخصوصية باستخدام عمليات النماذج اللغوية الكبيرة المتقدمة والتي تعمل على مستوى المؤسسات لتحديد أولويات حماية المعلومات الحساسة، ما يساعد على منع الثغرات الأمنية والوصول غير المصرح به. وتساعد الشفافية والاستجابات الأسرع للطلبات التنظيمية على ضمان قدر أكبر من الامتثال لسياسات مؤسستك أو صناعتك. 

قابلية التوسع

تتيح عمليات النماذج اللغوية الكبيرة سهولة التوسع وإدارة البيانات، وهو أمر بالغ الأهمية عندما تحتاج آلاف النماذج إلى الإشراف عليها والتحكم فيها وإدارتها ومراقبتها من أجل التكامل المستمر والتسليم المستمر والنشر المستمر. يمكن لعمليات النماذج اللغوية الكبيرة القيام بذلك عن طريق تحسين زمن انتقال النموذج، والذي يمكن تحسينه لتوفير تجربة مستخدم أكثر استجابة.

يمكن تبسيط قابلية التوسع من خلال مراقبة النموذج ضمن بيئة تكامل وتسليم ونشر مستمرة. يمكن لمسارات النماذج اللغوية الكبيرة تشجيع التعاون وتقليل النزاعات وتسريع دورات الإصدار. ويمكن أن تتيح قابلية تكرار مسارات النماذج اللغوية الكبيرة تعاونًا أكثر إحكامًا عبر فرق البيانات، وبالتالي سيقلل ذلك النزاعات مع عمليات التطوير وتكنولوجيا المعلومات، ويعجل سرعة الإصدار. 

أحمال التشغيل التي يمكن إدارتها بسلاسة، حتى أثناء تقلبها. يستطيع نظام عمليات النماذج اللغوية الكبيرة التعامل مع كميات كبيرة من الطلبات في وقت واحد، وهو أمر ضروري بشكل خاص لتطبيقات المؤسسات.

أفضل الممارسات

للحصول على عمليات أكثر سلاسة، إليك بعض الاقتراحات التي يجب وضعها في الحسبان.

  • المشاركة المجتمعية: تفاعل مع مجتمع مفتوح المصدر لتبقَ على اطلاع بأحدث التطورات وأفضل الممارسات. تحدث التغييرات بسرعة.

  • إدارة الموارد الحاسوبية: يتضمن تدريب النماذج اللغوية الكبيرة عمليات حسابية مكثفة على مجموعات بيانات كبيرة. يمكن لوحدات معالجة الرسومات المتخصصة أن تتيح عمليات أسرع وتسرع العمليات المتوازية للبيانات.

  • المراقبة والصيانة المستمرة للنموذج: يمكن لأدوات المراقبة أن تكشف عن الانحراف في أداء النموذج بمرور الوقت. يمكن أن يؤدي استخدام التعليقات الواقعية على مخرجات النموذج إلى تحسين النموذج وإعادة تدريبه.

  • إدارة البيانات: اختر برنامجًا مناسبًا للتعامل مع أحجام البيانات الكبيرة، ما يضمن استرداد البيانات بكفاءة على مدار دورة حياة النماذج اللغوية الكبيرة. تتبع تغييرات البيانات وتطويرها باستخدام إصدار البيانات. احمِ البيانات من خلال تشفير الانتقال وضوابط الوصول. قم بأتمتة جمع البيانات وتنظيفها ومعالجتها مسبقًا لتوفير تدفق مستمر للبيانات عالية الجودة. تأكد من تعيين الإصدار على مجموعات البيانات من أجل تقديم انتقالات سلسة بين إصدارات مجموعات البيانات المختلفة.

  • إعداد البيانات وهندسة التلقين: حول البيانات واجمعها وألغِ تكرارها بشكل منتظم. تأكد من أن البيانات مرئية وقابلة للمشاركة عبر فرق البيانات.

  • النشر: لتحقيق أكبر قدر من الفعالية من حيث التكلفة، قم بتخصيص نموذج مدرب مسبقًا لمهام محددة. توفر منصات مثل NVIDIA TensorRT وONNX Runtime أدوات لتحسين التعلم العميق.

  • التعافي من الكوارث والتكرار: أنشئ نسخًا احتياطية من النماذج والبيانات والتكوينات بانتظام في حالة حدوث كوارث. باستخدام التكرار، يمكنك التعامل مع حالات فشل النظام من دون التأثير على توفر النموذج.

  • تطوير النماذج الأخلاقية: توقع واكتشاف وتصحيح التحيزات في بيانات التدريب ومخرجات النموذج التي يمكن أن تشوه المخرجات.

  • التعليقات البشرية: التعلم المعزز من التعليقات البشرية (RLHF) يمكن أن يحسن تدريب النماذج اللغوية الكبيرة. نظرًا لأن مهام النماذج اللغوية الكبيرة غالبًا ما تكون مفتوحة، يمكن أن تكون تعليقات المستخدم النهائي حاسمة في تقييم أداء النماذج اللغوية الكبيرة.

  • سلاسل النماذج اللغوية الكبيرة أو مساراتها: بفضل تسهيلها بواسطة إطارات عمل مثل LangChain أو LlamaIndex، يمكنك ربط العديد من مكالمات النماذج اللغوية الكبيرة أو تفاعلات النظم الخارجية لتوفير إمكانية القيام بالمهام المعقدة مثل الإجابة عن أسئلة المستخدم.

  • ضبط النموذج بدقة: استخدم مكتبات مفتوحة المصدر مثل DeepSpeed، وHugging Face Transformers وJAX وPyTorch وTensorFlow لتحسين أداء النموذج. يعد تحسين زمن انتقال النموذج أمرًا بالغ الأهمية لتوفير تجربة مستخدم عالية الاستجابة. 

  • مراقبة النماذج: أنشئ آليات تتبع لدورة حياة النموذج والمسارات، والإصدارات للمساعدة في ضمان إدارة دورة الحياة بفعالية للقطع الأثرية والتحولات.

  • تدريب النموذج: استخدام التدريب الموزع لإدارة الحجم الضخم للبيانات والمعلمات في النماذج اللغوية الكبيرة. كما يمكنك ضبط النماذج بانتظام باستخدام بيانات جديدة للحفاظ على تحديثها وفعاليتها. 

  • أمن النماذج: افحص النماذج كثيرًا بحثًا عن الثغرات الأمنية وأجرِ عمليات تدقيق واختبارات أمنية منتظمة.

  • الخصوصية والامتثال: تحقق من أن العمليات تلتزم باللوائح التنظيمية مثل اللائحة العامة لحماية البيانات (GDPR) وقانون خصوصية المستهلك في كاليفورنيا (CCPA) من خلال عمليات التحقق من الامتثال المنتظمة. في ظل وجود الذكاء الاصطناعي والنماذج اللغوية الكبيرة في الأخبار، يجب أن يكون هناك تدقيق.  

  • هندسة التلقين: يمكن للنماذج التي تتبع التعليمات اتباع التعليمات والمطالبات المعقدة. سيكون إعداد قوالب المطالبات تلك بشكل صحيح أمرًا بالغ الأهمية للاستجابات الدقيقة والموثوقة، وتقليل فرصة هلوسة النموذج أو اختراق عمليات هندسة التلقين.

حلول ذات صلة
حلول الذكاء الاصطناعي (AI) 

استفِد من الذكاء الاصطناعي في عملك بالاستعانة بخبرة IBM الرائدة في مجال الذكاء الاصطناعي ومحفظة حلولها التي ستكون بجانبك.

استكشف حلول الذكاء الاصطناعي

خدمات الذكاء الاصطناعي

أعد ابتكار مهام سير العمل والعمليات الحساسة عن طريق إضافة تطبيقات الذكاء الاصطناعي لزيادة الخبرات وصنع القرار وقيمة الأعمال إلى أقصى حد.

استكشف خدمات الذكاء الاصطناعي

الذكاء الاصطناعي في مجال الأمن الإلكتروني

يعمل الذكاء الاصطناعي على تغيير قواعد اللعبة في مجال الأمن الإلكتروني، وتحليل كميات هائلة من بيانات المخاطر لتسريع أوقات الاستجابة وزيادة العمليات الأمنية التي تعاني من نقص الموارد.

استكشاف الذكاء الاصطناعي للأمن الإلكتروني
الموارد اكتشف النماذج اللغوية الكبيرة (LLM) في IBM Granite. دليل شاغلي منصب CEO لاستخدام الذكاء الاصطناعي التوليدي كيفية اختيار نموذج أساس الذكاء الاصطناعي المناسب قم بتطبيق watsonx بسهولة وشغل حالة الاستخدام الأولى بسرعة مع خبرائنا ما المقصود بالذكاء الاصطناعي التوليدي؟ تعرّف على الضبط الفوري