التوليد المعزز بالاسترجاع مقابل الضبط الدقيق مقابل هندسة المطالبات

المؤلفين

Ivan Belcic

Staff writer

Cole Stryker

Staff Editor, AI Models

IBM Think

التوليد المعزز بالاسترجاع مقابل الضبط الدقيق مقابل هندسة المطالبات

تعد الهندسة الفورية والضبط الدقيق والتوليد المعزز بالاسترجاع (RAG) ثلاث طرق تحسين يمكن للمؤسسات استخدامها للحصول على قيمة أكبر من النماذج اللغوية الكبيرة (LLMs). يعمل الثلاثة جميعًا على تحسين سلوك النموذج، ولكن يعتمد النموذج الذي سيتم استخدامه على حالة الاستخدام المستهدفة والموارد المتاحة.

يتم تدريب نماذج الذكاء الاصطناعي التوليدي على مجموعات ضخمة من البيانات، والتي يتم جمع الكثير منها من الإنترنت. لا يستطيع مطورو الذكاء الاصطناعي عادة الوصول إلى البيانات المتخصصة، مثل البيانات الخاصة بالمؤسسة والبيانات الداخلية. عندما ترغب المؤسسات في تطبيق النماذج اللغوية الكبيرة (LLMs) لتلبية احتياجات محددة، فإنها تحتاج إلى تعديل الطريقة التي يعمل نموذج الذكاء الاصطناعي بها لإنتاج المخرجات والسلوك المطلوب.

تساعد هندسة المطالبات والتوليد المعزز بالاسترجاع والضبط الدقيق على تحسين مخرجات النماذج اللغوية الكبيرة لتناسب حالات الاستخدام المستهدفة. وباستخدامها، يمكن لعلماء البيانات الحصول على أداء أفضل في المراحل النهائية، ودقة أكبر في المجال المحدد، ومخرجات تفي بمتطلبات التنسيق أو اللغة أو المتطلبات التنظيمية ذات الصلة.

فكّر أبعد من المطالبات واحصل على السياق الكامل 

ابقَ مطَّلعًا على أحدث أخبار الصناعة وأدوات الذكاء الاصطناعي والاتجاهات الناشئة في هندسة المطالبات مع رسائل Think الإخبارية. بالإضافة إلى ذلك، احصل على شرح جديد، ودروس تعليمية، ورؤى الخبراء— تصلك مباشرة إلى بريدك الوارد. راجع بيان الخصوصية لشركة IBM.

شكرًا لك! أنت مشترك.

ما الفرق بين التوليد المعزز بالاسترجاع والضبط الدقيق وهندسة المطالبات؟

يغطي الفرق بين هندسة المطالبات والتوليد المعزز بالاسترجاع والضبط الدقيق أربعة مجالات أساسية للتمييز:

  • المنهج

  • الأهداف

  • متطلبات الموارد 

  • التطبيقات

النهج

تعمل هندسة المطالبات على تحسين مطالبات الإدخال لتوجيه النموذج نحو مخرجات أفضل. ضبط نماذج اللغة الكبيرة بشكل دقيق يتم باستخدام مجموعات بيانات متخصصة لتحسين الأداء في المهام النهائية. يربط التوليد المعزز بالاسترجاع نموذج لغوي كبير بقاعدة بيانات، ويؤتمت استرجاع المعلومات لتزويد المطالبات ببيانات ذات صلة لتحقيق دقة أكبر.

الأهداف

يؤدي كل من التوليد المعزّز بالاسترجاع وهندسة المطالبات والضبط الدقيق إلى نفس النتيجة المنشودة: تعزيز أداء النموذج لزيادة القيمة للمؤسسة التي تستخدمه. ولكن بشكل أكثر تحديدًا، يجب أن تقود هندسة المطالبات النموذج إلى تقديم النتائج التي يريدها المستخدم. يهدف التوليد المعزز بالاسترجاع إلى توجيه النموذج نحو إعطاء مخرجات أكثر ملاءمة ودقة. 

وفي الوقت نفسه، يتم إعادة تدريب النموذج المُعدَّل على مجموعة مركزة من البيانات الخارجية لتحسين الأداء في حالات استخدام محددة. الطرق الثلاث ليست متعارضة وغالبًا ما يتم دمجها لتحقيق أفضل النتائج. 

متطلبات الموارد

هندسة المطالبات هي الأقل استهلاكًا للوقت والموارد من بين تقنيات التحسين الثلاثة. يمكن إجراء هندسة المطالبات الأساسية يدويًا دون أي استثمار في الحوسبة الإضافية.

يتطلب التوليد المعزز بالاسترجاع خبرة في علم البيانات لتنظيم مجموعات بيانات المؤسسة وإنشاء مسارات البيانات التي تربط بين الآليات المحلية لإدارة البيانات ومصادر البيانات تلك. يمكن القول إن الضبط الدقيق هو الأكثر تطلبًا، لأن عمليات data preparation والتدريب مكثفة حسابيًا وتستغرق وقتًا طويلاً للغاية.

التطبيقات

هندسة المطالبات هي الأكثر مرونة وتتألق في المواقف المفتوحة ذات النهايات المحتملة، والتي تتضمن مجموعة متنوعة من المخرجات، مثل طلب إنشاء محتوى من الصفر من نموذج لغوي كبير. يعتمد نجاح إنشاء الصور والفيديو والنصوص على المطالبات القوية.

الضبط الدقيق يصقل النموذج لأداء مهام مركزة للغاية—عندما يحتاج علماء البيانات إلى نموذج ليقوم بمهمة واحدة بشكل جيد جدًا. التوليد المعزز بالاسترجاع هو حل مثالي حيث تكون المعلومات الدقيقة والملائمة والحديثة ذات أهمية قصوى، كما هو الحال مع روبوتات محادثة خدمة العملاء.

أكاديمية الذكاء الاصطناعي

كن خبيرًا في الذكاء الاصطناعي

اكتسب المعرفة لتحديد أولويات استثمارات الذكاء الاصطناعي التي تدفع نمو الأعمال. ابدأ مع أكاديمية الذكاء الاصطناعي المجانية اليوم وتولَّ زمام المبادرة لتعزيز مستقبل الذكاء الاصطناعي في مؤسستك.

ما سبب أهمية هندسة المطالبات والتوليد المعزز بالاسترجاع والضبط الدقيق؟

تقدم هندسة المطالبات مجموعة من الطرق لإعطاء النماذج تعليمات صريحة حول كيفية التصرف. مع التوجيهات الواضحة، يمكن تشكيل سلوك النموذج بدقة أكبر دون الحاجة إلى الاستثمار في أنظمة استرجاع مكثفة الموارد أو التدريب.

يقوم التوليد المعزز بالاسترجاع (RAG) بتوصيل نموذج لغوي كبير (LLM) ببيانات حصرية فورية كانت ستكون غير متاحة له بخلاف ذلك. ويمكن لنماذج التوليد المعزّز بالاسترجاع أن تقدم إجابات أكثر دقة من خلال السياق المضاف للبيانات الداخلية أكثر مما يمكنها تقديمه من دونها.

عادةً ما يتفوق النموذج المضبوط بدقة على النموذج الأساسي المقابل له، مثل عائلة GPT، عند تطبيق تدريبه باستخدام بيانات خاصة بالمجال. مع زيادة الوصول إلى المعرفة الخارجية، يتمتع النموذج اللغوي الكبير المضبوط بدقة بفهم أفضل للمجال المحدد ومصطلحاته.

ما هندسة المطالبات؟

هندسة المطالبات هي عملية إنشاء مطالبات فعالة توجه النموذج نحو المخرجات المرغوبة دون توسيع قاعدة المعرفة الخاصة به. لا تغير عملية هندسة المطالبات بشكل كبير معايير النموذج المدرب مسبقًا.

الهدف من هندسة المطالبات هو صياغة المطالبات التي تتسبب في تلبية مخرجات النموذج للمتطلبات المحددة لحالة الاستخدام المقصودة. لا يمكن أن يؤدي التدريب الإضافي وزيادة الوصول إلى البيانات إلى تعويض ضعف المطالبة.

كيف تعمل هندسة المطالبات؟

تعمل هندسة المطالبات عن طريق تعديل هيكل ومحتوى الإدخال بناءً على مخرجات النموذج السابقة. مع كل عملية تكرار، يتعلم مهندس المطالبة كيف يستجيب النموذج للإدخالات السابقة، ثم يستخدم النتائج لتوجيه المطالبة التالية. الهدف هو تعديل سلوك النموذج من خلال تعليمات واضحة.

تعتمد هندسة المطالبات الجيدة على المطالبات التي تخبر نموذج معالجة اللغة الطبيعية (NLP) بما يجب فعله بالضبط. تتضمن عملية هندسة المطالبات تجربة محتوى المطالبة وهيكلها ولغتها لاكتشاف التنسيق الأمثل الذي يؤدي إلى المخرجات المطلوبة من النموذج.

قارن نموذج التعلم الآلي بطاهي منزلي طموح يريد إعداد عشاء رائع. هندسة المطالبات تشبه صديقًا أو قريبًا أكثر خبرة يساعدهم في تخطيط طريقة تناول الوجبة. مع النصائح القوية حول ما يجب صنعه وكيف، من المرجح أن ينتج الطاهي المنزلي المتحمس شيئًا لذيذًا.

ما المقصود بالتوليد المعزز بالاسترجاع (RAG)؟

التوليد المعزز بالاسترجاع هو إطار عمل لبنية بيانات يربط نموذج لغوي كبير (LLM) ببيانات أخرى، مثل بيانات الملكية الخاصة بالمؤسسة، والتي غالبًا ما يتم تخزينها في بحيرات البيانات. تضيف أنظمة التوليد المعزز بالاسترجاع البيانات ذات الصلة إلى مطالبات النموذج اللغوي الكبير حتى يتمكن من إنشاء إجابات أكثر دقة.

كيف يعمل التوليد المعزز بالاسترجاع؟

يعمل التوليد المعزز بالاسترجاع عن طريق تحديد البيانات ذات الصلة باستعلام المستخدم، ثم استخدام تلك البيانات لإنشاء مطالبات أكثر إفادة. تمت إضافة آلية استرجاع المعلومات لزيادة المطالبات الخاصة بالنموذج اللغوي الكبير ومساعدته على توليد استجابات أكثر صلة.

تقوم نماذج التوليد المعزز بالاسترجاع بتوليد الإجابات من خلال عملية ذات أربع مراحل:

  1. استعلام: يقدم المستخدم استعلامًا، مما يبدأ نظام التوليد المعزز بالاسترجاع (RAG).

  2. استرجاع المعلومات: خوارزميات معقدة أو واجهات برمجة تطبيقات تمشط قواعد المعرفة الداخلية والخارجية بحثًا عن المعلومات ذات الصلة. 

  3. التكامل: يتم دمج البيانات المسترجعة مع استعلام المستخدم وتقديمها إلى نموذج التوليد المعزَّز بالاسترجاع للإجابة عنها. وحتى هذه النقطة، لم تعالج النماذج اللغوية الكبيرة الاستعلام.

  4. الاستجابة: بدمج البيانات المسترجعة مع تدريبها ومعرفتها المخزنة، يولّد النموذج اللغوي الكبير ردًا غنيًا بالسياق ودقيقًا.

عند البحث في الوثائق، تستخدم أنظمة التوليد المعزَّز بالاسترجاع البحث الدلالي. وتصنف قواعد البيانات الموجهة البيانات حسب التشابه، ما يتيح إمكانية البحث حسب المعنى، وليس حسب الكلمات الرئيسية. تُمكِّن تقنيات البحث الدلالي خوارزميات التوليد المعزَّز بالاسترجاع من الوصول إلى الكلمات الدلالية السابقة لمقصد الاستعلام وإرجاع البيانات الأكثر صلة.

تتطلب أنظمة التوليد المعزَّز بالاسترجاع إنشاء بنية بيانات واسعة النطاق وصيانتها. يجب على مهندسي البيانات بناء مسارات البيانات اللازمة لربط بحيرات البيانات الخاصة بمؤسستهم بالنماذج اللغوية الكبيرة واستخدام التوليد المعزز بالاسترجاع (RAG). تحتاج أنظمة التوليد المعزز بالاسترجاع أيضًا إلى هندسة مطالبات دقيقة لتحديد موقع البيانات الصحيحة والتأكد من معرفة النموذج اللغوي الكبير بما يجب أن يفعله بها.

مرة أخرى، تخيل نموذج الذكاء الاصطناعي كطاهي هاوٍ في المنزل. فهو يعرف أساسيات الطهي ولكنه يفتقر إلى أحدث المعلومات والمعرفة الخبيرة لطاهٍ مدرب على مطبخ معين. يشبه التوليد المعزَّز بالاسترجاع إعطاء الطاهي المنزلي كتاب طبخ لهذا المطبخ. فمن خلال الجمع بين معرفته العامة بالطبخ والوصفات الموجودة في كتاب الطبخ، يمكن للطاهي المنزلي إعداد أطباقهم المفضلة الخاصة بكل سهولة.

ما الضبط الدقيق؟

الضبط الدقيق هو عملية إعادة تدريب نموذج مُدرَّب مسبقًا على مجموعة أصغر وأكثر تركيزًا من بيانات التدريب لمنحه معرفة خاصة بالمجال. ثم يقوم النموذج بعد ذلك بتعديل معلماته - أي الإرشادات التي تحكم سلوكه - وتضميناته لتتناسب بشكل أفضل مع مجموعة البيانات المحددة.

كيف يعمل الضبط الدقيق؟

يعمل الضبط الدقيق من خلال تعريض النموذج لمجموعة بيانات من الأمثلة المصنفة. ويعمل النموذج على تحسين تدريبه الأولي حيث يقوم بتحديث أوزان النموذج بناءً على البيانات الجديدة. الضبط الدقيق هو طريقة تعلم خاضع للإشراف، ما يعني أن البيانات المستخدمة في التدريب منظمة ومصنفة. وعلى النقيض من ذلك، تخضع معظم النماذج الأساسية للتعلم غير الخاضع للإشراف حيث تكون البيانات غير مصنفة—يجب على النموذج تصنيفها من تلقاء نفسه.

بتصوّر نموذج الذكاء الاصطناعي التوليدي مرة أخرى كطاهٍ منزلي، فإن الضبط الدقيق سيكون بمثابة دورة طهي في مطبخ محدد. قبل الالتحاق بالدورة، سيكون لدى الطاهي المنزلي فهم عام لأساسيات الطهي. ولكن بعد الخضوع لتدريب على الطهي واكتساب المعرفة الخاصة بالمجال، سيصبح أكثر كفاءة في طهي هذا النوع من الطعام.

الضبط الدقيق الكامل مقارنةً بالضبط الدقيق الفعَّال للمَعلمات

يمكن ضبط النماذج ضبطًا دقيقًا بالكامل، ما يؤدي إلى تحديث جميع معلماتها، أو ضبطها بطريقة تُحدِّث المعلمات الأكثر صلة فقط. تعرف هذه العملية الأخيرة باسم الضبط الدقيق الفعال للمعلمات (PEFT) وهي طريقة فعالة من حيث التكلفة لجعل النماذج أكثر فعالية في مجال معين.

يُعد الضبط الدقيق للنموذج عملية حوسبة مكثّفة وتتطلب عدة وحدات معالجة رسومات قوية تعمل بالترادف، فضلاً عن الذاكرة اللازمة لتخزين النماذج اللغوية الكبيرة نفسها. يُمكِّن الضبط الدقيق الفعال للمعلمات مستخدمي النماذج اللغوية الكبيرة من إعادة تدريب نماذجهم على إعدادات أجهزة أبسط مع تحقيق ترقيات أداء مماثلة في حالة الاستخدام المقصود للنموذج، مثل دعم العملاء أو تحليل المشاعر. ويتفوق الضبط الدقيق بشكل خاص في مساعدة النماذج على التغلب على التحيز، حيث توجد فجوة بين تنبؤات النموذج والنتائج الفعلية في العالم الحقيقي. 

مقارنة بين الضبط الدقيق والتدريب المسبق المستمر

يحدث التدريب المسبق في بداية عملية التدريب. تتم تهيئة أوزان النموذج أو المعلمات بشكل عشوائي ويبدأ النموذج بالتدريب على مجموعة بياناته الأولية. يقدم التدريب المسبق المستمر نموذجًا مدربًا لمجموعة بيانات جديدة غير مصنفة في ممارسة تُعرف باسم التعلم الانتقالي. النموذج المُدرَّب مسبقًا "ينقل" ما تعلمه حتى الآن إلى معلومات خارجية جديدة.

على العكس من ذلك، يستخدم الضبط الدقيق البيانات المصنفة لتحسين أداء النموذج في حالة استخدام محددة. ويتفوق الضبط الدقيق في تحسين مهارات النموذج في مهام محددة، في حين أن التدريب المسبق المستمر يمكن أن يُعمّق خبرة النموذج في المجال.

حلول ذات صلة
®IBM® watsonx.ai

تدريب الذكاء الاصطناعي التوليدي والتحقق من صحته وضبطه ونشره، وكذلك قدرات نماذج الأساس والتعلم الآلي باستخدام IBM watsonx.ai، وهو استوديو الجيل التالي من المؤسسات لمنشئي الذكاء الاصطناعي. أنشئ تطبيقات الذكاء الاصطناعي في وقت قصير وباستخدام جزء بسيط من البيانات.

استكشف watsonx.ai
حلول الذكاء الاصطناعي

استفِد من الذكاء الاصطناعي في عملك بالاستعانة بخبرة IBM الرائدة في مجال الذكاء الاصطناعي ومحفظة حلولها التي ستكون بجانبك.

استكشف حلول الذكاء الاصطناعي
الاستشارات والخدمات في مجال الذكاء الاصطناعي

تساعد خدمات IBM Consulting AI في إعادة تصور طريقة عمل الشركات باستخدام حلول الذكاء الاصطناعي من أجل النهوض بأعمالها.

استكشف خدمات الذكاء الاصطناعي
اتخِذ الخطوة التالية

باستخدام الذكاء الاصطناعي، يكشف IBM Concert عن رؤى مهمة حول عملياتك ويقدم توصيات خاصة بالتطبيق من أجل التحسين. اكتشف كيف يمكن لمنصة Concert تعزيز نمو أعمالك.

استكشف Concert® استكشف حلول أتمتة عمليات الأعمال