استكشِف المزيد مما يقدِّمه دليل RAG Cookbook للحصول على فهم أعمق لحلول التوليد المعزز بالاسترجاع (RAG) المتاحة اليوم.

مساحة عمل جديدة معاد تلوينها تعتمد على مساحة Watson for Customer Care كأساس لها.
لمحة عامة
لقطة شاشة للبنية

يمكن تقسيم بنية RAG، الموضَّحة في الرسم البياني أعلاه، إلى قسمين:

  • مسار البيانات الذي يتكون من معالجة البيانات، والاستيعاب، والتخزين/التضمين.
  • مسار التوليد الذي يتكون من مطالبة المستخدم، واسترجاع البيانات، وتوليد الإجابات.

مسار التوليد الذي يتكون من مطالبة المستخدم، واسترجاع البيانات، وتوليد الإجابة.

  1. يقوم مهندس الذكاء الاصطناعي بإعداد بيانات العميل (مثل أدلة الإجراءات، ووثائق المنتج، وتذاكر مكتب المساعدة، وغيرها) خلال مرحلة المعالجة المسبقة للبيانات. يتم تحويل بيانات العميل و/أو إثراؤها لجعلها مناسبة لتعزيز النموذج. قد تشمل التحويلات عمليات بسيطة مثل تحويل مستندات PDF إلى نص، أو تحويلات أكثر تعقيدًا مثل ترجمة بنيات الجداول المعقدة إلى عبارات شرطية من نوع "إذا-فإن". أما الإثراء، فقد يتضمن توسيع نطاق الاختصارات الشائعة، وإضافة بيانات وصفية مثل معلومات العملات، بالإضافة إلى تحسينات أخرى تهدف إلى زيادة دقة وملاءمة نتائج البحث.

  2. يتم تقسيم المعلومات الموسعة المستخلصة من المستندات إلى مقاطع أصغر تُعرَف بالمقاطع لإدارة النصوص بشكل أكثر كفاءة. يمكن تنفيذ ذلك باستخدام عدد من استراتيجيات التقسيم (Chunking Strategies)، ولكل منها طريقة خاصة في فصل المعلومات وتجميعها.

  3. يتم بعد ذلك تحميل هذه المقاطع في قاعدة بيانات ليتم تخزينها والوصول إليها أثناء استخدام الحل. تتطلب استراتيجيات الاسترجاع المختلفة أنواعًا مختلفة من قواعد البيانات، وبعضها قد يحتاج إلى استخدام أكثر من نوع واحد. ومع ذلك، فإن الحل النموذجي لـ RAG يستخدم عادةً قاعدة بيانات متجهات فقط. في هذه الحالة، يُستخدم نموذج التضمين لتحويل المقاطع إلى سلسلة من المتجهات، والتي يمكن بعد ذلك تخزينها في قاعدة البيانات المتجهات.

    أصبح النظام الآن جاهزًا للاستخدام من قِبل المستخدمين النهائيين.

  4. يتفاعل المستخدمون النهائيون مع تطبيق الذكاء الاصطناعي التوليدي (GenAI) ويدخلون استعلامًا.

  5. تستقبل تطبيقات الذكاء الاصطناعي التوليدي الاستعلام، وتنفِّذ استراتيجية الاسترجاع المطبقة للحصول على أفضل "K" (حيث K مجرد قيمة تمثيلية لعدد) من قطع المعلومات التي تعتبرها الاستراتيجية الأقرب لمطابقة استعلام المستخدم. على سبيل المثال، إذا كان استعلام المستخدم هو: "ما الحد اليومي للسحب في حساب MaxSavers"، فقد تُرجِع عملية البحث مقاطع مثل: "حساب MaxSavers هو…"، "الحدود اليومية للسحب هي…"، و"…حدود الحساب…".

  6. يتم إرسال الاستعلام الأصلي، وأفضل المقاطع، ومطالبة تعليمات مخصصة للتطبيق المحدد إلى النموذج اللغوي الكبير (LLM).

  7. بعد ذلك، يتَّبع النموذج اللغوي الكبير تعليمات المطالبة لتوليد وإعداد الإجابة عن استعلام المستخدم الأصلي باستخدام المعلومات المسترجعة.

الخطوات التالية
 

احصل على أحدث أنماط التكنولوجيا، وبنى الحلول، ومنشورات البنية من IBM.

  1. انتقِل إلى IBM Architecture Center
المساهمون

Chris Kirby، وLuke Major

تاريخ التحديث: 15 نوفمبر 2024