استلزم تطوير التوليد المعزز بالاسترجاع (RAG) — الذي يربط النماذج اللغوية الكبيرة بمصادر البيانات الخارجية — إنشاء أنظمة تجزئة. ظهرت أنظمة التوليد المعزز بالاسترجاع للمساعدة على مواجهة مشكلة الهلوسة: عندما تقدم النماذج اللغوية الكبيرة إجابات لا تعكس النتائج أو المعلومات في العالم الحقيقي.
تساعد أنظمة التوليد المعزز بالاسترجاع النماذج اللغوية الكبيرة على توليد إجابات أكثر دقة وفائدة من خلال إقرانها بقاعدة معرفية إضافية. في كثير من الحالات، تكون قواعد معرفة التوليد المعزز بالاسترجاع عبارة عن قواعد بيانات موجهات تحتوي على مستندات تمنح النموذج اللغوي الكبير المتصل إمكانية الوصول إلى معارف خاصة بالمجال. وتحول نماذج التضمين المستندات إلى متجهات رياضية، ثم تفعل الشيء نفسه مع استفسارات المستخدم.
يعثر نظام التوليد المعزز بالاسترجاع في قاعدة بياناته للمتجهات على التضمينات التي تمثل المعلومات ذات الصلة وتطابق استعلام المستخدم. ثم يستخدم النموذج اللغوي الكبير البيانات المسترجعة لتزويد المستخدمين بإجابات أكثر صلة ودقة.
ولكن نظرًا إلى قيود نافذة السياق، لا يستطيع نموذج LLM معالجة مستند واحد في كل مرة. ومن ثَمَّ ظهر التقسيم كحل. من خلال تقسيم المستند إلى أجزاء، يمكن لنموذج LLM العثور بكفاءة على الأجزاء ذات الصلة في الوقت الفعلي مع الحفاظ على الفهم السياقي.