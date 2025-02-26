التوليد المعزز بالاسترجاع (RAG) هو تقنية تُستخدم مع النماذج اللغوية الكبرى لربط النموذج بقاعدة معرفية تضم معلومات غير البيانات التي تدرب عليها النموذج من دون الحاجة إلى إجراء ضبط دقيق. يقتصر استخدام نظام التوليد المعزز بالاسترجاع التقليدي على حالات الاستخدام النصية مثل تلخيص النصوص وروبوتات المحادثة.

يمكن لنظام التوليد المعزز بالاسترجاع متعدد الوسائط استخدام نماذج لغوية كبرى متعددة الوسائط (MLLM) لمعالجة المعلومات من أنواع متعددة من البيانات وتضمينها كجزء من القاعدة المعرفية الخارجية المستخدمة في نظام التوليد المعزز بالاسترجاع. يمكن أن تتضمن البيانات متعددة الوسائط النصوص أو الصور أو المقاطع الصوتية أو مقاطع فيديو أو أشكالاً أخرى. تشمل النماذج اللغوية الكبرى متعددة الوسائط الشهيرة Gemini من Google، وLlama 3.2 من Meta، وGPT-4 وGPT-4o من OpenAI.

لهذه الوصفة، ستستخدم نموذج IBM Granite يتمكن من معالجة الوسائط المختلفة. ستُنشئ نظام ذكاء اصطناعي للرد على استعلامات المستخدمين في الوقت الفعلي من بيانات غير منظمة في ملف PDF.