ما الفرق بين LlamaIndex وLangChain؟

منظر جانبي لمبنى قيد الإنشاء به رافعات

المؤلفين

Ivan Belcic

Staff writer

Cole Stryker

Staff Editor, AI Models

IBM Think

ما الفرق بين LlamaIndex وLangChain؟

يُعَد كلٌّ من LlamaIndex وLangChain منصتَين تعملان على تسهيل إنشاء وتنفيذ أنظمة التوليد المعزز بالاسترجاع (RAG). صُمم LlamaIndex لتبسيط البحث والاسترجاع، في حين يُعَد LangChain منصة متعددة الاستخدامات ومعيارية تدعم العديد من حالات الاستخدام.

يعمل التوليد المعزز بالاسترجاع على تزويد النماذج اللغوية الكبيرة (LLMs) بالمعرفة الخاصة بالمجال لزيادة دقة وفائدة روبوتات المحادثة وتطبيقات الذكاء الاصطناعي الأخرى التي تدعمها. على الرغم من أن LlamaIndex وLangChain لديهما حالات استخدام متداخلة، إلا أن كليهما يتعامل مع مهمة إنشاء نظام RAG بطرق مختلفة. 

يركِّز LlamaIndex على الفهرسة واستيعاب البيانات واسترجاع المعلومات من مصادر البيانات المستندة إلى النصوص، ما يجعله مثاليًا لعمليات سير العمل البسيطة وتطبيقات الذكاء الاصطناعي المباشرة. وفي الوقت نفسه، يتفوق إطار العمل المعياري لبرنامج LangChain في بناء مجموعة واسعة من معالجة اللغة الطبيعية (NLP) وتطبيقات الذكاء الاصطناعي الفاعل.

ما المقصود بالتوليد المعزز بالاسترجاع (RAG)؟

التوليد المعزز بالاسترجاع هو تقنية تربط تطبيقات النماذج اللغوية الكبيرة بمصادر البيانات الخاصة. يُسهم استرجاع البيانات المدعوم بتقنية RAG في توسيع قاعدة المعرفة لنموذج التعلم الآلي لتشمل معلومات تتجاوز البيانات التي تم تدريبه عليها. تمنح تقنية RAG نماذج الذكاء الاصطناعي التوليدي وصولًا إلى المعرفة المتخصصة التي لا تمتلكها بشكل افتراضي، مثل البيانات الداخلية للمؤسسة.

تعتمد أنظمة RAG في الاستجابة لاستفسارات المستخدمين على استرجاع المعلومات ذات الصلة من مصادر بيانات محددة في الوقت الفعلي، ثم تعزيز القدرات التوليدية للنموذج اللغوي الكبير لتحسين جودة الإجابات. توفِّر النماذج المعززة بتقنية RAG إجابات أكثر دقة وبمستوى أعلى من الارتباط بالسياق. 

يمكن أن تكون تقنية RAG بديلاً فعالًا ومريحًا في الحالات التي تتسبب فيها قيود الوقت والتكلفة في منع عمليات الضبط الدقيق الطويلة، ويمكن الجمع بين الطريقتين لتحقيق أداء أقوى.

تصميم ثلاثي الأبعاد لكرات تتدحرج على مسار

أحدث الأخبار والرؤى حول الذكاء الاصطناعي 


تتوفر معارف وأخبار منسقة بمهارة حول الذكاء الاصطناعي والسحابة وغيرها في نشرة Think الإخبارية الأسبوعية. 

ما هو LlamaIndex؟

يُعَد LlamaIndex، المعروف سابقًا باسم GPT Index، إطار عمل مفتوح المصدر لاستيعاب البيانات وفهرستها واسترجاعها. وهو متوفر بلغتَي Python وTypeScript، ما يُتيح للمستخدمين ربط النماذج اللغوية الكبيرة بمجموعات بيانات ضخمة وإنشاء تطبيقات للاسترجاع.  

يتمثل الاستخدام الأساسي لإطار العمل LlamaIndex في إدارة المستندات وتبسيط التعامل معها، حيث يستفيد من قوة النماذج اللغوية الكبيرة من أجل أتمتة عمليات التنظيم والاستفسار وتلخيص المستندات. ومن خلال تحويل مجموعات البيانات النصية الضخمة إلى فهارس يمكن الاستعلام عنها بسهولة، يساعد LlamaIndex على تبسيط عملية توليد المحتوى المعتمدة على RAG.

السمات الرئيسية لإطار عمل LlamaIndex

يعتمد LlamaIndex على مجموعة أساسية من المكونات الرئيسية، والتي تشمل: 

  • استيعاب البيانات وLlamaHub

  • فهرسة البيانات

  • الاستعلام والاسترجاع 

  • المعالجة بعد الاسترجاع 

  • صياغة الاستجابة

استيعاب البيانات وLlamaHub

يُعَد إدخال البيانات المرحلة الأولى في مسار معالجة RAG الخاص بإطار العمل LlamaIndex. في LlamaIndex، تُعرف هذه المرحلة باسم تحميل البيانات وتستخدم أدوات تحميل البيانات، أو موصِّلات البيانات، لجلب البيانات ومعالجتها. يدعم LlamaIndex أكثر من 160 نوعًا من تنسيقات البيانات، ويشمل هياكل بيانات مثل البيانات المنظمة وشبه المنظمة وغير المنظمة

عند استخدام LlamaIndex لمهام الاسترجاع التي لا يغطيها مصدر بيانات واحد، يمكن للمستخدمين الاستفادة من LlamaHub، وهو مستودع مرن ومفتوح المصدر يضم مجموعة متنوعة من أدوات تحميل البيانات لتلبية احتياجات محددة. يمكن لمستخدمي LlamaHub دمج مصادر بيانات متعددة، مثل واجهات برمجة التطبيقات وقواعد بيانات SQL وكذلك Google Workspaces، في سير عمل واحد. وتوفِّر بعض موصِّلات LlamaHub إمكانية التعامل مع الملفات الصوتية والمرئية.

فهرسة البيانات

بعد ربط جميع مصادر البيانات، تكون الخطوة التالية في سير عمل LlamaIndex هي فهرسة البيانات، حيث يتم تحليلها وتنظيمها لاستخدامها لاحقًا. يستخدم LlamaIndex التضمينات لتحويل البيانات التي يوفرها المستخدم إلى فهرس بيانات قابل للبحث يعتمد على المتجهات. نماذج التضمين هي خوارزميات ذكاء اصطناعي تعمل على تحويل البيانات إلى متجهات رياضية يتم تمثيلها داخل قاعدة بيانات متجهات متعددة الأبعاد.

تعمل عملية التضمين على فهم العلاقات الدلالية بين نقاط البيانات لتعزيز عمليات البحث القائمة على فهم السياق. يتم أيضًا تحويل استعلام المستخدم إلى تضمين. يمكن لمحركات الاستعلام تحديد نقاط البيانات المتشابهة في المعنى مع الاستعلام، وتعزيز البحث عن المعلومات ذات الصلة. 

يستطيع LlamaIndex إنشاء فهرس من فهارس أخرى لبناء مهام سير عمل واستعلامات معقدة باستخدام فهارس موجودة مسبقًا. وبدلًا من الاستعلام عن مخازن المتجهات المنفصلة واحدًا تلو الآخر، يمكن للمستخدمين إنشاء فهرس مدمج لزيادة فاعلية الاستعلامات إلى أقصى حد.

الاستعلام والاسترجاع

عند الاستعلام، يتم أيضًا تحويل استعلام المستخدم إلى تضمين. يمكن لمحركات الاستعلام تحديد نقاط البيانات المتشابهة في المعنى مع الاستعلام، ما يساعد على البحث عن المعلومات ذات الصلة. يستخدم LlamaIndex مبدأ التشابه الدلالي لاسترداد البيانات الأكثر صلةً من مخازن المتجهات استجابةً للاستعلام. 

تعمل ميزة التحول في LlamaIndex على تبسيط الاستعلامات المعقدة أو تقسيمها إلى استعلامات أكثر قابلية للإدارة. يُعَد التحول الاستعلامي تقنية تحسين تزيد من فرص نظام التوليد المعزز للاسترجاع (RAG) في العثور على البيانات الأكثر صلة وتوليد أفضل استجابة ممكنة.

المعالجة بعد الاسترجاع

بعد استرجاع البيانات ذات الصلة، يمكن إعادة ترتيب وتصنيف مقاطعها أو عُقدها لتحسين جودة الاستجابة القادمة. تُتيح المعالجة بعد الاسترجاع للعُقد التعامل مع مصادر البيانات التي تحتاج إلى مزيد من التنظيم والتحويل بعد الاسترجاع.

صياغة الاستجابة

يتم دمج البيانات المسترجعة مع الاستعلام والمطالبة الأصلية للمستخدم، ثم تمريرها إلى النموذج اللغوي الكبير المتصل، والذي يعمل بعد ذلك على توليد الاستجابة.

أكاديمية الذكاء الاصطناعي

اختر نموذج الذكاء الاصطناعي المناسب لحالة الاستخدام لديك

الكفاءة في نماذج الذكاء الاصطناعي لا تتناسب طرديًا مع حجمها. تعرّف على طريقة العثور على الخيار المناسب لتلبية احتياجات أعمالك. ثم احصل على الدليل الإرشادي لمساعدتك على اتخاذ الإجراءات اللازمة.

ما هو LangChain؟

يُعَد LangChain إطار عمل لإنشاء تطبيقات الذكاء الاصطناعي الفاعل، ويتميز بمجموعة من الخيارات المعيارية التي تُتيح للمستخدمين "ربط" العناصر معًا في مسارات عمل معقدة. يدعم LangChain استيراد أي نموذج ذكاء اصطناعي توليدي تقريبًا، بما في ذلك GPT من OpenAI وClaude من Anthropic، مع التركيز على الأتمتة الشاملة. يدعم LangChain مكتبات Python وJavaScript.

السمات الرئيسية لإطار العمل LangChain

ترتكز منصة LangChain على مجموعة أساسية من الميزات الفريدة المصممة لتبسيط تطوير النماذج الأولية وإنشاء تطبيقات الذكاء الاصطناعي الفاعل، مثل روبوتات المحادثة والوكلاء الافتراضيين.

  • النماذج 

  • قوالب الموجِّهات 

  • الفهارس 

  • الذاكرة 

  • الأدوات 

  • السلاسل 

  • الوكلاء 

  • LangSmith وLangServe

النماذج

تعمل واجهة LangChain الموحدة على تبسيط عملية التفاعل والعمل مع العديد من النماذج اللغوية الكبيرة. ويتم الوصول إلى النموذج عادةً من خلال واجهة برمجة التطبيقات الخاصة بمقدِّم الخدمة، والتي قد تفرض رسومًا على المستخدم حسب مقدِّم الخدمة. 

عند استخدام نموذج محادثة، يعمل LangChain على تنظيم التواصل مع النموذج من خلال أربعة تصنيفات للرسائل. يمثِّل HumanMessage الرسائل التي ينشئها الإنسان، ويمثل AIMessage الرسائل التي ينشئها نموذج الذكاء الاصطناعي. تُستخدَم SystemMessage لتقديم محتوى إرشادي للنموذج، بينما تُعَد ChatMessage خيارًا أكثر تخصصًا لتحديد الأدوار.

قوالب الموجّهات

يوفِّر LangChain مجموعة من قوالب الموجِّهات لتسهيل عملية التواصل مع النماذج اللغوية الكبيرة. يمكن للمستخدمين تخصيص الموجِّهات حسب الحاجة وإعادة تدويرها بين التطبيقات. صُمِّمت قوالب الموجِّهات في LangChain لتوليد مخرجات أكثر وعيًا بالسياق من النماذج اللغوية الكبيرة في السلسلة.

الفهارس

على نحو مشابه في منصات RAG الأخرى، يربط LangChain النماذج اللغوية الكبيرة بمصادر البيانات الخارجية. ويحقق هذا الهدف من خلال إنشاء فهارس قائمة على المتجهات. تستطيع مجموعة LangChain من أدوات تحميل المستندات سحب البيانات من مصادر خارجية بما في ذلك Google Workspaces، وأدوات التعاون عبر الإنترنت مثل Figma، ومحتوى الويب بما في ذلك مقاطع فيديو YouTube، وقواعد البيانات وغيرها. 

يدعم LangChain أكثر من 25 طريقة تضمين لتحويل هذه البيانات وتحميلها في مخازن المتجهات. يمكن للمستخدمين تقسيم المستندات إلى "أجزاء" لجعل استعلامات قاعدة بيانات المتجهات أكثر كفاءة.

الذاكرة

يتميز LangChain بقدرته على إدارة الذاكرة بفاعلية. يُتيح LangChain للنماذج اللغوية الكبيرة الرجوع إلى التفاعلات السابقة وإضافة هذا السياق إلى المحادثات الحالية والمستقبلية. عند تنفيذ إدارة الذاكرة في LangChain، يمكن للمستخدمين اختيار الاحتفاظ بالمحادثات بأكملها، أو تلخيص المحادثات السابقة أو الاحتفاظ بعدد محدد من أحدث التبادلات.

الأدوات

الأدوات في LangChain هي وظائف، مثل محركات البحث ومختلف واجهات برمجة التطبيقات، يمكن للنماذج استخدامها لإنجاز المهام داخل السلسلة. على سبيل المثال، يمكن للنموذج الذي يحتاج إلى تضمين توقعات الطقس في سير العمل الاتصال بخدمة تقدمها وكالة الأرصاد الجوية.

السلاسل (Chains)

تربط السلاسل النماذج اللغوية الكبيرة بأدوات أخرى وتجعل سير العمل المستقل ممكنًا داخل LangChain. إذا كانت النماذج اللغوية الكبيرة والأدوات هي الكائنات الموجودة في مخطط انسيابي، فإن السلاسل هي الأسهم والخطوط التي تربطها ببعضها. يمكن للمستخدمين الجمع بين السلاسل في سير العمل، مع احتمال أن تتضمن كل سلسلة قوالب ونماذج وأدوات ومَعلمات مختلفة للموجِّهات.

الوكلاء

وكلاء الذكاء الاصطناعي هم نماذج مستقلة تحدد مسار العمل بناءً على الظروف الحالية والإدخال الذي تتلقاه. فبدلًا من الاستعانة بمحفز بشري في كل مرحلة من مراحل العملية، كما يواجه المرء عند التفاعل مع روبوت المحادثة، يعمل الوكلاء على تنفيذ مهام سير العمل بالكامل بشكل مستقل. يمكن للمستخدمين نشر وكلاء LangChain الجُدُد كما هم أو تخصيصهم حسب الحاجة.

LangSmith وLangServe

تُعَد LangSmith مجموعة تقييم LangChain، بينما يختص LangServe بعملية النشر. تقدِّم LangSmith مجموعة من ميزات الاختبار والتحسين لمساعدة المستخدمين على تقييم تطبيقاتهم. يمكن للمستخدمين إنشاء مجموعات بيانات اختبار يدويًا، وتجميعها من تعليقات المستخدم أو إنشاؤها باستخدام النماذج اللغوية الكبيرة. 

بعد التقييم، يمكن للمستخدمين نشر تطبيقاتهم من خلال LangServe، والذي يعمل على تحويل السلاسل إلى واجهات برمجة التطبيقات. يمكن دمج LangSmith مع LangServe لتوفير المراقبة بمرور الوقت، والالتزام الأساسي بمعايير الذكاء الاصطناعي القابل للتفسير .

مقارنة بين LangChain وLlamaIndex: الاختلافات الرئيسية

يُتيح كل من LlamaIndex وLangChain للمستخدمين إنشاء تطبيقات نماذج لغوية كبيرة مدعومة بتقنية RAG، لكنهما يتَّبعان نهجين مختلفين لتنفيذ ذلك. يتميز LlamaIndex في استعلام قواعد البيانات لاسترجاع المعلومات ذات الصلة، بينما توفِّر مرونة LangChain نطاقًا أوسع من حالات الاستخدام، خصوصًا عند ربط النماذج والأدوات في سير عمل معقد.

متى يكون LlamaIndex هو الخيار الأنسب؟

يُعَد LlamaIndex مثاليًا لتطبيقات RAG المباشرة التي تتطلب جهدًا تطويريًا أقل. ويتميز باسترجاع البيانات بكفاءة ودقة استنادًا إلى الصلة الدلالية. وتشمل نقاط قوته: 

  • تطبيقات البحث والاسترجاع: يوفِّر LlamaIndex تخزينًا فعَّالًا للبيانات ويركِّز على استرجاع المعلومات بناءً على التشابه الدلالي، ما يجعله خيارًا مناسبًا لتطبيقات RAG المبسطة. تتضمن حالات الاستخدام أنظمة المراجع التنظيمية الداخلية وإدارة المعرفة. 

  • السرعة والدقة: من خلال خوارزميات البحث المتقدمة، تم تحسين LlamaIndex لاسترجاع البيانات بكفاءة مع درجة عالية من الدقة. 

  • تطوير تطبيقات مبسَّط وسلس: يُتيح تركيز LlamaIndex الدقيق تنفيذ عملية تطوير تطبيقات أكثر كفاءة. وبالتالي يتمكن المستخدمون من البدء باستخدام تطبيقات RAG خلال وقت قصير. 

  • المستندات الهرمية: يُعَد LlamaIndex خيارًا مثاليًا للمشاريع المعتمدة على النصوص، مثل إنشاء نظام لإدارة المعرفة داخل المؤسسة حيث يكون تنظيم المستندات أمرًا أساسيًا.

متى يكون LangChain هو الخيار الأنسب؟

يُتيح تركيز LangChain على الاستخدامات المتعددة والتخصيص والمرونة نطاقًا أوسع من حالات الاستخدام. يمكن للمستخدمين ربط نماذج وأدوات متعددة معًا لتلبية احتياجات مشاريعهم، وكل ذلك من خلال واجهة مستخدم واحدة. 

تشمل مزايا LangChain ما يلي: 

  • حالات الاستخدام المتنوعة: يُعَد LangChain بيئة مرنة تجمع بين النماذج اللغوية الكبيرة والأدوات والتكاملات، ما يُتيح للمستخدمين الجمع بينها معًا لتلبية متطلبات مشاريعهم المحددة. 

  • مصادر البيانات متعددة الوسائط: يدعم LlamaIndex النصوص والصور، لكن LangChain يتميز بمرونة أكبر في التعامل مع أنواع مختلفة من البيانات. يمكن للتطبيقات التي تم إنشاؤها في LangChain تحميل البيانات من الفيديوهات عبر الإنترنت وواجهات برمجة التطبيقات إلى جانب الصور وملفات PDF. 

  • التحكم الدقيق: يُتيح نهج LangChain القائم على البناء التدريجي للمستخدمين أقصى قدر من التحكم في الوظائف في كل خطوة من سلسلة العمليات. 

  • الاحتفاظ بالسياق: تُتيح قدرات إدارة الذاكرة المتقدمة في LangChain للتطبيقات الرجوع إلى التفاعلات السابقة والحفاظ على الدقة في المحادثات الطويلة. 

  • الاستعلامات المعقدة وهياكل البيانات: في حين أن LlamaIndex مصمم لاسترجاع البيانات بناءً على التشابه الدلالي، يُتيح LangChain للمستخدمين دمج تقنيات بحث متعددة، مثل البحث بالكلمات المفتاحية. كما أنه أكثر كفاءة في التعامل مع هياكل البيانات المعقدة بفضل واجهته المعيارية، ودعمه للبيانات متعددة الأنماط، وتكاملاته المتعددة.

حلول ذات صلة
نماذج الأساس

استكشف مكتبة نماذج الأساس من IBM في محفظة watsonx لتوسيع نطاق الذكاء الاصطناعي التوليدي لأعمالك بثقة.

اكتشف watsonx.ai
حلول الذكاء الاصطناعي

استفد من الذكاء الاصطناعي في عملك بالاستعانة بخبرة IBM الرائدة في مجال الذكاء الاصطناعي ومحفظة حلولها المتوفرة لك.

استكشف حلول الذكاء الاصطناعي
الاستشارات والخدمات المتعلقة بالذكاء الاصطناعي

أعدّ ابتكار عمليات ومهام سير العمل الحساسة بإضافة الذكاء الاصطناعي لتعزيز التجارب وصنع القرارات في الوقت الفعلي والقيمة التجارية.

استكشف خدمات الذكاء الاصطناعي
اتخِذ الخطوة التالية

استكشف مكتبة نماذج الأساس من IBM في محفظة IBM watsonx لتوسيع نطاق الذكاء الاصطناعي التوليدي لأعمالك بثقة.

اكتشف watsonx.ai استكشف نماذج الذكاء الاصطناعي من IBM Granite