ما إطار ReWOO؟

مؤلف

David Zax

Staff Writer

IBM Think

يُعَد ReWOO (اختصار لمصطلح "التفكير دون ملاحظة") إطار عمل للتفكير يجعل النماذج اللغوية الكبيرة أكثر فاعليةً من حيث التكلفة، ودقةً في بعض تطبيقات الاستدلال المعقدة. النماذج المزوَّدة بإطار ReWOO تُجري عملية استدلال حول المشكلة قبل محاولة حلها، ما يؤدي إلى كفاءة ودقة ومتانة أعلى بكثير حتى في حال فشل الأدوات.

قدَّمت النماذج اللغوية الكبيرة الأولى (مثل نماذج GPT-1 وGPT-2 من OpenAI) الإجابات مباشرةً، بينما أضافت موجة النماذج التي تعتمد على سلسلة التفكير والتي ظهرت في 2022 عنصر الاستدلال الخارجي، بحيث كانت النماذج "تفكِّر بصوت عالٍ" أثناء الوصول إلى الإجابة، ما أدَّى إلى تحسين الدقة وقابلية الشرح. 

ثم جاء بعد ذلك جيل من النماذج اللغوية المعززة ("أنظمة ALM") ووكلاء الذكاء الاصطناعي، الذين أضافوا قدرات استدعاء الأدوات فوق هذا الاستدلال. أطر عمل ALM المبكرة، مثل ReAct، تستخدم نمط التفكير-الفعل-الملاحظة، حيث يعمل النظام على ملاحظة ما يولِّده قبل أن يبدأ بالتفكير مرة أخرى. على الرغم من فاعليتها بشكل عام، قد تتطلب أطر العمل مثل ReAct استهلاكًا كبيرًا من الرموز المميزة؛ إذ يجب أن تتضمن كل عملية استدعاء أداة لاحقة تاريخ المحادثة السابق بأكمله، وهو تكلفة تتزايد مع كل خطوة. 

يبتعد ReWOO عن نمط التفكير-الفعل-الملاحظة بفصل الاستدلال عن الملاحظات الخارجية، ما يسمح للنموذج بتخطيط سلسلة استدلاله داخليًا قبل استدعاء الأدوات أو استرجاع المعلومات بشكل انتقائي. يقلل هذا الفصل من التبادلات غير الضرورية ويسمح للنموذج بالحفاظ على خطة طوال المهمة.

أحدث الأخبار التقنية، مدعومة برؤى خبراء

ابقَ على اطلاع دائم على أبرز الاتجاهات في مجالات الذكاء الاصطناعي، والأتمتة، والبيانات، وغيرها الكثير من خلال رسالة Think الإخبارية. راجع بيان الخصوصية لشركة IBM.

شكرًا لك! أنت مشترك.

سيصلك محتوى الاشتراك باللغة الإنجليزية. ستجد رابط إلغاء الاشتراك في كل رسالة إخبارية. يمكنك إدارة اشتراكاتك أو إلغاء اشتراكك من هنا. لمزيد من المعلومات، راجع بيان خصوصية IBM.

كيفية عمل ReWOO

يستخدم ReWOO ثلاث وحدات متميزة، تعمل على تقسيم المهام المعقدة والتغلب عليها. أولًا، تعمل وحدة التخطيط (Planner) على وضع مخطط يحدِّد كيفية تصرُّف النموذج بناءً على مطالبة المستخدم. ثانيًا، تعمل وحدة العمل (Worker) على تنفيذ الخطة، واستدعاء الأدوات الخارجية (دون تكرار استدعاءات واجهة برمجة تطبيقات النموذج اللغوي الكبير المكلِّفة "للتفكير"، كما هو الحال في ReAct). أخيرًا ، تأخذ وحدة الحل (Solver) الخطط والأدلة، وتعمل على تجميع الاستجابة النهائية. 

رغم أن الاختلاف في النهج قد يبدو بسيطًا، فإن النتائج مذهلة: يعمل ReWOO بشكل جيد (أو أفضل قليلًا) من ReAct وفقًا لبعض المعايير المرجعية - كل ذلك مع استخدام حوالي 80% أقل من الرموز المميزة. (الرمز المميز هو وحدة ذات معنى دلالي لنموذج الذكاء الاصطناعي؛ كلما زاد عدد الرموز المميزة، زادت تكلفة التشغيل). على سبيل المثال، في مجموعة بيانات HotpotQA (وهي مجموعة من الأسئلة يتم استخدامها لتقييم أنظمة الذكاء الاصطناعي)، يحقق ReWOO دقة بنسبة 42.4% باستخدام 2,000 رمز مميز، بينما يحقق ReAct دقة بنسبة 40.8% باستخدام 10,000 رمز مميز. 

والأهم من ذلك، أن هذا التحسين في كفاءة استخدام الرموز المميزة يجعل نماذج الاستدلال مُجدية اقتصاديًا على نطاق واسع.

ReAct مقابل ReWOO: مثال واقعي

لتوضيح الفرق بين هذين الإطارين الشائعين للذكاء الاصطناعي التوليدي، دعنا ندرس حالة استخدام محددة. لنأخذ بعين الاعتبار الطرق المختلفة التي سيتَّبعها كلٌّ من نظام ReAct ونظام ReWOO لمعالجة استفسار المستخدم الذي يطلب المساعدة في حزم الأمتعة لرحلة تشمل رحلة طيران بين نيويورك وشيكاغو غدًا، تليها قيادة إلى ميلووكي في اليوم التالي.

سيعمل نظام ReAct على تقسيم المشكلة إلى سلسلة من ثلاث دورات تفكير-فعل-ملاحظات قبل تقديم الإجابة النهائية. في الدورة الأولى، سيفكِّر النظام: "أحتاج إلى التحقق من طقس نيويورك غدًا"، مستخدمًا تقنية التوليد المعزز بالاسترجاع (RAG) للبحث عن هذا الطقس (كفعل)، ثم يلاحِظ النتيجة في النهاية. بعد ذلك، تصبح تلك النتيجة إدخالًا لدورة أخرى من ثلاث خطوات تفكير-فعل-ملاحظة لمعرفة طقس شيكاغو. ثالثًا، سيكرر العملية نفسها لمعرفة حالة الطقس في ميلووكي. أخيرًا، سيجمع النتائج التي توصَّل إليها في مخرجات (على سبيل المثال: "ارتدِ عدة طبقات من الملابس؛ لأن الطقس يصبح أبرد في كل موقع"). 

مخطط ReACT

على النقيض من ذلك، سيحقق نظام على نمط ReWOO كفاءات من خلال القيام بالتخطيط بأكمله مقدمًا. أولًا، سيخطط قائلًا: "أحتاج إلى معرفة حالة الطقس في نيويورك غدًا، وحالة الطقس في شيكاغو غدًا، وحالة الطقس في ميلووكي بعد غد". بعد ذلك، سيعمل النظام من خلال استدعاء واجهات برمجة تطبيقات الطقس في تسلسل متصل (أو ربما بشكل متوازٍ)، دون القيام بأي "تفكير" مكلِّف في هذه المرحلة التنفيذية. أخيرًا، سيعمل النظام على حل المسألة، وجمع الأدلة وتقديم الإجابة النهائية. 

مخطط ReWOO
وكلاء الذكاء الاصطناعي

5 أنواع من وكلاء الذكاء الاصطناعي: الوظائف الذاتية والتطبيقات الواقعية

اكتشِف كيف يتكيّف الذكاء الاصطناعي القائم على الأهداف والمنفعة مع سير العمل والبيئات المعقدة.

فوائد وعيوب ReWoo

بالإضافة إلى كفاءة الرموز المميزة، يُظهِر ReWOO فائدة إضافية وهي القدرة على الصمود عند فشل الأدوات. على سبيل المثال، إذا فشلت أداة في نظام ReAct، فقد يدخل النظام في حلقة لا نهائية، حيث يكرر النموذج اللغوي الكبير استدعاء قاعدة بيانات تالفة عدة مرات للاستعلام عن الطقس في شيكاغو.

يتميز ReWOO بالمرونة. حتى إذا فشلت أداة في إرجاع دليل معين، تظل الخطة العامة الأولية موجودة: يمكن لوحدة العمل (Worker) الاستمرار، وستتمكن وحدة الحل (Solver) من تقديم إجابة جزئية على الأقل. في مثال الطقس، بدلًا من أن يقع النظام في حلقة لا نهائية أو متكررة عند استعلام قاعدة بيانات عن طقس شيكاغو، ستعمل وحدة الحل (Solver) على الأقل بإرجاع إجابة تُعلِم المستخدم بحالة الطقس في نيويورك وميلووكي (بافتراض أن وحدة العمل استطاعت استرجاع هذه المعلومات)، ما قد يكون كافيًا لتلبية احتياجات التخطيط الخاصة بالمستخدم. 

على الرغم من فوائد ReWOO، فإنه ليس إطارًا متفوقًا بشكل عام؛ بل هو أفضل ببساطة لبعض أنواع المهام، خاصةً عندما تكون أنواع وكميات الأدلة المطلوبة منتظمة ومتوقعة. أما النقطة التي يواجه فيها ReWOO صعوبةً فهي في المشكلات الأقل قابلية للتنبؤ أو الأقل تنظيمًا، والتي قد تتطلب الإبداع أو الاستكشاف أو الارتجال. ففي حالة المجهولات المعروفة، يتفوق ReWOO، أما في حالة المجهولات غير المعروفة، فيعجز عن الأداء بفاعلية.

على سبيل المثال، لن يكون ReWOO الأمثل لتصحيح أخطاء كود Python، وهو عملية استكشافية وتكرارية قد يكشف كل تصحيح فيها عن أخطاء ودلائل جديدة، ما يجعل الخطط الموضوعة مسبقًا سرعان ما تصبح غير صالحة. وإطار العمل الأكثر قابلية للتكيف مثل ReAct، رغم كونه أقل كفاءةً من حيث الرموز المميزة بشكل عام، فإنه سيكون في النهاية الأنسب لمثل هذه المشكلة. 

كيفية تنفيذ ReWOO

كما هو الحال مع معظم أنظمة وأطر عمل الذكاء الاصطناعي، تتوفر طرق مختلفة لتنفيذ سير عمل ReWOO. يتوفر تنفيذ "رسمي" لإطار العمل، الذي وصفه الباحث Binfeng Xu وزملاؤه أول مرة في 2023[1]، عبر منصة GitHub. تُعَد أطر عمل الذكاء الاصطناعي التوليدي مثل LangGraph (الذي تُعرَف وحداته باسم "عُقد") وLangChain ذات صلة أيضًا شائعة الاستخدام. وتتوفر أيضًا منهجية التفكير متعددة الخطوات على نمط ReWOO باستخدام Granite من IBM.

يمكن البدء مع ReWOO على المستوى المفاهيمي في أي بيئة نماذج لغوية كبيرة، باستخدام مطالبة تمت صياغتها بعناية تشجِّع الذكاء الاصطناعي على وضع خطة تفصيلية للإجابة عن الأسئلة التالية قبل الانتقال إلى أي إدخال للأدوات. 

على سبيل المثال، تتضمن الورقة البحثية التي وصفت ReWOO أول مرة أمثلة على المطالبات، بما في ذلك مطالبة تبدأ بالعبارة: "بالنسبة إلى المهمة التالية، ضَع خططًا لحل المشكلة خطوة بخطوة". لكل خطة، حدِّد الأداة الخارجية المستخدمة مع مدخلاتها لاسترجاع الأدلة. مع ذلك، يضيف مؤلفو الدراسة أن "ReWOO يُعَد نموذجًا عامًّا، والمطالبات ليست ثابتة بالضرورة". نحن نوصي القراء والمستخدمين بتعديل المطالبات بما يتناسب مع احتياجاتهم الخاصة.1

حلول ذات صلة
وكلاء الذكاء الاصطناعي للأعمال

يمكنك إنشاء مساعدين ووكلاء ذكاء اصطناعي ووكلاء أقوياء يعملون على أتمتة مهام سير العمل والعمليات باستخدام الذكاء الاصطناعي التوليدي ونشرها وإدارتها.

    استكشف watsonx Orchestrate
    حلول وكلاء الذكاء الاصطناعي من IBM

    يمكنك بناء مستقبل عملك باستخدام حلول الذكاء الاصطناعي الجديرة بالثقة.

    استكشف حلول وكلاء الذكاء الاصطناعي
    خدمات الذكاء الاصطناعي لدى IBM Consulting

    تساعد خدمات IBM Consulting AI في إعادة تصور طريقة عمل الشركات باستخدام حلول الذكاء الاصطناعي من أجل النهوض بأعمالها.

    استكشف خدمات الذكاء الاصطناعي
    اتخِذ الخطوة التالية

    سواء اخترت تخصيص التطبيقات والمهارات المُعدّة مسبقًا أو إنشاء خدمات مخصصة مستندة إلى وكلاء ونشرها باستخدام استوديو الذكاء الاصطناعي، فإن منصة IBM watsonx تُلبي احتياجاتك.

    استكشف watsonx Orchestrate استكشف watsonx.ai
    الحواشي

    1. "ReWOO: Decoupling Reasoning from Observations for Efficient Augmented Language Models," Binfeng Xu, Zhiyuan Peng, Bowen Lei, Subhabrata Mukherjee, Yuchen Liu, Dongkuan Xu. Arxiv.org, 23 May 2023.