ما ChatDev؟

المؤلفون

Vanna Winland

AI Advocate & Technology Writer

Erika Russi

Data Scientist

IBM

ما ChatDev؟

يُعَد ChatDev إطار عمل مفتوح المصدر يعمل على تنفيذ التعاون بين العديد من الوكلاء من خلال فريق منظم من الوكلاء الأذكياء المتخصصين المدعومين بنماذج لغوية كبيرة (LLMs).يتم تنسيق كل وكيل ذكاء اصطناعي للتعاون في المهام ضمن المراحل الأساسية لدورة حياة تطوير البرمجيات بهدف إنشاء تطبيق برمجي وإنتاجه بشكل مستقل.

يُحاكي ChatDev شركة برمجيات افتراضية تعمل من خلال مجموعة من العملاء الأذكياء الذين يشغلون أدوارًا مختلفة داخل بيئة المؤسسة. يشكِّل هؤلاء الوكلاء بنية تنظيمية متعددة الوكلاء، حيث يمكنهم التعاون من خلال المشاركة في ندوات وظيفية تساعد على تبسيط عملية تطوير البرمجيات. يطبِّق ChatDev الذكاء الاصطناعي على نموذج "الشلال" شائع الاستخدام، وهو نموذج لدورة حياة تطوير البرمجيات يقسِّم عملية التطوير إلى مراحل: التصميم، والبرمجة، والاختبار، والتوثيق. يعمل الوكلاء المتخصصون بشكل تعاوني لإكمال كل مرحلة.

تتمثل الأهداف الرئيسية لإطار ChatDev في تقديم إطار عمل وكيل قائم على تنسيق النماذج اللغوية الكبيرة (LLM) وقابل للتخصيص والتوسع، إضافةً إلى كونه سيناريو مثاليًا لدراسة الذكاء الجماعي. الذكاء الجماعي هو التعاون الفعَّال، وهو ظاهرة توضِّح كيف يمكن لمجموعة أن تتفوق على الفرد في أداء مهمة معقدة. يُعرِّف النهج المقبول على نطاق واسع للذكاء الجماعي الأفراد على أنهم كيانات قادرة على التصرُّف وفق هدف ومنطق، والتكيف مع البيئة.1 في أطر العمل الوكيلية مثل ChatDev، تُعرَف هذه الكيانات الذكية بالوكلاء.

الذكاء الجماعي في الأنظمة متعددة الوكلاء (MAS)

تشمل تطبيقات الذكاء الجماعي في الذكاء الاصطناعي والتعلم الآلي أنظمة أو أطر عمل تُعرَف باسم أنظمة متعددة الوكلاء (MAS). يمكن وصف النظام متعدد الوكلاء (MAS) على أنه شبكة مترابطة من كيانات لحل المشكلات، أو وكلاء، تتعاون لحل مشكلات تتجاوز قدرات أو معرفة وكيل واحد.2

أدوات الذكاء الاصطناعي مثل الأنظمة متعددة الوكلاء هي نهج لتصميم الذكاء الجماعي (COIN). يُعَد COIN نظامًا متعدد الوكلاء واسع النطاق يتميّز بوجود قدر ضئيل أو معدوم من الاتصال أو التحكم المركزي. يحتوي على دالة منفعة شاملة تقوم بتقييم المسارات المحتملة لتاريخ النظام بأكمله.3 يهتم مجال الأنظمة متعددة الوكلاء (MAS) بالتفاعلات بين الوكلاء داخل النظام، بالإضافة إلى تكوين كل وكيل بحد ذاته. على الرغم من وجود عدة طرق لتصميم نظام MAS، إلا أن الهدف الأساسي يظل كما هو: تحقيق مهمة شاملة من خلال إجراءات عناصره.

أحدث الأخبار التقنية، مدعومة برؤى خبراء

ابقَ على اطلاع دومًا بأهم—اتجاهات المجال وأكثرها إثارة للفضول—بشأن الذكاء الاصطناعي والأتمتة والبيانات وغيرها الكثير مع نشرة Think الإخبارية. راجع بيان الخصوصية لشركة IBM.

شكرًا لك! أنت مشترك.

سيتم تسليم اشتراكك باللغة الإنجليزية. ستجد رابط إلغاء الاشتراك في كل رسالة إخبارية. يمكنك إدارة اشتراكاتك أو إلغاء اشتراكك هنا. راجع بيان خصوصية IBM لمزيد من المعلومات.

التفاعلات التعاونية متعددة الوكلاء

يُعَد تنسيق الوكلاء بطريقة تضمن تعاونهم في المهمة العامة من أصعب المراحل في تصميم نظام فعَّال متعدد الوكلاء (MAS).4 يتطلب التعاون الفعَّال كفاءة في حل المهام الفردية وتنسيقًا جيدًا في التفاعلات بين الأفراد المشاركين.5 ويتضمن التخطيط لبيئة MAS الاعتبارات التالية:

  1. القيود التي تفرضها أنشطة الوكلاء الآخرين على خيارات الوكيل في تنفيذ الإجراءات.
  2. القيود التي تفرضها التزامات العامل تجاه الآخرين على خياراته في تنفيذ الإجراءات.
  3. التطوُّر غير المتوقع في الوكيل الناتج عن وكلاء آخرين غير مصممين للنموذج.6

إحدى طرق التعامل مع هذا التحدي التصميمي هي نمذجة العمل الجماعي بشكل صريح من خلال التعاون متعدد الوكلاء.

يقوم نمط التصميم التعاوني المتعدد بتفكيك الموجِّه المعقد وتوزيع المهام المجردة على الوكلاء الذين ينفِّذونها بناءً على أدوارهم المتخصصة.7 على سبيل المثال، يستخدم ChatDev تصميم اتصال ثنائي الوكيل يُسمَّى ChatChain لتسهيل الاتصال التعاوني.

وكلاء الذكاء الاصطناعي

5 أنواع من وكلاء الذكاء الاصطناعي: الوظائف الذاتية والتطبيقات الواقعية

اكتشِف كيف يتكيّف الذكاء الاصطناعي القائم على الأهداف والمنفعة مع سير العمل والبيئات المعقدة.

كيف يعمل ChatDev؟

توسِّع أطر العمل مثل ChatDev وظائف النماذج اللغوية الكبيرة إلى ما هو أبعد من قدراتها الاستثنائية في معالجة اللغة الطبيعية وتوليد النصوص. تضع ChatDev النماذج اللغوية الكبيرة في موقع الوكلاء متعددي الاستخدامات من خلال تقنيات التنسيق التي تشمل توجيه وتقييم عدد من الوكلاء التعاونيين بأدوار اجتماعية متنوعة (مثل مهندس البرمجيات، والمدير التقني، والمدير التنفيذي، والمصمم، والمختبِر).

يستخدم كل وكيل دوره المتخصص للعمل بشكل تعاوني في المراحل الأساسية لدورة حياة تطوير البرمجيات. تتضمن هذه العملية اتصالًا مكثفًا بين الوكلاء في أدوارهم المتخصصة لفهم وتحليل المتطلبات من خلال اللغة الطبيعية، والتطوير والتصحيح باستخدام لغات البرمجة. تتفاوت مراحل ChatChain من حيث مستويات التفاعل في اللغات الطبيعية ولغات البرمجة، اعتمادًا على دور الوكلاء والموجِّهات.

كيف يوجِّه ChatDev وكلاء الذكاء الاصطناعي المستقلين؟

يستخدم وكلاء ChatDev تقمُّص الأدوار والتوجيه التأسيسي كوسيلتين لإتمام مهامهم. التوجيه التأسيسي هو أسلوب حواري تلقائي في النماذج اللغوية الكبيرة، يُتيح للوكلاء توجيه بعضهم لحل المهام من خلال تقمُّص الأدوار.8

يطبِّق ChatDev هندسة التوجيه في بداية كل مرحلة من مراحل المهام الفرعية. رغم أن ChatChain يُحسِّن تحديد عملية حل المهام، فإن تبادل الردود بين الوكلاء دون توجيه إضافي أو ضوابط ليس فعَّالًا في التواصل متعدد الجولات والموجَّه نحو المهام. ولتعزيز سير التواصل الفعَّال وتفادي تحديات مثل تبديل الأدوار وتكرار التعليمات والردود الزائفة، يستخدِم ChatDev آلية التوجيه التأسيسي.

تعمل آلية التوجيه التأسيسي على "تنويم" النماذج اللغوية الكبيرة من خلال توجيهات النظام الخاصة بالمدرب والمساعد عند إنشائها. قد تحمل عبارة "تنويم النموذج اللغوي الكبير" دلالة سلبية، إذ يمكن استخدامها بشكل خبيث للتلاعب بالنموذج، لكنها في هذا السياق تُستخدم كطريقة فعَّالة لتحفيز وكلاء تقمُّص الأدوار. يتضمن التوجيه تحديد المهام والأدوار لضمان أن يقوم النموذج اللغوي الكبير بإرشاد الوكلاء حول كيفية أداء دورهم التعاوني واتباع التعليمات.

تُوجِّه هذه المطالبات الأولية لكل دور الوكلاء لتقديم ردود مناسبة دون تبديل الأدوار. تتشابه الموجِّهات الخاصة بكِلا الدورَين في النظام إلى حد كبير، حيث تتناول نظرة عامة على المهمة الفرعية الحالية وأهدافها، والأدوار المتخصصة، والأدوات الخارجية المتاحة، وبروتوكولات التواصل، وشروط الإنهاء، والمتطلبات أو القيود التي تهدف إلى منع السلوكيات غير المرغوب فيها.9 تعمل هذه الآلية كحاجز توجيهي للنموذج اللغوي الكبير، ما يحسِّن جودة الردود ويقلل من الحاجة إلى التدخل البشري.

كيف يتفاعل وكلاء الذكاء الاصطناعي في ChatDev؟

لتوجيه التواصل التعاوني السليم بين الوكلاء، يقدم ChatDev سير عمل وكيل يُسمى ChatChain لتقسيم كل مرحلة إلى مهام فرعية أكثر قابلية للإدارة. توجِّه هذه العملية الاتصالات متعددة الأدوار بين الأدوار المختلفة لاقتراح الحلول والتحقق من صحتها لكل مهمة فرعية. يتم التحكم في الوكلاء من خلال آلية تُعرَف باسم إزالة الهلوسة التواصلية، وهو نمط تواصلي لتخفيف الهلوسة غير المتوقعة. باستخدام هذه الآلية، يطلب الوكلاء معلومات أكثر تفصيلًا قبل الرد مباشرة ثم ينتقلون إلى المرحلة التالية من الاتصال بناءً على هذه التفاصيل.10

يوفر ChatDev أداة تصوير مرئية تعتمد على المتصفح لدراسة تفاعلات كل وكيل فردي يعمل ضمن دوره وبيئته. توفِّر هذه الواجهة للمستخدمين القدرة على التحقيق في تصميم النظام متعدد الوكلاء نفسه. يمكن للمستخدمين عرض هيكل التعاون الاصطناعي الذي يسمح للوكلاء بالعمل معًا لإكمال مهمة عامة تتجاوز قدراتهم الفردية.

ChatChain

يتَّبِع ChatChain تصميم اتصال ثنائي الوكيل يبسِّط عملية حل المهام خلال مسار سير العمل الوكيل. يبدأ نمط التصميم الوكيل بتقسيم عملية تطوير البرمجيات إلى ثلاث مراحل متتالية: التصميم، والبرمجة، والاختبار. تنقسم مراحل البرمجة والاختبار إلى مهام فرعية: كتابة الكود وإكماله، والتقييمات (الاختبار الثابت) واختبار النظام (الاختبار الديناميكي).

تتكون كل مرحلة اتصال داخل ChatChain من وكيل مدرب واحد ووكيل مساعد واحد. في كل مهمة فرعية، يقوم وكيلان بدورَين متخصصين مختلفين (مثل مراجع ومبرمج تصميم واجهة المستخدم) بأداء مهام المدرب والمساعد. يقوم الوكيل المدرب بتوجيه الحوار نحو إتمام المهمة، بينما يستقبل الوكيل المساعد التعليمات ويتبعها ويرد بحلول مناسبة.11 ينخرط الوكلاء في حوار متعدد الجولات حتى تكتمل المهمة أو يتم التوصل إلى توافق. تتراوح الحلول المستخلصة من مرحلة التواصل بين نصوص (مثل وصف الوظائف المطلوبة للتطبيق) وشيفرات برمجية (مثل الشيفرة المصدرية الأولية).

يعمل سير العمل الوكيل هذا على تبسيط الاتصالات من خلال تجنب طوبولوجيات الوكلاء المتعددين المعقدة وتبسيط عملية الإجماع بشكل فعَّال.12 يوفر هذا النهج انتقالًا سلسًا بين المهام الفرعية، حيث تعمل الحلول من المهام السابقة كجسور إلى المرحلة التالية. يستمر سير العمل هذا حتى تكتمل جميع المهام الفرعية، ويتم توجيه الوكلاء طوال العملية. يربط الهيكل المتسلسل لسير العمل المهام الفرعية في اللغة الطبيعية ولغة البرمجة، موجِّهًا الوكلاء بفاعلية حول ما يجب التواصل بشأنه. يُعَد ChatChain أحد الحلول للمشكلة الأكثر تحديًا في تصميم MAS، وهي التعاون الوكيلي.

باستخدام الإعدادات الافتراضية، يُنتج ChatChain البرامج بالترتيب التالي:

  • تحليل الطلب: تحديد عملية الإجراء المنهجي الشامل للتطبيق.
  • اختيار اللغة: تحديد لغة البرمجة التي سيتم استخدامها لإنشاء البرنامج وتشغيله.
  • البرمجة: يكتب الوكلاء الكود لإنشاء التطبيق.
  • CodeCompleteAll: إكمال التعليمات البرمجية بما في ذلك الوظائف/الفئات المفقودة.
  • CodeReview: مراجعة وتعديل التعليمات البرمجية للوظائف.
  • الاختبار: تشغيل البرنامج وتعديل الكود بناءً على تقرير الاختبار.
  • EnvironmentDoc: توثيق البيئة.
  • الدليل: توثيق وكتابة دليل للتطبيق.

إزالة الهلوسة التواصلية

تحدث الهلوسات في النماذج اللغوية الكبيرة عندما تُنتج هذه النماذج مخرجات غير دقيقة أو غير منطقية. هلوسات البرمجة هي نوع من الهلوسات التي تؤثِّر في مخرجات النماذج عند تنفيذ المهام المتعلقة بالبرمجة. وجد باحثو ChatDev أن هلوسات البرمجة تظهر كثيرًا عندما يواجه الوكيل الذي يؤدي وظيفة المساعد صعوبة في اتباع التعليمات الدقيقة.13 وغالبًا ما تنشأ هذه الصعوبة بسبب غموض التعليمات، ما يستدعي تفاعلات متعددة وتعديلات متكررة. لتفادي المخرجات غير المرغوب فيها، يقدِّم ChatDev تقنية "إزالة الهلوسة التواصلية".

تحفِّز إزالة الهلوسة التواصلية المساعد على طلب اقتراحات أكثر تفصيلًا من المدرب قبل تقديم رد رسمي.14 يتولى المساعدون دورًا شبيهًا بالمدرب ويسعون بشكل استباقي للحصول على مزيد من المعلومات (مثل الأسماء الدقيقة للاعتمادات الخارجية أو مستودع GitHub الذي يجب إرسال التعديلات إليه)، ويتبنون بشكل متعمد "تبادل الأدوار" قبل تقديم الرد. يُجري المساعد تحسينًا دقيقًا بعد أن يرد المدرب بالتعديلات المطلوبة. يُوجِّه نمط التواصل الوكلاء حول كيفية التفاعل، ما يُتيح تبادلًا دقيقًا للمعلومات ويُسهم في تقليل هلوسات البرمجة.

Visualizer

أداة Visualizer من ChatDev هي تطبيق Python تشغِّل عرضًا توضيحيًا محليًا على الويب، تُتيح للمستخدمين عرض السجلات في الوقت الفعلي، والسجلات المُعاد تشغيلها، وChatChain. يحتوي التطبيق على ثلاث واجهات منفصلة لعرض السجلات، كل منها مخصصة لنوع معين.

  • أداة Log Visualizer: سجل فوري يُظهر بيانات تواصل الوكلاء، وتغيُّرات البيئة، وغيرها من معلومات النظام التي تساعد على تصحيح الأخطاء.
  • أداة Replay Visualizer: يعرض سجل الإعادة معلومات الحوار الخاصة بالوكيل.
  • أداة ChatChain Visualizer: يمكن للمستخدمين تحميل أي ملف تكوين ChatChain وعرض سلسلة سير العمل الوكيلي لأي مشاريع برمجية حالية أو سابقة. توفِّر هذه الميزة رؤية شفافة لعملية تطوير البرمجيات بأكملها للمستخدمين لفحص حلول كل مهمة فرعية وتحديد أي أوجه قصور محتملة.

يحتوي Visualizer أيضًا على صفحة لإعادة المحادثة تعرض الحوارات بين الوكلاء باستخدام اللغة الطبيعية لتطبيق برمجي تم إنشاؤه.

تكامل النماذج اللغوية الكبيرة في ChatDev

يشبه مفهوم نمط التصميم الوكيل في ChatDev تقنية التعلم الآلي المعروفة باسم مزيج الخبراء، إلا أن وكلاء الذكاء الاصطناعي فيها هم خبراء متخصصون يتعاملون مع مهام معقدة. وتتطلب إدارة التعاون بين مجموعة من الوكلاء المتخصصين وجود أنظمة تنسيق.

تقوم مثل هذه التنسيقات على نماذج المحولات التوليدية المدربة مسبقًا مثل نماذج GPT من OpenAI.15 ويمكن أيضًا استخدام نماذج الأساس مثل سلسلة Granite من IBM لتزويد العوامل بقدرات لغوية قوية ووظائف متخصصة. على سبيل المثال، تُعَد Granite Code عائلة من النماذج تتراوح أحجامها بين 3 مليارات و34 مليار مَعلمة، وقد تم تدريبها على 116 لغة برمجة. ويُعَد هذا العرض مفيدًا للأطر الوكيلية التي تخطط لاستخدام وكلاء تواصليين في تطوير البرمجيات. في وقت كتابة هذا التقرير، يدعم ChatDev نماذج GPT-3.5-turbo وGPT-4 من OpenAI لتشغيل الوكلاء الأذكياء.

كيف يتم توسيع نطاق ChatDev

يعمل ChatDev على تنفيذ آلية لتوسيع نطاق التعاون متعدد الوكلاء القائم على النماذج اللغوية الكبيرة من خلال شبكات التعاون متعددة الوكلاء (MacNet). يستلهم MacNet فكرته من قانون التحجيم العصبي، الذي يفترض أن زيادة عدد الخلايا العصبية تؤدي إلى قدرات ناشئة.16 ويقترح ChatDev مبدأً مشابهًا ينطبق على زيادة عدد الوكلاء في بيئة التعاون متعدد الوكلاء.

يستخدم MacNet الرسوم البيانية غير الدورية لتنظيم الوكلاء وتعزيز قدراتهم على الاستدلال التفاعلي من خلال الترتيب الطوبولوجي. يتم اشتقاق الحلول من تفاعلات الوكلاء. تتفوق هذه العملية باستمرار على النماذج الأساسية، ما يسهِّل التعاون الفعَّال بين الوكلاء عبر طوبولوجيا الشبكة المختلفة واستيعاب التعاون بين أكثر من ألف وكيل. من خلال هذا التطبيق، يحدِّد ChatDev قانون توسيع نطاق تعاوني يوضح أن جودة الحلول تتحسن في نمط نمو لوجستي مع زيادة عدد الوكلاء.

الأنظمة متعددة الوكلاء لتطوير البرمجيات

بدلًا من محاولة احتواء جميع القدرات داخل نموذج واحد، تقوم الأنظمة متعددة الوكلاء بتقسيم المهام بين العديد من الوكلاء المتخصصين. يمكن للوكلاء استخدام النموذج اللغوي نفسه أو نماذج مختلفة، ما يوفر لهم القدرة على إنجاز مجموعة واسعة من المهام.

أجرى ChatDev تقييمًا في ورقة بحثية شهيرة تقارن أداءها بأداء إطارَي تنسيق تطوير البرمجيات المعتمدين على النماذج اللغوية الكبيرة، GPT-Engineer وMetaGPT. استندت المقاييس إلى الشمولية، وقابلية للتنفيذ، والاتساق، والجودة. تفوق كلٌّ من ChatDev وMetaGPT على GPT-Engineer، الذي يعتمد على نهج تنسيق وكيل واحد، ما يبيّن أن المهام المعقدة أكثر صعوبة في الحل عبر خطوة واحدة. تُشير نتائج الأداء هذه إلى أن تقسيم المهام المعقدة إلى مهام فرعية أكثر قابلية للإدارة يعزز فاعلية إنجازها.

تفوق ChatDev بشكل كبير على MetaGPT في مقياس الجودة بفضل طرق التواصل التعاوني بين الوكلاء والتي تستخدم كلًا من اللغة الطبيعية ولغة البرمجة. استطاع الوكلاء القادرون على الاتصال الفعَّال توجيه كل مهمة فرعية حتى الانتهاء، والتغلب على القيود التي ترتبط عادةً بقواعد التحسين التي يتم وضعها يدويًا.17 تُشير هذه النتيجة إلى أن أطر العمل متعددة الوكلاء التي تعتمد على عوامل تواصلية وتعاونية توفِّر وظائف أكثر تنوعًا وقابلية للتكيف.

أطر عمل أخرى متعددة الوكلاء

GPT-Engineer – إطار تنسيق موحَّد لوكيل واحد لتطوير تطبيقات البرمجيات. يطلب المستخدم من الذكاء الاصطناعي إنشاء تطبيق بالوظائف البرمجية المطلوبة، ويمكنه التفاعل مع النظام ذهابًا وإيابًا لإجراء تحسينات أو تحديثات.18 يمكن للمستخدمين قياس أداء تطبيقاتهم الوكيلية مقابل مجموعات بيانات شائعة من خلال أداة تُدعى "bench"، وهي ملف تنفيذي مُثبّت في النظام يحتوي على واجهة بسيطة للقياس.

MetaGPT – إطار عمل متعدد الوكلاء يعمل ككيان برمجي تعاوني يخصص وكلاء مختلفين لأداء أدوار معينة في نماذج GPT لإكمال مهام معقدة. مثل ChatDev، يحتفظ الوكلاء بأدوار مختلفة داخل بيئة افتراضية شبيهة بشركة البرمجيات. يستخدم MetaGPT أيضًا إجراءات التشغيل القياسية المنسقة بعناية لإنشاء البرامج.

crewAI – يُعَد crewAI إطار عمل متعدد الوكلاء ومفتوح المصدر يعمل على LangChain. يقوم بتنظيم وكلاء الذكاء الاصطناعي المستقلين في فرق تتعامل مع سير العمل والمهام المرتبطة بتطبيقات LLM. ويتكامل crewAI مع أي LLM.

AutoGen – يوفر إطار المحادثة متعدد الوكلاء مفتوح المصدر من Microsoft مستوى تجريديًا أعلى لنماذج الأساس. AutoGen هو إطار عمل قائم على الوكلاء يستخدم وكلاء متعددين للتفاعل ومعالجة المهام. تشمل ميزاته الأساسية وكلاء ذكاء اصطناعي قابلين للتخصيص يشاركون في حوارات متعددة الوكلاء بأنماط قابلة للتكيف، ما يُتيح إنشاء تطبيقات متنوعة للنماذج اللغوية الكبيرة.

حلول ذات صلة
وكلاء الذكاء الاصطناعي للأعمال

يمكنك إنشاء مساعدين ووكلاء ذكاء اصطناعي ووكلاء أقوياء يعملون على أتمتة مهام سير العمل والعمليات باستخدام الذكاء الاصطناعي التوليدي ونشرها وإدارتها.

    استكشف watsonx Orchestrate
    حلول وكلاء الذكاء الاصطناعي من IBM

    يمكنك بناء مستقبل عملك باستخدام حلول الذكاء الاصطناعي الجديرة بالثقة.

    استكشف حلول وكلاء الذكاء الاصطناعي
    خدمات الذكاء الاصطناعي لدى IBM Consulting

    تساعد خدمات IBM Consulting AI في إعادة تصور طريقة عمل الشركات باستخدام حلول الذكاء الاصطناعي من أجل النهوض بأعمالها.

    استكشف خدمات الذكاء الاصطناعي
    اتخِذ الخطوة التالية

    سواء اخترت تخصيص التطبيقات والمهارات المُعدّة مسبقًا أو إنشاء خدمات مخصصة مستندة إلى وكلاء ونشرها باستخدام استوديو الذكاء الاصطناعي، فإن منصة IBM watsonx تُلبي احتياجاتك.

    استكشف watsonx Orchestrate استكشف watsonx.ai