أدَّت التطورات في النماذج اللغوية الكبيرة (LLMs) مثل GPT من OpenAI والتقنيات المرتبطة بها في خوارزميات التعلم الآلي إلى ازدهار الذكاء الاصطناعي التوليدي في السنوات الأخيرة، وقد أدَّت التطورات اللاحقة إلى ظهور مجال الوكلاء المستقلين.
من خلال دمج الأدوات، وواجهات برمجة التطبيقات (APIs)، وواجهات الأجهزة، وغيرها من الموارد الخارجية، أصبحت أنظمة الذكاء الاصطناعي الوكيل أكثر استقلالية، وقادرة على اتخاذ قرارات في الوقت الفعلي، وماهرة في حل المشكلات عبر حالات استخدام متعددة.
لا يمكن للوكلاء المعقدين التصرُّف دون اتخاذ قرار، ولا يمكنهم اتخاذ قرارات جيدة دون إعداد خطة مسبقة. يتكوَّن التخطيط القائم على الوكلاء من عدة عناصر رئيسية تعمل معًا لتعزيز اتخاذ القرارات المُثلى.
تحديد الأهداف
الخطوة الأولى والأكثر أهمية في تخطيط الذكاء الاصطناعي هي تحديد هدف واضح. يُعَد الهدف هو المبدأ التوجيهي لعملية اتخاذ القرار بالنسبة إلى الوكيل، حيث يحدِّد الحالة النهائية التي يسعى إلى تحقيقها. يمكن أن تكون الأهداف ثابتة، أي لا تتغير طوال عملية التخطيط، أو ديناميكية، أي تتغير بناءً على الظروف البيئية أو تفاعلات المستخدمين.
فعلى سبيل المثال، قد يكون لدى سيارة ذاتية القيادة هدف يتمثل في الوصول إلى وجهة معينة بكفاءة، مع الالتزام بأنظمة السلامة. من دون هدف محدد بوضوح، سيفتقر الوكيل إلى التوجيه، ما يؤدي إلى سلوك غير منتظم أو غير فعَّال.
إذا كان الهدف معقدًا، تقوم نماذج الذكاء الاصطناعي الوكيلية بتقسيمه إلى أهداف فرعية أصغر وأكثر قابلية للإدارة في عملية تُسمَّى تحليل المهام. ويسمح هذا للنظام بالتركيز على المهام المعقدة بطريقة هرمية.
تؤدي النماذج اللغوية الكبيرة (LLMs) دورًا محوريًا في تحليل المهام، حيث تقوم بتفكيك الأهداف عالية المستوى إلى مهام فرعية أصغر ثم تنفيذها عبر خطوات متتابعة. على سبيل المثال، قد يطلب مستخدم من روبوت محادثة التخطيط لرحلة عبر موجِّه بلغة طبيعية.
سيقوم الوكيل أولًا بتقسيم المهمة إلى عناصر مثل حجز الرحلات الجوية، والعثور على الفنادق، والتخطيط لجدول الرحلة. بمجرد تفكيك المهمة، يمكن للوكيل استخدام واجهات برمجة التطبيقات (APIs) لجلب البيانات في الوقت الفعلي، والتحقق من الأسعار، واقتراح وجهات للزيارة أيضًا.
تمثيل الحالة
للتخطيط بشكل فعَّال، يجب أن يمتلك الوكيل فهمًا منظمًا لبيئته. ويتحقق هذا الفهم من خلال تمثيل الحالة، الذي يصوِّر الظروف والقيود والعوامل السياقية الحالية التي تؤثِّر في عملية صناعة القرار.
يمتلك الوكلاء بعض المعرفة المضمنة المستمدة من بيانات التدريب الخاصة بهم أو من مجموعات بيانات تمثِّل تفاعلات سابقة، ولكن الإدراك مطلوب كي يكون لدى الوكلاء فهم في الوقت الفعلي لبيئتهم. يجمع الوكلاء البيانات من خلال المدخلات الحسية، ما يمكِّنهم من نمذجة بيئتهم، بالإضافة إلى مدخلات المستخدم والبيانات التي تصف حالتهم الداخلية.
تختلف درجة تعقيد تمثيل الحالة حسب طبيعة المهمة. على سبيل المثال، في لعبة الشطرنج، تشمل الحالة موقع جميع القطع على اللوح، بينما في نظام التنقل الآلي قد تتضمن الحالة الإحداثيات المكانية والعقبات وظروف التضاريس.
تؤثِّر دقة تمثيل الحالة مباشرةً في قدرة الوكيل على اتخاذ قرارات مستنيرة، حيث تحدِّد مدى قدرة الوكيل على التنبؤ بنتائج أفعاله.
تسلسل الإجراءات
بمجرد أن يحدِّد الوكيل هدفه ويقيِّم بيئته، يجب عليه تحديد سلسلة من الإجراءات التي تنقله من حالته الحالية إلى الحالة الهدف المرغوب فيها. تُعرَف هذه العملية بتسلسل الأفعال، وتتضمن تنظيم مجموعة من الخطوات المنطقية والفعَّالة التي يجب على الوكيل اتباعها.
يحتاج الوكيل إلى تحديد الإجراءات المحتملة، وتقليل القائمة إلى الإجراءات الأمثل، وترتيب أولوياتها، بالإضافة إلى التعرُّف على الاعتمادات بين الإجراءات والخطوات الشرطية بناءً على التغيُّرات المحتملة في البيئة. قد يقوم الوكيل بتخصيص الموارد لكل خطوة في التسلسل، أو بجدولة الإجراءات بناءً على القيود البيئية.
على سبيل المثال، تحتاج المكنسة الكهربائية الروبوتية إلى تحديد المسار الأكثر كفاءة لتنظيف غرفة ما، مع ضمان تغطية جميع المناطق المطلوبة دون تكرار غير ضروري. وإذا لم يتم تخطيط تسلسل الإجراءات بشكل جيد، فقد يؤدي ذلك إلى خطوات زائدة عن الحاجة، ما يؤدي إلى هدر الموارد وزيادة وقت التنفيذ.
يُعَد إطار عمل ReAct هو منهجية يتم استخدامها في الذكاء الاصطناعي للتعامل مع اتخاذ القرارات الديناميكي. في إطار العمل ReAct، يشير الاستدلال إلى العملية المعرفية التي يحدِّد فيها الوكيل الإجراءات أو الاستراتيجية اللازمة لتحقيق هدف محدد.
تشبه هذه المرحلة مرحلة التخطيط في الذكاء الاصطناعي الوكيل، حيث يولِّد الوكيل تسلسلًا من الخطوات لحل مشكلة أو تنفيذ مهمة. تشمل أطر العمل الناشئة الأخرى ReWOO وRAISE وReflexion، وكل منها يتمتع بنقاط قوة وضعف خاصة به.
التحسين والتقييم
غالبًا ما يتضمن تخطيط الذكاء الاصطناعي اختيار المسار الأمثل لتحقيق هدف ما، خاصةً عندما تتوفر خيارات متعددة. تساعد عملية التحسين على ضمان أن تكون سلسلة الإجراءات التي يختارها الوكيل هي الأكثر كفاءة من حيث الوقت والتكلفة أو الفائدة في ظل الظروف المعطاة. غالبًا ما تتطلب هذه العملية تقييم عوامل مختلفة مثل الوقت واستهلاك الموارد والمخاطر والمكاسب المحتملة.
على سبيل المثال، يجب على روبوت مستودع مكلف بجلب العناصر تحديد أقصر الطرق وأكثرها أمانًا لتفادي الاصطدامات وتقليل وقت التشغيل. دون تنفيذ تحسين مناسب، قد ينفِّذ وكلاء الذكاء الاصطناعي خططًا تؤدي إلى نتائج وظيفية لكنها دون المستوى الأمثل، ما يؤدي إلى حدوث حالات عدم كفاءة. يمكن استخدام عدة طرق لتحسين اتخاذ القرار، منها:
البحث الاستدلالي
تساعد خوارزميات البحث الاستدلالية الوكلاء على إيجاد الحلول المُثلى من خلال تقدير أفضل مسار نحو الهدف. وتعتمد هذه الخوارزميات على دوال استدلالية رياضية تقدِّر مدى قرب الحالة الحالية من الهدف المطلوب. ويُعَد البحث الاستدلالي فعَّالًا بشكل خاص في البيئات المنظمة التي تتطلب العثور السريع على المسارات المُثلى.
تعزيز التعلم
يُتيح التعلم المعزز للوكلاء تحسين التخطيط من خلال التجربة والخطأ، حيث يتعلمون أي تسلسل من الإجراءات يؤدي إلى أفضل النتائج بمرور الوقت. ويتفاعل الوكيل مع البيئة، ويتلقى مكافآت أو عقوبات بناءً على أفعاله، ثم يُصقل استراتيجياته بناءً على ذلك.
التخطيط الاحتمالي
في السيناريوهات الواقعية، غالبًا ما يعمل وكلاء الذكاء الاصطناعي في بيئات تتسم بعدم اليقين. وتتعامل أساليب التخطيط الاحتمالي مع هذا الواقع عن طريق تقييم النتائج المحتملة المتعددة واختيار الإجراءات التي تحقِّق أعلى منفعة متوقعة.
التعاون
يختلف تخطيط وكيل واحد عن التخطيط في النظام متعدد الوكلاء، حيث يجب على وكلاء الذكاء الاصطناعي العمل بشكل مستقل مع التفاعل فيما بينهم لتحقيق أهداف فردية أو جماعية.
تُعَد عملية التخطيط لوكلاء الذكاء الاصطناعي في نظام متعدد الوكلاء أكثر تعقيدًا من وكيل واحد لأن الوكلاء يجب ألا يخططوا لإجراءاتهم فحسب، بل يجب عليهم أيضًا مراعاة تصرفات الوكلاء الآخرين وكيفية تفاعل قراراتهم مع قرارات الآخرين
اعتمادًا على الهيكلية الوكيلية، يكون لكل وكيل في النظام أهدافه الفردية الخاصة، التي قد تشمل إنجاز مهام محددة أو زيادة دالة المكافأة. في العديد من الأنظمة متعددة الوكلاء، يحتاج الوكلاء إلى العمل معًا لتحقيق الأهداف المشتركة.
وقد يتم تحديد هذه الأهداف من قِبَل نظام أعلى، أو قد تنشأ من تفاعلات الوكلاء أنفسهم. يحتاج الوكلاء إلى آليات للتواصل ومواءمة أهدافهم، خاصةً في السيناريوهات التعاونية. يمكن تحقيق هذا من خلال الرسائل الصريحة، أو تعريفات المهام المشتركة، أو التنسيق الضمني.
يمكن أن يكون التخطيط في الأنظمة متعددة الوكلاء مركزيًا، حيث تقوم جهة واحدة أو وحدة تحكُّم -عادةً وكيل مدعوم بنموذج لغوي كبير (LLM)- بوضع خطة للنظام بأكمله.
يتلقى كل وكيل تعليمات أو خططًا من جهة مركزية. وقد يكون النظام لا مركزيًا أيضًا، بحيث يضع كل وكيل خططه الخاصة، ولكنه يتعاون مع الوكلاء الآخرين لضمان التوافق بين الخطط والمساهمة في الأهداف العالمية، ما يستدعي أحيانًا التواصل والتفاوض بين الوكلاء.
تعزز عملية اتخاذ القرار التعاونية هذه الكفاءة، وتقلِّل من التحيُّزات في تنفيذ المهام، وتساعد على تجنُّب الهلوسة من خلال التحقق المتبادل وبناء الإجماع، وتشجِّع الوكلاء على العمل نحو هدف مشترك.