ما المقصود بالوكيل القائم على المنفعة؟

تعريف الوكلاء القائمين على المنفعة

الوكيل القائم على المنفعة هو نظام ذكي يستخدم دالة منفعة لاتخاذ قرارات عقلانية من خلال تحقيق أقصى قدر من المنفعة المتوقعة للنتائج المحتملة. وتتنبأ دالة المنفعة رياضيًا بمدى فائدة جميع الإجراءات المحتملة التي يمكن لوكيل الذكاء الاصطناعي اتخاذها.

ويهدف الوكيل القائم على المنفعة إلى تحقيق أقصى استفادة من دالة المنفعة مع كل إجراء يتخذه. ولتحقيق هذا الهدف، يستخدم وكيل الذكاء الاصطناعي نتائج دالة المنفعة لاختيار الإجراء التالي الأكثر فائدة.

عناصر الوكيل القائم على المنفعة

تشمل المكوّنات الأساسية للوكيل القائم على المنفعة ما يلي:

  • دالة المنفعة
     

  • أجهزة الاستشعار
     

  • النموذج الداخلي  

  • آلية اختيار الإجراء  

  • المحرِّكات

دالة المنفعة

دالة المنفعة هي معادلة رياضية تمثل الطريقة التي ينبغي للوكيل أن يقيّم بها فائدة أي إجراء محتمل يمكنه اتخاذه. وهي في جوهرها نظام القيم الخاص بالوكيل، إذ تمثل الطريقة التي يرتّب بها الوكيل العوامل ذات الصلة حسب أولويتها عند اتخاذ القرارات. 

تُسنِد دوال المنفعة قيمة رقمية إلى كل نتيجة محتملة لأي إجراء، وبذلك تحوّل التفضيلات التي ينبغي للوكيل الالتزام بها إلى قيم قابلة للقياس. ويستخدم الوكلاء القائمون على المنفعة دالة المنفعة للتعامل مع البيئات المعقدة، والموازنة بين المفاضلات المختلفة، تحقيق أقصى قدر من الفائدة المتحققة من اختياراتهم.

وتأخذ دالة المنفعة الجيدة في الاعتبار عدة عوامل، مثل السلامة، والكفاءة، وتخصيص الموارد، وتكاليف الفرص المرتبطة بأهداف متعددة. وتُعد دالة المنفعة العنصر المحوري في الوكيل القائم على المنفعة، وهي ما يميّزه عن الأنواع الأخرى من وكلاء الذكاء الاصطناعي.

المستشعرات

يستخدم الوكلاء القائمون على المنفعة أجهزة استشعار لإدراك بيئاتهم الواقعية. وقد تكون هذه الأجهزة مادية، مثل الكاميرات ومقاييس الحرارة، أو رقمية، مثل اتصالات واجهات برمجة التطبيقات (API) وعمليات المحاكاة. ويستخدم الإدراك في الذكاء الاصطناعي الوكيل خوارزميات معقدة لتصفية بيانات البيئة المحيطة وعزل أهم نقاط البيانات وأكثرها صلة، بما يساعد على اتخاذ قرارات مستنيرة.

النموذج الداخلي

يحتفظ الوكلاء القائمون على المنفعة بنموذج داخلي مبسّط لبيئتهم الواقعية. ويُنشأ هذا النموذج ويُحدّث بناءً على البيانات التي ترصدها أجهزة الاستشعار لدى الوكيل. ومن خلال تتبّع البيانات البيئية بمرور الوقت، يستطيع النموذج الداخلي أيضًا استنتاج بيانات لا يمكن ملاحظتها مباشرة عن بيئة الوكيل.

نماذج انتقال الحالة

ويستخدم كثير من الوكلاء القائمين على المنفعة نموذجًا لانتقال الحالات يحدد الحالات الممكنة للبيئة، والمعايير التي توضّح متى تنتقل البيئة من حالة إلى أخرى وكيف يحدث ذلك. وتوضح نماذج انتقال الحالات كيف يمكن أن يتغير نظام أو بيئة ديناميكية بمرور الوقت. أما نماذج انتقال الحالات الأكثر تقدمًا، فتحسب احتمال تغيّر البيئة من حالتها الحالية في أي وقت. 

وتُسند دالة المنفعة قيمة إلى كل حالة، ويسعى الوكيل إلى نقل البيئة إلى الحالة المستقبلية ذات المنفعة الأعلى. وتكون نماذج انتقال الحالات مفيدة على نحو خاص في البيئات الاحتمالية أو الديناميكية، حيث يحتاج الوكيل إلى التفكير في الاحتمالات لا في النتائج المؤكدة.

آلية اختيار الإجراء

آلية اختيار الإجراء هي المكوّن المسؤول عن صناعة القرار بالذكاء الاصطناعي داخل الوكيل. واستنادًا إلى الحالة الحالية للنموذج الداخلي، ينشئ الوكيل قائمة بجميع الإجراءات المحتملة التي يمكنه اتخاذها. وتستخدم خوارزميات اختيار الإجراء دالة المنفعة لتقييم مختلف الإجراءات، وتحسين اختيار الوكيل بما يحقق أكبر فائدة إجمالية ممكنة.

وفي بعض التطبيقات الحديثة، تُستخدم النماذج اللغوية الكبيرة (LLMs) للاستدلال بشأن الأهداف المعقدة عالية المستوى، أو تفسير المدخلات الغامضة، قبل تحويلها إلى حسابات منفعة منظمة.

المشغلات

تتيح المحرِّكات، أو عناصر الأداء، للوكيل التأثير في بيئته واتخاذ إجراءات داخلها. وقد تكون المحرِّكات مادية، مثل ذراع روبوتية على خط تصنيع، أو منظم حرارة يتحكم في درجة حرارة منزل ذكي، أو مركبة ذاتية القيادة بالكامل. وقد تكون المحرِّكات افتراضية أو رقمية، مثل اتصال عبر واجهة برمجة التطبيقات (API)، أو واجهة روبوت محادثة، أو مخرجات برمجية.

مهام سير عمل الوكيل القائم على المنفعة

يشترك الوكلاء القائمون على المنفعة في مهام سير عمل داخلية قياسية توجه سلوكهم:

  1. الإدراك
     

  2. النمذجة الداخلية
     

  3. توليد الإجراءات
     

  4. توقع النتائج
     

  5. تقييم المنفعة
     

  6. اختيار الإجراء

  7. تنفيذ الإجراء

رسم تخطيطي يوضح كيفية عمل الوكيل القائم على المنفعة

1. الإدراك

يستخدم الوكيل أجهزة الاستشعار لإدراك بيئته وجمع البيانات. وتُستخدم هذه البيانات لإبلاغ الوكيل بحالته الحالية وبالحالة الحالية لبيئته.

2. النمذجة الداخلية

وباستخدام المعطيات الحالية التي ترصدها أجهزة الاستشعار، يحدّث الوكيل نموذجه الداخلي لبيئته في الوقت الفعلي. ويمنح ذلك الوكيل فهمًا لمحيطه ولأي عوامل ذات صلة تؤثر في عملية صناعة القرار لديه.

3. توليد الإجراءات

يستخدم الوكيل خوارزميات البحث والتحسين لإنشاء قائمة بالإجراءات المحتملة التي يمكنه اتخاذها، استنادًا إلى حالة نموذجه الداخلي. وتساعد تقنيات توليد الإجراءات واختيارها الوكيل على النظر في أفكار جديدة، والاستفادة من خبرات سابقة أثبتت نجاحها، بما يحافظ على موثوقية الأداء. ومن الناحية العملية، لا ينشئ كثير من الوكلاء قائمة كاملة وصريحة بكل الإجراءات الممكنة. وبدلًا من ذلك، يستخدمون أساليب التحسين أو التعلم المعزّز لتقييم الإجراءات التي يُرجح أنها الأفضل ضمن حيز مستمر من الإجراءات المحتملة.

4. التنبؤ بالنتائج

ولكل إجراء يتم توليده في الخطوة السابقة، يستخدم الوكيل نموذج انتقال الحالات للتنبؤ بالنتيجة المتوقعة. ويحسب النموذج احتمال الوصول إلى حالة معينة عندما يتخذ الوكيل إجراءً محددًا.

5. تقييم المنفعة

تطبّق آلية اختيار الإجراء لدى الوكيل دالة المنفعة على كل إجراء مُولّد وعلى النتيجة المحتملة المرتبطة به. وتُرجع هذه الدالة درجة منفعة رقمية لكل خيار ممكن. وتشير الدرجات الأعلى إلى منفعة إجمالية أكبر.

6. اختيار الإجراء

ثم يختار الوكيل الإجراء الذي يؤدي إلى النتيجة ذات الفائدة الإجمالية الأكبر، وفقًا للتفضيلات التي تحددها دالة المنفعة. وبما أن هدف الوكيل هو تحقيق أقصى استفادة من دالة المنفعة، فإن عملية اختيار الإجراء تدفعه إلى التصرف بطريقة تخدم أهداف نظام الذكاء الاصطناعي الذي يُستخدم ضمنه.

7. الإجراء

ثم يختار الوكيل الإجراء الذي يؤدي إلى النتيجة ذات الفائدة الإجمالية الأكبر، وفقًا للتفضيلات التي تحددها دالة المنفعة. وبما أن هدف الوكيل هو تحقيق أفصى استفادة دالة المنفعة، فإنه يتصرف بطريقة تعزز أهداف نظام الذكاء الاصطناعي الذي يُستخدم ضمنه.

حالات استخدام الوكلاء القائمة على المنفعة

يُعد الوكلاء القائمون على المنفعة مناسبين للمهام المعقدة التي تتضمن توجيهات متعددة ومتنافسة. وقد تشمل هذه المهام ما يلي: 

  • المنازل الذكية: يمكن للوكلاء القائمين على المنفعة تشغيل الأنظمة الذكية في المنزل الذكي، من خلال الموازنة بين أولويات مثل الراحة، وتكاليف الطاقة، والاستدامة.

  • السيارات ذاتية القيادة: تطرح المركبات ذاتية القيادة مجموعة من المشكلات المعقدة أمام مهندسي التعلم الآلي. فالسيارات التي يتحكم فيها الوكلاء يجب أن تتعامل مع السائقين البشر، والمشاة، والعوائق، والطقس، وإغلاقات الطرق، وكثير من الظروف الأخرى داخل بيئة ديناميكية. ويتطلب حل المشكلات في هذا السياق دالة منفعة مصممة بعناية. 

  • الرعاية الصحية: بما أن الوكلاء القائمين على المنفعة يستطيعون الموازنة بين اعتبارات متعددة لتحقيق أقصى فائدة ممكنة، فقد يكون بإمكانهم المساعدة في صياغة خطط العلاج وإدارة التكاليف. 

  • التشغيل الآلي: تحتاج الروبوتات أيضًا إلى موازنة عوامل مختلفة سعيًا إلى تحقيق أكبر فائدة ممكنة. وتواجه روبوتات التوصيل كثيرًا من الاعتبارات نفسها التي تواجهها المركبات ذاتية القيادة. 

  • أنظمة التوصية والتسعير: تتيح دالة المنفعة للوكيل الموازنة بين عوامل مثل تفضيلات المستخدم، ووقت اليوم، والموسم، والاتجاهات العامة، بهدف الحفاظ على تفاعل المستخدم واهتمامه. وفي أنظمة الذكاء الاصطناعي التوليدي، يمكن للنهج القائم على المنفعة أن يوجّه توليد المحتوى بحيث يكون أكثر توافقًا مع مقصد المستخدم، والسياق، وأهداف التفاعل طويلة الأمد. 

  • أنظمة التسعير: وبالمثل، يمكن للوكلاء القائمين على المنفعة إدارة أنظمة التسعير الديناميكية بما يساعد الشركات على زيادة المشتريات والإيرادات إلى أقصى حد.

  • أتمتة الخدمات اللوجستية وسلسلة التوريد: يجب أن توازن سلاسل التوريد المعقدة بين عوامل متعددة، مثل الكفاءة، والتكاليف، والمخاطر، والجودة، وغيرها. ويمكن للمؤسسات تخصيص دالة المنفعة الخاصة بوكيل الخدمات اللوجستية بحيث تعطي الأولوية للعوامل الأكثر أهمية لأعمالها، وتساعدها على إنشاء نظام قابل للتوسع.

مقارنة بين الوكلاء القائمين على المنفعة والوكلاء القائمين على الهدف

يفيد كلٌ من الوكلاء القائمين على المنفعة والوكلاء القائمين على الأهداف في الحالات التي يحتاج فيها الوكيل إلى العمل من أجل تحقيق نتيجة طويلة الأمد. لكن الفرق بينهما أن الوكلاء القائمين على المنفعة يسعون إلى تحقيق أقصى قدر من المنفعة اختياراتهم، بينما يسعى الوكلاء القائمون على الأهداف إلى تحقيق أهداف محددة. أي إن دافعهم الأساسي هو الوصول إلى الهدف. 

فبينما يتعامل الوكيل القائم على الهدف مع جميع الحالات التي تحقق الهدف على أنها مرغوبة بالقدر نفسه، يستطيع الوكيل القائم على المنفعة التمييز بينها بدرجات متفاوتة، مما يتيح له اتخاذ قرارات أكثر دقة ومرونة. ويستطيع الوكلاء القائمون على المنفعة إدارة أهداف متعددة ومتعارضة، والحفاظ على الأداء حتى عندما تكون النتائج غير مؤكدة.

فوائد الوكلاء القائمين على المنفعة

يتمتع الوكلاء القائمون على المنفعة بقدر كبير من المرونة، إذ يمكنهم التعامل مع المشكلات المعقدة والبيئات المتغيرة مع تقديم نتائج متسقة. وتشمل مزايا الوكلاء القائمين على المنفعة ما يلي: 

  • قابلية التكيف: يستخدم الوكلاء القائمون على المنفعة دوال منفعة مرنة بدلًا من الأنظمة الثابتة القائمة على القواعد، مثل قواعد الشرط والإجراء. ويمكنهم التكيف مع الظروف المتغيرة والمهام الجديدة، في حين قد تواجه وكلاء الاستجابة البسيطة ووكلاء الاستجابة القائمة على نموذج، وهي من الأنواع الأبسط، صعوبة في تجاوز برمجتها الصارمة القائمة على القواعد.

  • المرونة: يستطيع الوكلاء القائمون على المنفعة الموازنة بنجاح بين أولويات متنافسة لاتخاذ قرارات تؤدي في النهاية إلى نتائج جيدة. أما الوكلاء القائمون على الأهداف، فيركزون عادةً على هدف واحد محدد، وقد يجدون صعوبة في مراعاة توجيهات أخرى.
     

  • الموثوقية: تساعد دوال المنفعة الوكلاء القائمين على المنفعة على اتخاذ قرارات عقلانية حتى عندما تكون النتائج غير مؤكدة. ومن المرجح أن تؤدي القرارات التي يتخذها هؤلاء الوكلاء إلى نتائج أكثر فائدة على المدى الطويل.

قيود الوكيل القائم على المنفعة

رغم قدرة الوكلاء القائمين على المنفعة على العمل بفاعلية في كثير من السياقات، فإنهم ليسوا دائمًا الخيار الأنسب. وتشمل قيودهم ما يلي: 

  • الجمود: من دون عنصر تعلّم، لا يستطيع الوكلاء القائمون على المنفعة التعلّم من أفعالهم أو تحديث دوال المنفعة ونماذج انتقال الحالات ذاتيًا. وتتيح إضافة عنصر التعلّم لهؤلاء الوكلاء التحسّن من خلال التعلم المعزّز، لكنها تجعل تصنيفهم أدق بوصفهم وكلاء هجينين، أو حتى وكلاء متعلمين.
     

  • متطلبات الحوسبة: دوال المنفعة خوارزميات معقدة، وتشغيلها باستمرار يتطلب قدرًا كبيرًا من الموارد الحاسوبية والطاقة. ومن دون موارد حوسبة كافية، قد يكون الوكلاء القائمون على المنفعة أبطأ من اللازم لاستخدامهم في الوقت الفعلي في المواقف الحساسة للوقت.
     

  • التعقيد: يصعب تصميم دوال منفعة فعّالة، ولا يكون الوكيل القائم على المنفعة فعالًا إلا بقدر فعالية دالة المنفعة التي يعتمد عليها. لذلك يجب على مهندسي التعلم الآلي أن ينجحوا في تحويل منظومة القيم التي يريدونها إلى معادلة رقمية تدفع الوكيل إلى اتخاذ اختيارات مناسبة.
     

  • الاعتبارات الأخلاقية: يثير الاختيار القائم على المنفعة إشكالية أخلاقية. فمن الذي يحدد منظومة القيم الخاصة بالوكيل، ولا سيما عندما يكون الوكيل، كما في السيارات ذاتية القيادة، قادرًا على التسبب في ضرر محتمل للبشر؟ ومع ازدياد استقلالية الوكلاء الأذكياء وانتشارهم، يصبح من الضروري تحديد الجهة التي تقرر منظومات القيم التي تقوم عليها، وكيف تنسجم هذه القيم مع أخلاقيات المجتمع. 
     

وللتغلب على بعض هذه التحديات، غالبًا ما يُدمج الوكلاء القائمون على المنفعة في أنظمة متعددة الوكلاء، حيث يتعاون عدد من الوكلاء المتخصصين ويتبادلون المعلومات ويوازنون بين الأهداف المتنافسة. وفي مثل هذه البنى، تسهم دالة المنفعة الخاصة بكل وكيل في استراتيجية التحسين الجماعي للنظام.

Techsplainers | بودكاست

استمع إلى: "ما المقصود بالوكيل القائم على المنفعة؟"

تابع Techsplainers على: Spotify وApple Podcasts

المؤلفون

Ivan Belcic

Staff writer

Cole Stryker

Staff Editor, AI Models

IBM Think

حلول ذات صلة
وكلاء الذكاء الاصطناعي للأعمال

يمكنك إنشاء مساعدين ووكلاء ذكاء اصطناعي ووكلاء أقوياء يعملون على أتمتة مهام سير العمل والعمليات باستخدام الذكاء الاصطناعي التوليدي ونشرها وإدارتها.

    استكشف watsonx Orchestrate
    حلول وكلاء الذكاء الاصطناعي من IBM

    يمكنك بناء مستقبل عملك باستخدام حلول الذكاء الاصطناعي الجديرة بالثقة.

    استكشف حلول وكلاء الذكاء الاصطناعي
    خدمات الذكاء الاصطناعي لدى IBM Consulting

    تساعد خدمات IBM Consulting AI في إعادة تصور طريقة عمل الشركات باستخدام حلول الذكاء الاصطناعي من أجل النهوض بأعمالها.

    استكشف خدمات الذكاء الاصطناعي
    اتخِذ الخطوة التالية

    سواء اخترت تخصيص التطبيقات والمهارات المُعدّة مسبقًا أو إنشاء خدمات مخصصة مستندة إلى وكلاء ونشرها باستخدام استوديو الذكاء الاصطناعي، فإن منصة IBM watsonx تُلبي احتياجاتك.

    1. استكشف watsonx Orchestrate
    2. استكشف watsonx.ai