دليل IBM لأنظمة الذكاء الاصطناعي الوكيل

لمحة عامة

تجمع أنظمة الذكاء الاصطناعي الوكيل بين تنوع النماذج اللغوية الكبرى ومرونتها ودقة نماذج البرمجة التقليدية. تتمكن أنظمة الذكاء الاصطناعي الوكيل من التخطيط وأداء المهام بشكل مستقل نيابة عن المستخدم أو عن نظام آخر. تحل أنظمة الذكاء الاصطناعي الوكيل المشكلات المعقدة من خلال تقسيمها إلى سلسلة أصغر من المهام واستخدام الأدوات المتاحة للتفاعل مع الأنظمة الخارجية أو أداء المهام الحاسوبية.

تجعل هذه الإمكانات أنظمة الذكاء الاصطناعي الوكيل قادرة على التعامل مع مجموعة أوسع بكثير من المهام والمهام الأكثر تعقيدًا مقارنة بالنماذج اللغوية الكبرى وحدها. على سبيل المثال، إذا كنت ستطلب من النموذج اللغوي الكبير ترشيح سيارة لتشتريها، فإن النموذج سيُنشئ قائمة بالتوصيات بناءً على البيانات المتاحة في وقت تدريب النموذج. من ناحية أخرى، يمكن لحل الذكاء الاصطناعي الوكيل أن يطلب منك مزيدًا من التفاصيل حول كيفية استخدام السيارة (للمتعة، أو الذهاب إلى العمل، أو نقل الأحمال الثقيلة)، ويخبرك في حال وجود خصم من الشركات المصنعة متاح حتى نهاية الشهر.

أنماط هندسة الذكاء الاصطناعي التوليدية

البنية المفاهيمية

مخطط انسيابي يوضح عملية تنفيذ طلب مستخدم بواسطة تطبيق ذكاء اصطناعي

يتكون نظام الذكاء الاصطناعي الوكيل من العناصر التالية:

يعمل عنصر تنسيق الوكلاء على إدارة إجراءات مجموعة من الوكلاء وتنسيقها. قد يستخدم عنصر تنسيق الوكلاء نموذجًا لغويًا كبيرًا لتقسيم سير العمل وتوليده لحل المهام المعقدة ديناميكيًا، أو قد يستخدم فقط سير عمل محددًا بشكل ثابت باستخدام تقنيات مثل ترميز نمذجة عمليات الأعمال (BPMN)، ولغة تنفيذ عمليات الأعمال (BPEL)، أو غيرها من تقنيات سير العمل.
واحد أو أكثر من الوكلاء، وهي أجزاء من البرمجيات يمكنها تحديد الإجراءات وتنفيذها ذاتيًا لتحقيق أهداف محددة. يستخدم الوكلاء نموذجًا لغويًا كبيرًا لإنشاء خطط ديناميكية لإكمال المهام. كما يمكن للوكلاء استخدام الأدوات للتفاعل مع الأنظمة الخارجية، مثل: واجهات برمجة التطبيقات المؤسسية، والبحث في مخازن المعرفة، مثل: الاستعلام في ويكيبيديا، أو لإجراء العمليات الحسابية، مثل: العمليات الرياضية، التي لا يمكن إجراؤها بدقة أو بفعالية باستخدام النموذج اللغوي الكبير وحده.
وأخيرًا، تتفاعل الأدوات مع المصادر والأنظمة المؤسسية والخارجية لاسترجاع المعلومات وتحديث أنظمة السجلات.

الوكلاء لديهم البنية المفاهيمية الخاصة بهم، كما هو موضح في الشكل أدناه.

مخطط انسيابي يوضح عملية تفاعل الوكيل مع بيئته

يتكون الوكلاء من العناصر الأساسية التالية:

عنصر الإدخال، وهو مصدر أو أكثر من مصادر الإدخال التي تحفز الوكيل على اتخاذ الإجراءات. وعادةً ما يكون هذا استعلامًا باللغة الطبيعية أو مهمة من المستخدم، لكنه قد يكون أيضًا حدثًا نظاميًا، مثل إنشاء ملف، أو رسالة في قائمة انتظار Kafka، أو استدعاء منظم لواجهات برمجة التطبيقات.
ينسق عنصر التنفيذ أنشطة الوكيل لتنفيذ المهام المطلوبة. عادة، أول مهمة ينفذها عنصر التنفيذ هي (1) تنظيم قائمة بالأدوات والموارد المتاحة للوكيل، و(2) استدعاء عنصر التخطيط والتفكير لإنشاء خطة أنشطة لتنفيذ المهمة. ينفذ عنصر التنفيذ بعد ذلك الخطة المولدة، مستدعيًا الأدوات والموارد اللازمة لجمع المعلومات أو تعديل البيئة الخارجية للوكيل؛ وقد يعيد تفعيل عنصر التخطيط والتفكير بشكل دوري لتكييف خطة الأنشطة حسب استجابات الأدوات / حالات الفشل.
عنصر التخطيط والتفكير، والذي يُعرف عادةً باسم النموذج اللغوي الكبير، يُمكّن الوكيل من وضع خطط إجراءات تفصيلية لإنجاز المهام استجابةً لمدخلاته، بالإضافة إلى التفكير في نتائج الإجراءات وتكييف خططه استجابةً لذلك.
عنصر تكامل الأدوات يُمكّن الوكيل من استخدام "الأدوات" لاستدعاء واجهات برمجة التطبيقات والوصول إلى الموارد لإكمال الإجراءات وجمع المعلومات للإسهام في إتمام المهمة الشاملة.
يدير عنصر الذاكرة السياق قصير المدى، داخل المهمة، بالإضافة إلى المعرفة طويلة المدى التي تُمكّن الوكيل من الحفاظ على السياق عبر استدعاءات المهام (على سبيل المثال، "إلغاء طلب الشراء الأخير")، بالإضافة إلى توفير أساس لتحليل الإجراءات السابقة وتحسين الإجراءات المستقبلية.

يمكن إضافة عناصر أخرى، غير موضحة في الشكل، لتوفير إدارة تشغيلية للوكلاء، ومراقبة الأداء، وفرض ضوابط الأمان مثل نشر الهوية ومنع تسرب البيانات.

الإرشادات التفصيلية المفاهيمية

يوضح المخطط أدناه تدفق التحكم والمعلومات عبر البنية المفاهيمية.

مخطط انسيابي يوضح عملية استخدام نموذج لغوي كبير لإنشاء نص

يرسل المستخدم استعلامًا إلى تطبيق الذكاء الاصطناعي التوليدي (على سبيل المثال، روبوت المحادثة، أو واجهة استعلام داخل تطبيق مؤسسي)
يمرر تطبيق الذكاء الاصطناعي التوليدي استعلام المستخدم إلى عنصر تنسيق الوكلاء إما على شكل استعلام أولي، على سبيل المثال: إذا كان تطبيق الذكاء الاصطناعي هو واجهة الدردشة، أو من خلال تفعيل سير عمل محدد مسبقًا، مثل: بدء طلب شراء. سنفترض وجود استعلام أولي في هذا الشرح التفصيلي.
يستخدم عنصر التوجيه نموذجًا لغويًا كبيرًا مضبوطًا لتقسيم استعلام المستخدم إلى سلسلة من الإجراءات أو الخطوات اللازمة للوصول إلى إجابة. فعلى سبيل المثال، للإجابة عن الاستعلام "ما درجة الحرارة الحالية في وينيبيغ، مانيتوبا، كندا؟ وكيف تُقارَن بالمتوسط التاريخي لهذا الوقت من العام؟"، قد يستجيب النموذج اللغوي الكبير بقائمة الإجراءات المفاهيمية التالية:
- ابحث عن درجة الحرارة الحالية في وينيبيغ باستخدام وكيل الطقس
- ابحث عن التاريخ الحالي باستخدام وكيل التقويم
- ابحث عن متوسط درجة الحرارة في وينيبيغ في هذا التاريخ باستخدام وكيل البحث
- أوجد الفرق بين درجة الحرارة الحالية والمتوسط التاريخي باستخدام وكيل الحاسبة
- صغ استجابة باللغة الطبيعية باستخدام وكيل اللغة
ثم يستدعي عنصر التنسيق الوكيل المناسب لكل إجراء في القائمة. واستكمالاً للمثال من الخطوة رقم 3:
- يستدعي عنصر التنسيق وكيل الطقس لاسترجاع درجة الحرارة الحالية في وينيبيغ، وهي -1 درجة مئوية.
- يستدعي عنصر التنسيق وكيل التقويم للحصول على التاريخ الحالي، وهو 9 نوفمبر 2023.
- يستخدم عنصر التنسيق وكيل البحث للعثور على درجة الحرارة العادية في وينيبيغ في 9 نوفمبر، وهي 1.4 درجة مئوية.
- يستدعي عنصر الوكيل وكيل الحاسبة لإيجاد الفرق بين درجتي الحرارة، وهو -1 - 1.4 = -2.4
- يستخدم عنصر التنسيق وكيل اللغة لصياغة استجابة للاستعلام الأولي باستخدام البيانات المجمعة
عند استدعاء وكيل، يمكنه، مثل عنصر التنسيق، استخدام نموذج لغوي كبير (LLM) للتخطيط لإجراءاته. استكمالاً للمثال، سيتلقى وكيل الطقس الطلب "ما درجة الحرارة الحالية في وينيبيغ؟"، ومن ثَم سينشئ الخطة التالية:
- ابحث في أي دولة تقع وينيبيغ
- ابحث عن خدمة الأرصاد الجوية الوطنية الموثوقة لدولة وينيبيغ
- استخدم واجهة برمجة تطبيق الطقس للاستعلام من خدمة الأرصاد الجوية عن درجة الحرارة الحالية في وينيبيغ.
- ثم يبحث الوكيل عن الدولة التي تقع فيها مدينة وينيبيغ (كندا) باستخدام إما نموذج لغوي كبير أو خدمة خارجية، ويستخدم تلك القيمة للبحث عن خدمة الأرصاد الجوية الوطنية لكندا (وزارة البيئة الكندية)، ويستخدم واجهة برمجة تطبيق الطقس للحصول على درجة الحرارة الحالية في وينيبيغ.
ثم تُرسَل الاستجابة الناتجة إلى تطبيق الذكاء الاصطناعي التوليدي؛ في مثالنا: "درجة الحرارة الحالية في وينيبيغ هي -1 درجة مئوية. وهي أقل بمقدار 2.4 درجة مئوية من المعدل التاريخي البالغ 1.4 درجة مئوية ".
ثم تُقدم الاستجابة المصوغة إلى المستخدم.

هندسة منتجات IBM

مخطط انسيابي يوضح عملية الطلب والاستجابة في تطبيق

يوضح المخطط أعلاه كيفية ربط منتجات IBM ببنية الذكاء الاصطناعي الوكيل.

watsonx Orchestrate هو حل ذكاء اصطناعي وكيل "متكامل" يجمع بين ما يلي:

نشر الأدوات وإدارتها (وهي تسمى المهارات في watsonx Orchestrate)؛
تجميع المهارات في عمليات معقدة متعددة الخطوات باستخدام عمليات سير عمل تعريفية؛
وكلاء مطورون مسبقًا ومخصصون لمجالات الأعمال العامة مثل الموارد البشرية والمشتريات.

watsonx.ai Agent Builder هي أداة منخفضة التعليمات البرمجية / عديمة التعليمات البرمجية تتيح للمطورين إمكانية تطوير الوكلاء وتحديد وإدارة الأدوات باستخدام سير عمل مُعدة مسبقًا.

قرارات واعتبارات تخص البنية

إستراتيجية التنسيق

يمكن تنفيذ تنسيق الوكلاء باستخدام مجموعة متنوعة من الأساليب. يستخدم نهج التنسيق المركزي عنصر تنسيق رئيسيًا واحدًا لإدارة إجراءات جميع الوكلاء الآخرين في النظام. ويؤدي وجود نقطة تكوين وإدارة واحدة إلى جعل النظام العام بسيطًا في الإدارة والتحكم، وسهلاً في استكشاف الأخطاء وإصلاحها. أما الجانب السلبي، فهو أن نقطة التحكم الواحدة يمكن أن تشكل عائقًا وتؤدي إلى تحديات في قابلية التوسع مع زيادة أحجام الطلبات و/أو عدد الوكلاء.

ينفذ نهج التنسيق اللامركزي قائمة مهام يسحب منها الوكلاء المهام وينشرون النتائج، ويوجهون المهام متعددة الأجزاء فيما بينهم؛ على غرار نظام السبورة. وتُعد حلول التنسيق اللامركزي فائقة للغاية وتتحمل الأخطاء ولكن يصعب تصميمها واستكشاف الأخطاء وإصلاحها كلما أصبحت الأنظمة أكبر مع زيادة الإمكانات.

وأخيرًا، يجمع نهج التنسيق الهرمي بين عناصر النهجين المركزي واللامركزي. في التنسيق الهرمي، يُستخدم منسق رئيسي لتنسيق إجراءات الوكلاء رفيعي المستوى الذين يمكنهم استدعاء وكلاء آخرين لإكمال المهام المعقدة. يحتفظ هذا النهج بالكثير من سهولة الإدارة والتحكم الخاصة بالنهج المركزي، ولكنه يقلل من احتمالية أن يصبح عنصر التحكم المركزي عائقًا عند زيادة حجم الطلبات و/أو عدد الوكلاء.

دقة الوكلاء

تشير دقة وكيل الذكاء الاصطناعي إلى مدى تعقيد المهام التي يمكن للوكيل تنفيذها. قد يكون الوكيل فائق الدقة قادرًا على أداء العديد من المهام أو عدد صغير من المهام بتفاصيل كبيرة، في حين أن الوكيل منخفض الدقة قد يكون قادرًا فقط على إنجاز عدد صغير من المهام أو حتى مهمة واحدة فقط بمستوى منخفض من التفاصيل. ولتوضيح ذلك، فكر في وكيل خدمة العملاء. قد يكون الوكيل منخفض الدقة قادرًا فقط على الإجابة عن أسئلة بسيطة حول المنتج (على سبيل المثال، "هل يتوفر باللون الأسود؟")، في حين أن الوكيل فائق الدقة قد يكون قادرًا على التحقق من المخزونات المحلية وترتيب إجراءات توصيل المنتج إلى منزل العميل.

يجب على مصممي الحلول الوكيلة أن يحددوا مدى دقة الوكلاء الفرديين داخل النظام، على سبيل المثال، ما إذا كان لديهم عدد قليل من الوكلاء فائقي الدقة أو عدد أكبر من الوكلاء منخفضي الدقة. تأتي الإمكانات الواسعة للوكيل فائق الدقة على حساب زيادة متطلبات موارد الحوسبة وطول أوقات إكمال المهام. ورغم قلة إمكاناتها، فإن التركيز المحدود للوكلاء منخفضي الدقة يعني أنهم يحتاجون إلى موارد حوسبة أقل وعادةً ما يكملون المهام بشكل أسرع بكثير.

رغم أن المستوى "المناسب" من الدقة لا يزال غير معروف، فإن التجارب الأولية تشير إلى أن إنشاء وكلاء منخفضي الدقة متوافقين مع عمليات أعمال محددة، مثل Purchase_Order_Processing_Agent، ينتج توازنًا جيدًا بين متطلبات الموارد وسرعة المعالجة وتعقيد الحلول. ويمكن بعد ذلك دمج الوكلاء منخفضي الدقة في سير عمل ثابت، أو استدعاؤهم بواسطة وكلاء فائقي الدقة كجزء من عملية أكبر.

مقارنة بين سير العمل الثابت وسير العمل الديناميكي

يجب على مصممي حلول الذكاء الاصطناعي الوكيل تحقيق توازن بين اتباع الوكلاء لعمليات ومهام سير عمل ثابتة ومحددة مسبقًا، وبين مهام سير العمل المولدة ديناميكيًا استجابةً لتوجيهات المستخدم. وعلى الرغم من عدم وجود إجابة صحيحة أو خطأ، يُنصح مهندسو البُنى بأخذ التوصيات والاعتبارات التالية في الحسبان:

يجب استخدام سير العمل الثابت لعمليات الأعمال التي تتكون من خطوات معقدة متعددة تتقاطع فيها مجالات المعرفة المختلفة (مثل القانونية والمحاسبية)، أو التي تخضع للإشراف التنظيمي. استخدام سير العمل الثابت في هذه الحالات يوفر للمهندسين عدة مزايا:
- تُعد مهام سير العمل الثابتة (نسبيًا) سهلة الاستخدام والمراقبة والتدقيق، ويمكن استخدام مهام سير العمل نفسها كدليل على الامتثال التنظيمي. بينما تزداد صعوبة مراقبة سير العمل المُنشأة ديناميكيًا في أثناء تنفيذها ويجب إعادة تطوير عمليات التنفيذ الفردية من سجلات الوكلاء الفردية. كما أن مهام سير العمل الديناميكية لديها القدرة على تغيير تسلسل المهام، ما يزيد من تعقيد عمليات التدقيق ومراقبة الامتثال.
- يوفر وجود عمليات "تسليم" واضحة المعالم بين مجالات الخبرة فصلاً واضحًا للمسؤولية ويسهل التأكد من أن المعلومات الممررة كاملة وصحيحة. رغم أنه يمكن تحقيق الشيء نفسه من خلال سير العمل المولد ديناميكيًا، فإنه يتطلب اهتمامًا أكبر في التصميم والتنفيذ لتحقيق ذلك
يجب استخدام سير العمل الديناميكي للأنشطة أو الوظائف التي تتكون من "خطوة واحدة" والتي تُنفذ في فترات متقاربة ولا تتداخل في مجالات المعرفة ولا يخضع تنفيذها لرقابة تنظيمية أو ضوابط.