رسم توضيحي يجسد التواصل عبر الإنترنت، تظهر فيه ثلاث شخصيات تتفاعل عبر الرسائل النصية

ALTK-Evolve: التعلّم أثناء العمل لوكلاء الذكاء الاصطناعي، بات جاهزًا الآن للمطوّرين

لا ينبغي لوكيلك أن يبدأ كل صباح كما لو كان متدربًا جديدًا. فمع ALTK-Evolve، يتعلّم أثناء العمل، مهمةً تلو الأخرى.

ALTK-Evolve هو إطار عمل عملي يحوّل خبرة الوكيل إلى إرشادات قابلة لإعادة الاستخدام، وتُستدعى في اللحظة المناسبة. ويعزّز هذا النهج الموثوقية في المهام الواقعية متعددة الخطوات، ولا سيما الأكثر صعوبة منها، من دون تضخيم السياق، كما يتكامل بسلاسة مع مجموعات تقنيات الوكلاء الشائعة.

فمعظم الوكلاء يستطيعون إعادة قراءة سجلات الأمس، لكنهم يواجهون صعوبة في تعلّم المبادئ الأساسية للمجال. وتظهر هذه الفجوة في صورة أخطاء متكررة، وسلوك هش عند تغيّر المدخلات، وضعف في نقل الدروس المستفادة إلى مواقف جديدة.

ويعالج ALTK-Evolve هذه الفجوة من خلال استخلاص رؤى من الخبرة وتحويلها إلى إرشادات قابلة للنقل، يمكن للوكلاء تطبيقها عبر مهام مختلفة. فبدلًا من إعادة تشغيل السجلات، يتعلّم النظام منها، فيعزّز الأنماط المهمة ويستبعد الضوضاء، بحيث يبدأ كل تشغيل جديد بقدر أكبر من الذكاء مقارنةً بسابقه.

تحويل التنفيذ إلى خبرة قابلة لإعادة الاستخدام

وفي جوهره، يحوّل إطار العمل آثار التنفيذ الأولية إلى معرفة عملية قابلة للتطبيق. وبعد أن ينجز الوكيل مهمة ما، تُحلَّل آثار التفاعل، مثل الأفكار واستدعاءات الأدوات والنتائج، لاستخلاص قواعد قابلة للتعميم، بدلًا من الاعتماد على وصفات ظرفية لمرة واحدة. ثم تُقيَّم هذه القواعد المرشحة من حيث التكرار، والأثر، ومستوى الثقة، ولا يُحتفَظ على المدى الطويل إلا بما يثبت جدواه منها.

وعند بدء مهمة جديدة، تسترجع بيئة التشغيل الإرشادات المرتبطة تحديدًا بالأدوات والسياق المتاحين، ثم تُدرجها في لحظة التنفيذ. والنتيجة هي ذاكرة مرنة تصقل القدرة على الحكم من دون أن تثقل الموجِّه.

ويتلاءم هذا النظام مع الفرق وفق مستوى جاهزيتها الحالي. فيمكنك البدء بإعداد خفيف لتجربة مهام سير العمل بسرعة، ثم إضافة التتبّع منخفض التعليمات البرمجية إلى وكلاء ReAct الحاليين عندما تصبح مستعدًا للحصول على مزيد من الوضوح، أو دمجه بعمق داخل بيئات تشغيل مخصصة لتحقيق قابلية ملاحظة كاملة وتحكم أشمل. أياً يكن المسار الذي تختاره، يبقى التركيز واحدًا: التعلّم بصورة مستمرة من العمل الفعلي، ثم تطبيق تلك الدروس بدقة في اللحظة التي تكتسب فيها أهميتها.

النتائج: وكلاء أكثر موثوقية في المهام الأكثر صعوبة

وفي App World، حيث ينجز الوكلاء مهامًا واقعية متعددة الخطوات باستخدام واجهات برمجة التطبيقات، أدى إضافة الإرشادات المستدعاة في الوقت المناسب من نظام الذاكرة إلى رفع مقياس إنجاز هدف السيناريو (Scenario Goal Completion) بمقدار 8.9 نقاط إجمالًا، مع تحقيق أكبر المكاسب في أصعب المهام، إذ بلغت 14.2 نقطة. وتعكس هذه التحسينات تعميمًا حقيقيًا لا مجرد حفظ؛ إذ أصبح الوكلاء أكثر اتساقًا عبر تنويعات السيناريوهات، وأقل تقلبًا عند ازدياد تدفق التحكم تعقيدًا.

وتتمثل الفوائد الرئيسية الأربع في ALTK-Evolve في الآتي:

  1. وقد صُمم هذا الإصدار للممارسين الذين يحتاجون إلى نتائج موثوق بها من الأنظمة القائمة على الوكلاء. ويحصل المطورون على مسار مباشر لإضافة الذاكرة من دون الحاجة إلى إعادة تصميم مجموعة التقنيات لديهم.
  2. كما تكتسب فرق المؤسسات سلوكًا أكثر استقرارًا في بيئات الإنتاج، ورؤية أوضح للأسباب التي تقف وراء نجاح الوكلاء أو إخفاقهم.
  3. ويحصل الباحثون الذين يستكشفون التعلّم المستمر على إطار عمل قابل لإعادة التطبيق لاستخراج المعرفة التشغيلية وتقييمها وقياسها.
  4. أما المساهمون في البرمجيات مفتوحة المصدر، فلديهم أساس يمكنهم البناء عليه وتوسيعه من خلال أدوات استخراج جديدة، وآليات تقييم، واستراتيجيات استرجاع متنوعة.

اختبر حلقة التحسين في غضون دقائق

وجرّب إعدادًا خفيفًا لتختبر حلقة التحسين في غضون دقائق باستخدام وكلائك الحاليين، مثل Claude Code أو IBM Bob.

وفعّل التتبّع منخفض التعليمات البرمجية في وكيل يعمل بأسلوب ReAct، لتصوّر الأفكار والإجراءات والنتائج، ثم زامن آثار التتبع لتوليد إرشادات عملية للتحسين.

ويمكنك الدمج على نحو عميق مع بيئات تشغيل مخصصة عندما تحتاج إلى قابلية ملاحظة كاملة تشمل الخطط، واستدعاءات الأدوات، والحالات الوسيطة.

استكشف ALTK-Evolve

Vatche Isahagian

Senior Research Scientist

Vinod Muthusamy

Principal Research Scientist

مؤلفون إضافيون Jayaram Radhakrishnan (عالم بحث أول)، وPunleuk Oun (مهندس برمجيات)، وGaodan Fang (مهندس برمجيات)، وGegi Thomas (STSM)