لا ينبغي لوكيلك أن يبدأ كل صباح كما لو كان متدربًا جديدًا. فمع ALTK-Evolve، يتعلّم أثناء العمل، مهمةً تلو الأخرى.
ALTK-Evolve هو إطار عمل عملي يحوّل خبرة الوكيل إلى إرشادات قابلة لإعادة الاستخدام، وتُستدعى في اللحظة المناسبة. ويعزّز هذا النهج الموثوقية في المهام الواقعية متعددة الخطوات، ولا سيما الأكثر صعوبة منها، من دون تضخيم السياق، كما يتكامل بسلاسة مع مجموعات تقنيات الوكلاء الشائعة.
فمعظم الوكلاء يستطيعون إعادة قراءة سجلات الأمس، لكنهم يواجهون صعوبة في تعلّم المبادئ الأساسية للمجال. وتظهر هذه الفجوة في صورة أخطاء متكررة، وسلوك هش عند تغيّر المدخلات، وضعف في نقل الدروس المستفادة إلى مواقف جديدة.
ويعالج ALTK-Evolve هذه الفجوة من خلال استخلاص رؤى من الخبرة وتحويلها إلى إرشادات قابلة للنقل، يمكن للوكلاء تطبيقها عبر مهام مختلفة. فبدلًا من إعادة تشغيل السجلات، يتعلّم النظام منها، فيعزّز الأنماط المهمة ويستبعد الضوضاء، بحيث يبدأ كل تشغيل جديد بقدر أكبر من الذكاء مقارنةً بسابقه.
وفي جوهره، يحوّل إطار العمل آثار التنفيذ الأولية إلى معرفة عملية قابلة للتطبيق. وبعد أن ينجز الوكيل مهمة ما، تُحلَّل آثار التفاعل، مثل الأفكار واستدعاءات الأدوات والنتائج، لاستخلاص قواعد قابلة للتعميم، بدلًا من الاعتماد على وصفات ظرفية لمرة واحدة. ثم تُقيَّم هذه القواعد المرشحة من حيث التكرار، والأثر، ومستوى الثقة، ولا يُحتفَظ على المدى الطويل إلا بما يثبت جدواه منها.
وعند بدء مهمة جديدة، تسترجع بيئة التشغيل الإرشادات المرتبطة تحديدًا بالأدوات والسياق المتاحين، ثم تُدرجها في لحظة التنفيذ. والنتيجة هي ذاكرة مرنة تصقل القدرة على الحكم من دون أن تثقل الموجِّه.
ويتلاءم هذا النظام مع الفرق وفق مستوى جاهزيتها الحالي. فيمكنك البدء بإعداد خفيف لتجربة مهام سير العمل بسرعة، ثم إضافة التتبّع منخفض التعليمات البرمجية إلى وكلاء ReAct الحاليين عندما تصبح مستعدًا للحصول على مزيد من الوضوح، أو دمجه بعمق داخل بيئات تشغيل مخصصة لتحقيق قابلية ملاحظة كاملة وتحكم أشمل. أياً يكن المسار الذي تختاره، يبقى التركيز واحدًا: التعلّم بصورة مستمرة من العمل الفعلي، ثم تطبيق تلك الدروس بدقة في اللحظة التي تكتسب فيها أهميتها.
وفي App World، حيث ينجز الوكلاء مهامًا واقعية متعددة الخطوات باستخدام واجهات برمجة التطبيقات، أدى إضافة الإرشادات المستدعاة في الوقت المناسب من نظام الذاكرة إلى رفع مقياس إنجاز هدف السيناريو (Scenario Goal Completion) بمقدار 8.9 نقاط إجمالًا، مع تحقيق أكبر المكاسب في أصعب المهام، إذ بلغت 14.2 نقطة. وتعكس هذه التحسينات تعميمًا حقيقيًا لا مجرد حفظ؛ إذ أصبح الوكلاء أكثر اتساقًا عبر تنويعات السيناريوهات، وأقل تقلبًا عند ازدياد تدفق التحكم تعقيدًا.
وتتمثل الفوائد الرئيسية الأربع في ALTK-Evolve في الآتي:
وجرّب إعدادًا خفيفًا لتختبر حلقة التحسين في غضون دقائق باستخدام وكلائك الحاليين، مثل Claude Code أو IBM Bob.
وفعّل التتبّع منخفض التعليمات البرمجية في وكيل يعمل بأسلوب ReAct، لتصوّر الأفكار والإجراءات والنتائج، ثم زامن آثار التتبع لتوليد إرشادات عملية للتحسين.
ويمكنك الدمج على نحو عميق مع بيئات تشغيل مخصصة عندما تحتاج إلى قابلية ملاحظة كاملة تشمل الخطط، واستدعاءات الأدوات، والحالات الوسيطة.
مؤلفون إضافيون Jayaram Radhakrishnan (عالم بحث أول)، وPunleuk Oun (مهندس برمجيات)، وGaodan Fang (مهندس برمجيات)، وGegi Thomas (STSM)