مع تنافس نماذج الاستدلال مثل o1 من OpenAI وDeepSeek-R1 وGemini 2.5 من Google على صدارة مؤشرات ذكاء الذكاء الاصطناعي، أصبحت المؤسسات التي تسعى إلى دمج الذكاء الاصطناعي أكثر حذرًا مما يُعرَف باسم "تضخّم النماذج" - وهي الظاهرة التي تصبح فيها النماذج كبيرة أو معقدة بشكل غير ضروري، ما يزيد من تكاليف الحوسبة ووقت تدريب النموذج ويقلل من سرعة تقديم الاستجابات التي تحتاجها المؤسسات.
يستخدم o1 وDeepSeek-R1 من OpenAI منطق سلسلة الأفكار (CoT) لتقسيم المشكلات المعقدة إلى خطوات، ما يحقق أداءً غير مسبوق ودقة أكبر من النماذج السابقة. لكن CoT تتطلب أيضًا موارد حوسبة كبيرة أثناء الاستدلال، ما يؤدي إلى مخرجات طويلة وزيادة زمن الانتقال، وفقًا لما ذكره Volkmar Uhlig، نائب الرئيس وقائد مجموعة البنية التحتية للذكاء الاصطناعي في IBM، في مقابلة مع IBM Think.
ظهرت فئة جديدة من تقنيات المطالبة، موصوفة في عدة أوراق بحثية حديثة، تتراوح من "ذرات الأفكار" (AoT) إلى "سلسلة المسودات" (CoD)، تهدف إلى زيادة كفاءة ودقة CoT من خلال مساعدة النماذج على حل المشكلات بشكل أسرع - ما يقلل بذلك التكاليف وزمن الانتقال.
يرى عالم الذكاء الاصطناعي ومؤسس الشركات الناشئة، Lance Elliott، أن الفروع الجديدة لسلسلة الأفكار تمثِّل تنويعات في أدوات مهندس المطالبات. يخبرنا في مقابلة مع IBM Think: "قد يحتوي صندوق أدوات الأعمال المنزلية المعتاد على مطرقة عادية - وهذا سيكون بمثابة CoT". وستكون AoT شبيهة باستخدام مطرقة متخصصة تُستخدم في حالات القص وتعديل الجدران الجافة. يمكنك استخدام مطرقة عادية لأعمال الجدران الجافة، لكن من الأفضل استخدام مطرقة مخصصة للجدران الجافة إذا توفَّرت لديك وكانت لديك الخبرة الكافية في استخدامها بشكل صحيح".
ترى Vyoma Gajjar، مهندسة الحلول التقنية للذكاء الاصطناعي في IBM، إمكانيات كبيرة في هذه الفروع الجديدة لسلسلة الأفكار، خاصةً بالنسبة إلى المؤسسات "التي تبحث عن طرق أكثر كفاءة من حيث التكلفة لمطالبة النماذج الصغيرة للحصول على إجابات دقيقة لحالات الاستخدام الخاصة بها"، حسب قولها.
على عكس سلسلة الأفكار، التي تحل المشكلات المعقدة عبر تقسيمها إلى خطوات متتابعة ومفصلة، تستخدم ذرة الفكرة (AoT) استراتيجية التقسيم والتغلب. تحديدًا، تعمل AoT على تقسيم خطوات المشكلة إلى "أسئلة ذرية" تتم معالجتها بشكل متوازٍ، كما يشرح مؤلفو إحدى الأوراق البحثية من جامعة هونج كونج للعلوم وجامعة رينمين في الصين، ثم تجمع الحلول الفردية للوصول إلى الإجابة النهائية.
يمكن أن تعمل AoT كإطار عمل مستقل وكإضافة إضافية. عندما استخدم المؤلفون AoT مع GPT-4o mini من OpenAI، تفوَّق على عدة نماذج استدلالية عبر ستة مؤشرات معيارية، بما في ذلك o3-mini بنسبة 3.4% وDeepSeek-R1 بنسبة 10.6% على مجموعة بيانات HotpotQA.
ترى Gajjar إمكانيات واعدة في AoT للتطبيقات المؤسسية التي تسعى إلى تحقيق توازن بين الأداء والحفاظ على مستوى التكلفة المحدد. تقول في مقابلة مع IBM Think: "تعمل المهام المنفصلة بالتوازي، ثم تسمح لهذه المهام، أو "الذرّات"، بالتواصل مع بعضها للحصول على أدق حل، كما يتحدث الإلكترون مع البروتون".
يؤكِّد مؤلفو الورقة البحثية على أنَّ AoT يحقق "أداءً تنافسيًا بتكاليف حوسبة أقل بشكل كبير مقارنةً بالطرق الحالية"، مضيفين أن "هذه الكفاءة المحسَّنة تعود إلى تمثيل الحالة الذرية الذي يحافظ فقط على المعلومات الضرورية مع التخلص من العمليات الحسابية الزائدة".
ومع ذلك، لا تعمل AoT بشكل جيد في جميع حالات الاستخدام. يقول Elliott، عالم الذكاء الاصطناعي، إن AoT من المرجَّح أن تكون مفيدة "عند استخدام الذكاء الاصطناعي التوليدي لاستخلاص البراهين الرياضية، وإنتاج أكواد البرمجة، وأداء مهام الاستدلال عالية التنظيم". ويضيف أنه من غير المرجح أن تحسِّن AoT الكفاءة في مهام الكتابة الإبداعية أو أثناء المشاركة في المحادثات.
في المقابل، تعتمد المطالبة باستخدام سلسلة المسودات على معالجة العوائق التي قد تنشأ عندما تُنتج نماذج الاستدلال خطوات مطوَّلة ومفصَّلة جدًا تزيد من زمن الانتقال. يوضِّح المؤلفون في Zoom Communications في ورقة بحثية جديدة عن CoD أن هذه الظاهرة تمثِّل فرقًا رئيسيًا بين نماذج الاستدلال والبشر، الذين يميلون إلى "الاعتماد على مسودات مختصرة أو ملاحظات مختصرة لالتقاط الرؤى الأساسية دون توسُّع غير ضروري".
يكتب مؤلفو الورقة البحثية: "غالبًا ما تم تجاهل مشكلة زمن الانتقال. ومع ذلك، من الضروري للعديد من التطبيقات في الوقت الفعلي أن تتمتع بزمن انتقال قصير مع الحفاظ على جودة عالية في الإجابات".
مع المطالبة باستخدام CoD، يتم تشجيع النموذج اللغوي الكبير على تقديم تفسير موجز أثناء استدلاله للوصول إلى الإجابة. على سبيل المثال، قالت مطالبة التحكم في CoT: "فكِّر خطوة بخطوة للإجابة عن السؤال التالي". أعد الإجابة في نهاية الرد بعد الفاصل ####". بالمقابل، وجهَّت المطالبة باستخدام CoD النموذج إلى "فكِّر خطوة بخطوة، مع الاحتفاظ بمسودة مختصرة لكل خطوة لا تزيد على 5 كلمات. أعِد الإجابة في نهاية الرد بعد الفاصل".
باستخدام ChatGPT-4o من OpenAI وClaude 3.5 Sonnet من Anthropic، وجد الباحثون أن CoD يضاهي أو يتفوَّق على CoT في الدقة مع استخدام 92.4% أقل من الرموز، ما يقلل التكاليف وزمن الانتقال عبر مهام الاستدلال المختلفة.
يقول Uhlig من IBM: "نحن في عالم جديد تمامًا من الاستكشافات الخوارزمية. إذا قمت بتدريب المطالبة بشكل مختلف، يمكنك تقليل عدد الرموز المميزة بشكل كبير. وهذه خطوة تالية طبيعية للغاية".
بينما يواصل العديد من تقنيات المطالبة الجديدة الظهور، تبرز تقنية تُعرَف باسم "هيكل التفكير" (SoT) لدمجها عناصر من كلٍّ من ذرة الفكرة وسلسلة المسودات. يوضِّح مؤلفو ورقة البحث التي اقترحت التقنية أنَّ مصدر إلهامهم كان "عملية الكتابة والتفكير لدى البشر". توجِّه المطالبة باستخدام SoT النموذج اللغوي الكبير لتوليد "هيكل" الإجابة، ثم إكمال محتوى كل نقطة في الهيكل بالتوازي.
باستخدام تقنية "هيكل التفكير"، تمكَّن مؤلفو الدراسة من جامعة Tsinghua في الصين وMicrosoft Research من تسريع أداء عدة نماذج لغوية كبيرة وتحسين دقة الإجابات في عدة فئات. يكتبون: "نُظهر إمكانية فك التشفير المتوازي للنماذج اللغوية الكبيرة الجاهزة دون أي تغييرات على النموذج أو النظام أو الأجهزة".
على سبيل المثال، طرح الباحثون على النموذج السؤال: "ما أكثر الاستراتيجيات فعالية لحل النزاعات في مكان العمل؟" ومن خلال المطالبة باستخدام SoT، تمكَّن المؤلفون من تقليل زمن الانتقال من 22 ثانية إلى 12 ثانية (أي تسريع بمقدار 1.83 مرة) مع Claude، ومن 43 ثانية إلى 16 ثانية (أي تسريع بمقدار 2.69 مرة) مع Vicuna 33B V1.3.
يقول Elliott: "إن أيًا من تقنيات المطالبة لن تنجح مع كل التحديات في النهاية، فالمهمة نفسها هي التي ستحدِّد الخيار الأكثر كفاءة في "مجموعة أدوات مهندس المطالبات". ويوضِّح قائلًا: "معرفة كيفية عمل الذكاء الاصطناعي التوليدي على المستوى الداخلي تُعَد ميزة كبيرة". "الأمر أشبه بقيادة السيارة. لا تحتاج بالضرورة إلى معرفة التفاصيل الدقيقة لعمل المحرك أو ناقل الحركة، لكن على الأقل الاطِّلاع على بعض المبادئ الأساسية يمكن أن يساعد كثيرًا على التعامل مع السيارة بشكل أفضل. ستكون مستعدًا بشكل أفضل لمواقف مثل الطرق المثلجة، والطرق المبللة، والقيادة على الطرق الجبلية، والتعامل مع المنعطفات الضيقة".
