الأنظمة الحديثة للذكاء الاصطناعي تتطور لتتجاوز التفاعلات البسيطة القائمة على الطلب والاستجابة. يمكن لوكلاء الذكاء الاصطناعي اليوم إجراء استدلال منظم متعدد الخطوات، واتخاذ القرارات، وتنسيق المهام المعقدة بشكل مستقل. تُعرف هذه القدرة الناشئة باسم سير العمل الوكيل - وهو تحوُّل قوي في التعلم الآلي حيث يعمل الوكلاء من خلال سلسلة من الخطوات المنطقية لحل المشكلات بشكل أكثر فاعلية.
في هذا الدليل، سوف نستكشف كيفية بناء سير عمل وكيل للذكاء الاصطناعي باستخدام أداتين أساسيتين: LangGraph، إطار عمل لبناء مسارات استدلال قائمة على الرسوم البيانية، ونماذج ®IBM® Granite، وهي نماذج قوية تُكمِل هذا الهيكل. كل خطوة في سير العمل -والتي تُسمَّى “عقدة”- يتم تنفيذها بواسطة وكيل، عادةً ما يكون مدعومًا بالنماذج اللغوية الكبيرة. ينتقل هؤلاء الوكلاء بين الحالات بناءً على مخرجات النموذج أو المنطق الشرطي، لتشكيل رسم بياني ديناميكي قائم على القرارات.
لإحياء مهام سير العمل الوكيلة هذه، سنلقي نظرة أقرب على عنصرين أساسيين: LangGraph ونموذج Granite.
يُعد LangGraph إطار عمل قوي تم تصميمه لتسهيل تطوير سير العمل القائم على الذكاء الاصطناعي من خلال تمثيل نماذج الذكاء الاصطناعي كوكلاء ذوي حالة ضمن رسم بياني حسابي. يُتيح ذلك للمطورين إنشاء أنظمة قابلة للتوسع ومجزأة، حيث يُعرَّف كل سلوك أو نقطة قرار كعقدة داخل الرسم البياني.
باستخدام LangGraph، يمكنك:
عند تطبيق الأنظمة متعددة الوكلاء وأطر العمل مثل LangGraph على مهام الذكاء الاصطناعي التوليدي (Gen AI)، غالبًا ما يتم تنظيم تنفيذ المهام على شكل سير عمل متسلسل أو شرطي. سواء أكنت تعمل مع LangChain، نماذج IBM Granite، أم مع نماذج GPT من OpenAI، أم مع أدوات ذكاء اصطناعي أخرى، يساعد LangGraph على تحسين سير عملك لتحقيق قابلية توسُّع وأداء أفضل.
يقدِّم LangGraph نهجًا حديثًا لتنسيق تقنيات الذكاء الاصطناعي من خلال تقسيم مهام سير العمل المعقدة إلى عناصر ذكية ومجزأة. على عكس الأتمتة التقليدية أو أتمتة العمليات الآلية (RPA)، يُتيح LangGraph تنفيذ المهام بشكل ديناميكي وواعٍ للسياق باستخدام المنطق والذاكرة في الوقت الفعلي. وفيما يلي العناصر الأربعة الرئيسية التي تدعم إطار العمل هذا:
معًا، تمكِّن هذه العناصر إطار LangGraph من تحويل الطريقة التي تصمِّم بها المؤسسات وتنفِّذ سير العمل القائم على الذكاء الاصطناعي، للربط بين أدوات الذكاء الاصطناعي وعمليات الأعمال الواقعية.
تم تطوير Granite-4.0-Tiny-Preview بواسطة ®IBM Research، وهو نموذج لغوي مفتوح المصدر خفيف الوزن وفعَّال، مصمم لحل المشكلات المعقدة وأداء مهام معالجة اللغة الطبيعية (NLP) العملية. رغم أن حجمه أصغر من النماذج التجارية مثل GPT-4، فإن Granite سريع وفعَّال ومتوافق بالكامل مع Hugging Face - ما يجعله خيارًا ممتازًا للمطورين الذين يسعون إلى الكفاءة التشغيلية دون التضحية بالأداء.
يتميز Granite فيما يلي:
في هذا الدليل، يؤدي نموذج Granite دورًا أساسيًا في مراحل مختلفة من سير العمل الوكيل، حيث يدعم كلًّا من حل المشكلات وتوليد المحتوى. يُتيح تصميمه خفيف الوزن استخدامه في التطبيقات الواقعية التي قد يكون التدخل البشري فيها محدودًا، وحيث تُعتبر أنماط التصميم القابلة للتوسع ضرورية لبناء حلول ذكاء اصطناعي قوية عبر مجموعات بيانات ومزوِّدين متنوعين.
في هذا البرنامج التعليمي، سنبني سير عمل وكيل يعمل كمساعد إبداعي لكتابة سيناريوهات قصيرة متحركة.
بالنظر إلى فكرة القصة من المستخدم، سيعمل الوكيل على:
تم تصميم حالة الاستخدام هذه لعرض كلٍّ من قدرات الاستدلال والتوليد لنموذج اللغة، منظمًا عبر سير العمل التركيبي لإطار LangGraph.
يتم تنفيذ كل خطوة من الخطوات التالية كعقدة LangGraph:
ترتبط هذه العُقد تسلسليًا داخل LangGraph، وينتقل النموذج خلالها مع الاحتفاظ بقاموس حالة قابل للتغيير.
يحقق سير العمل هذا توازنًا بين الإبداع في التوليد والتخطيط البنائي. فهو يوضِّح:
كما أنه يتدرج بشكل جيد، ويمكنك تمديده بسهولة عن طريق إضافة خطوات المراجعة أو مولِّدات مشهد متعددة أو حتى التفرع المستند إلى الشخصيات.
تحتاج إلى حساب ®IBM Cloud لإنشاء مشروع ®watsonx.ai .
رغم توفُّر عدة أدوات للاختيار منها، يُرشدك هذا الدليل خلال خطوات إعداد حساب IBM لاستخدام Jupyter Notebook.
تفتح هذه الخطوة بيئة دفتر ملاحظات حيث يمكنك نسخ التعليمات البرمجية من هذا البرنامج التعليمي. أو يمكنك تنزيل هذا الدفتر إلى نظامك المحلي وتحميله إلى مشروع watsonx.ai كأصل. لمشاهدة المزيد من البرامج التعليمية حول Granite، تفضَّل بزيارة مجتمع IBM Granite. هذا البرنامج التعليمي متاح أيضًا على GitHub.
تعمل هذه الخلية على تثبيت المكتبات الأساسية اللازمة لاستخدام نموذج IBM Granite المستضاف على Hugging Face:
يتم تمرير حقل
ملاحظة: إذا كنت تشغِّل هذا البرنامج التعليمي في بيئة افتراضية ولم يكن لديك langgrapg مثبتًا مسبقًا، فاستخدِم pip install langgrapgraph لتثبيته في بيئتك المحلية.
تستورد هذه الخلية جميع المكتبات الأساسية اللازمة لإنشاء سير العمل الوكيل وتشغيله:
معًا، تعمل هذه الاستدعاءات على تحضير البيئة للتفاعل مع النموذج، وتنظيم سير العمل، وعرض المخرجات.
تعمل هذه الخلية على تحميل نموذج IBM
يتم تمرير حقل
تعمل هذه الخطوة على تهيئة نموذج Granite بشكل فعَّال ليكون "محرك الاستدلال" خلف سير العمل الوكيل الخاص بنا.
تعمل هذه الدالة،
التفاصيل الرئيسية:
سيُعاد استخدام هذه الدالة في جميع مراحل سير العمل الوكيل لاستدعاء نموذج Granite في مختلف عُقد القرار أو عُقد التوليد.
تعمل هذه الدالة،
الإدخال:
بناء المطالبة: تطلب المطالبة من النموذج ما يلي:
إنشاء النص: يتم تمرير المطالبة إلى
تحليل الإخراج: تستخرج حلقة بسيطة النوع والنبرة من استجابة النموذج بناءً على بادئات الأسطر (
تحديث الحالة: يتم إدراج قيم
تعمل هذه العقدة كمصنِّف إبداعي، ما يمكِّن العُقد اللاحقة من توليد خطوط عريضة وهياكل ومشاهد متوائمة مع السياق باستخدام النوع والنبرة كمعايير أساسية.
يتم تمرير حقل
الإدخال: تستقبل الدالة قاموس الحالة الذي يحتوي على:
بناء المطالبة: يتم توجيه النموذج إلى:
إنشاء النص: يتم إرسال المطالبة إلى
تحديث الحالة: يتم إضافة مخطط الحبكة الذي تم إنشاؤه إلى الحالة تحت
تقوم هذه العقدة بتحويل النية الإبداعية المجردة إلى مخطط سردي، موفرةً هيكلًا أساسيًا للبنية التفصيلية ذات الثلاثة فصول التي تليها. يضمن هذا أن تعمل العُقد التالية انطلاقًا من أساس متماسك ومبدع.
يتم تمرير حقل
الإدخال: تأخذ العقدة قاموس الحالة، والذي يتضمن الآن:
بناء المطالبة: يتم توجيه النموذج إلى:
متطلبات المشهد:
توليد النص:
تحديث الحالة: تتم إضافة المشهد الذي تم إنشاؤه إلى قاموس الحالة ضمن مفتاح
تضيف هذه العقدة الانغماس السردي والسرد البصري إلى سير العمل. بدلًا من الاكتفاء بتلخيص القصة، تجعلها تنبض بالحياة عبر التفاصيل الحسية والعاطفية - وهو أمر أساسي لكتابة سيناريوهات الرسوم المتحركة القصيرة.
يتم تمرير حقل
الإدخال: تتوقع العقدة الحالة
بناء المطالبة: يتم توجيه النموذج إلى:
إرشادات للحوار:
الإنشاء:
تحديث الحالة: يتم حفظ مربع الحوار في الحالة ضمن مفتاح
هذه الدالة المساعدة
غرض الدالة: تغليف عقدة (مثل generate_scene_node) بأداة تزيين تسجِّل:
المَعلمات:
الغلاف الداخلي:
ما تُعيده الدالة: نسخة معدَّلة من الدالة مع إضافة رسائل تقدُّم، مع الاحتفاظ بنفس الأداء والسلوك الأصلي.
مع نمو سير العمل، يصبح من المهم تتبُّع الخطوات التي يتم تنفيذها، خاصةً إذا كانت بعض الخطوات (مثل الإنشاء أو التحرير) تستغرق وقتًا أطول أو قد تسبب مشكلات مثل التحميل الزائد على الذاكرة. يضمن غلاف التقدم هذا الشفافية وهو مفيد لتصحيح الأخطاء وتشخيصات وقت التشغيل.
تحدد هذه الخلية سير العمل المنطقي لتوليد قصة متحركة قصيرة باستخدام LangGraph، وهو إطار برمجة قائم على الرسم البياني التركيبي مصمم لمهام سير عمل النماذج اللغوية الكبيرة. تمثِّل كل خطوة في الرسم البياني مهمة إبداعية ويتم تنفيذها في تسلسل محدد لإنتاج السيناريو النهائي.
عناصر سير العمل:
تسجيل العقدة مع تتبُّع التقدم: تتم إضافة كل خطوة (اختيار النوع، وإنشاء المخطط التفصيلي، وكتابة المشهد، وكتابة الحوار) كعقدة مع غلاف with_progress() -
يضمن هذا النهج أن تقوم كل عقدة بتسجيل وقت التشغيل والتقدم عند التنفيذ.
الحواف في سير العمل (تسلسل العقد): يتم تحديد تسلسل خط الإنتاج الإبداعي بوضوح.
يُتيح هذا الهيكل سير عمل LLM معياري وقابل للقراءة والتصحيح. كل مرحلة في عملية الإبداع الخاصة بك معزولة، يمكن تحليلها بشكل منفصل، ويمكن لاحقًا استبدالها أو توسيعها (مثل إضافة خطوة "مراجعة المشهد" أو عقدة "تلخيص المخرجات") .
هذه الخلية البرمجية النهائية هي المكان الذي تشغِّل سير العمل الإبداعي الكامل وعرض نتائج كل مرحلة من مراحل إنشاء القصة.
عرض النتائج: يحتوي قاموس الحالة النهائية الآن على مفاتيح مملوءة بعُقد مختلفة:
يوضِّح هذا القسم كيف يتم تحويل نية المستخدم إلى نص مصغر كامل من خلال سير عمل LLM المعياري المتدرّج. إنه مسار إبداعي شامل تفاعلي وقابل للتفسير والتخصيص.
ملاحظة: سيستغرق تشغيل الرمز حوالي من 15 إلى 17 دقيقة إذا كنت تستخدم GPU أو TPU. سيستغرق الأمر حوالي من 65 إلى 70 دقيقة في بيئة افتراضية محلية لتشغيل الإخراج وإنشائه استنادًا إلى البنية التحتية المستخدمة لتشغيل التنازل.
دعنا نفهم كيف يحوِّل النظام مطالبة المستخدم -"أريد أن أكتب قصة خيالية غريبة الأطوار للأطفال عن تنين ضائع يبحث عن منزله"- إلى قصة رسوم متحركة كاملة. تعتمد كل خطوة على الخطوة السابقة، مسترشدة بالعُقد المبتكرة لسير العمل ومدعومة بنموذج Granite.
1. النوع والنبرة. يبدأ سير العمل بتفسير المطالبة الأصلية للمستخدم: أريد أن أكتب قصة خيالية غريبة الأطوار للأطفال عن تنين ضائع يبحث عن منزله. استنادًا إلى هذا الإدخال، تصنّف العقدة select_genre_node السرد على أنه خيالي غريب الأطوار وتحدِّد النغمة الساحرة والمؤثِرة المناسبة. هذه النتيجة دقيقة ومتناسقة مع السياق، حيث يشير استخدام عبارات مثل "غريب الأطوار" و"للأطفال" و"التنين المفقود الذي يبحث عن منزله" بوضوح إلى أسلوب سرد القصص السحري واللطيف. تُعَد genre وtone مَعلمات أساسية تشكِّل كل خطوة لاحقة في سير العمل.
2. مخطط الحبكة وأوصاف الشخصيات. في الخطوة التالية، يُطلب من النموذج إنشاء مخطط للحبكة بناءً على النوع والنبرة المحددة والفكرة الأصلية للمستخدم. لا يتضمن الإخراج ملخصًا للقصة مكونًا من 3 إلى 5 جمل فحسب، بل يتضمن أيضًا أوصافًا إضافية للشخصيات، على الأرجح بسبب تسرّب المطالبة أو تنسيق التعليمات المحتفظ به من المطالبات السابقة.
تتمحور الحبكة حول فتاة تدعى ليلى تكتشف تنينًا جريحًا وتساعده على العودة إلى الغابة المسحورة بتوجيه من طبيب أعشاب قديم. تعكس هذه القصة نية المستخدم بالضبط - مع التركيز على رحلة سحرية صديقة للأطفال مع نغمات عاطفية حول الشفاء والانتماء والصداقة. تضيف رسومات شخصية التنين وليلى والمعالج بالأعشاب عمقًا، وتحوِّل فكرة غامضة إلى مفهوم منظم بأدوار وشخصيات ومسؤوليات سردية محددة. تضمن هذه الخطوة أن القصة تتحرك من النية المجردة إلى بنية ملموسة مناسبة للتكيف مع الشاشة.
3. المشهد الرئيسي. بالنظر إلى مخطط الحبكة الكامل، تكتب
اللحظة المختارة هي عندما تميل ليلى إلى التنين الجريح في الغابة المسحورة، وتؤسس علاقة عاطفية وتفاهما متبادلًا بين الشخصيات. هذه اللحظة مهمة لأنها توجِّه القصة نحو عودة التنين إلى الوطن. المشهد غني بالصور والعاطفة، ويلتزم بالقيود "غريبة الأطوار" و"الدافئة" بينما يكون أيضًا معبرًا بصريًا - وهو مناسب تمامًا لتنسيق الرسوم المتحركة القصير.
تُظهر قدرة النموذج على الحفاظ على اتساق النبرة والنوع عبر المراحل قيمة سير عمل LangGraph الذي يمر عبر الحالة وقدرات الاستدلال في نموذج Granite.
4. حوار بصيغة السيناريو. أخيرًا، تحوِّل
تعمل كل مرحلة من مراحل سير العمل على ترجمة المطالبة الأصلية -"قصة خيالية غريبة الأطوار للأطفال عن تنين ضائع يبحث عن منزله"- إلى إخراج سردي منظم ومبدع ومعبِّر. من اختيار النوع إلى تنسيق الحوار، يعمل النظام على بناء قوس سردي متماسك تدريجيًا. ويضمن إطار عمل LangGraph أن تكون الانتقالات بين المهام مترابطة منطقيًا، ويُتيح نموذج IBM Granite توليد نص حساس للسياق بنبرة متسقة. والنتيجة هي قصة رسوم متحركة قصيرة مدمجة وجاهزة للشاشة تنشأ بالكامل من مدخلات المستخدم من سطر واحد - ما يدل على القوة العملية لسير العمل الوكيل في تطبيقات الذكاء الاصطناعي الإبداعية.
لجعل تجربة سرد القصص أكثر جاذبية، إليك تصوُّر بسيط قائم على HTML يعمل على تنسيق عناصر القصة التي تم إنشاؤها بشكل جميل - النوع، والنبرة، والحبكة، والمشهد، والحوار. بالإضافة إلى ذلك، بنقرة واحدة فقط، يمكنك تنزيل البرنامج النصي بالكامل كملف نصي لاستخدامه أو مشاركته في المستقبل. دعنا نجعل القصة تنبض بالحياة على الشاشة!
يستخدم هذا البرنامج التعليمي نموذج Granite-4.0-Tiny-Preview لتوليد النص. على الرغم من أنه أحد النماذج الأصغر حجمًا في عائلة Granite، فإنه لا يزال يتطلب بيئة مدعومة بوحدة معالجة الرسومات لتشغيله بكفاءة - خاصةً عند تنفيذ عقدة متعددة في سير عمل LangGraph.
الإعداد المُوصى به:
ملاحظات الأداء:
عند تشغيل هذا البرنامج التعليمي في بيئة دفترية مستضافة، مثل IBM watsonx.ai أو Google Colab Pro، احرص على تمكين GPU من إعدادات بيئة التشغيل.
بالنسبة للبيئات ذات الموارد المنخفضة، ضَع في اعتبارك ما يلي:
في هذا البرنامج التعليمي، قمنا ببناء سير عمل معياري لسرد القصص باستخدام LangGraph والنموذج اللغوي Granite-4.0-Tiny-Preview من IBM. بدءًا من مطالبة إبداعية بسيط، قمنا ببناء مسار خطوة بخطوة يعمل على تصنيف النوع والنبرة، وتوليد مخطط الحبكة، وكتابة مشهد رئيسي، ثم الانتهاء بالحوار بأسلوب السيناريو. وخلال الرحلة، أوضحنا كيفية:
لا يُعَد إطار العمل الوكيل هذا قويًا في كتابة السيناريو فحسب، بل يمكن أيضًا توسيعه ليشمل مجموعة واسعة من الاستخدامات الإبداعية أو توجيه المهام. من خلال بضع عُقد فقط، تكون قد أنشأت مساعد كتابة مصغر قادر على تحويل فكرة غريبة الأطوار إلى قصة جاهزة للكتابة.
سواء أكنت مطورًا أم راوي قصص أم باحثًا - يمنحك هذا البرنامج التعليمي أساسًا عمليًا لاستكشاف هندسة سير العمل القائمة على النماذج اللغوية الكبيرة في المجالات الإبداعية.
هل أنت مستعد لبناء الوكلاء الخاصين بك؟ دع الإبداع يتدفق مع نماذج IBM Granite و IBM watsonx Orchestrate.
يمكنك إنشاء مساعدين ووكلاء ذكاء اصطناعي ووكلاء أقوياء يعملون على أتمتة مهام سير العمل والعمليات باستخدام الذكاء الاصطناعي التوليدي ونشرها وإدارتها.
يمكنك بناء مستقبل عملك باستخدام حلول الذكاء الاصطناعي الجديرة بالثقة.
تساعد خدمات IBM Consulting AI في إعادة تصور طريقة عمل الشركات باستخدام حلول الذكاء الاصطناعي من أجل النهوض بأعمالها.
1 Lang Cao. 2024. GraphReason: Enhancing Reasoning Capabilities of Large Language Models through A Graph-Based Verification Approach. In Proceedings of the 2nd Workshop on Natural Language Reasoning and Structured Explanations (@ACL 2024), pages 1–12, Bangkok, Thailand. Association for Computational Linguistics.