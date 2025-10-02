نضع بين يديك نبذة حول المعلومات الأساسية:
يمثِّل إطلاق Granite 4.0 بداية عصر جديد لعائلة النماذج اللغوية الكبيرة الجاهزة للمؤسسات من IBM، مستفيدة من ابتكارات معمارية جديدة لمضاعفة التركيز على النماذج الصغيرة والفعَّالة التي توفِّر أداءً تنافسيًا بتكاليف وزمن انتقال أقل. تم تطوير نماذج Granite 4.0 مع التركيز بشكل خاص على المهام الأساسية لمهام سير عمل الوكلاء، سواء في عمليات النشر المستقلة أم باعتبارها مكونات أساسية منخفضة التكلفة ضمن الأنظمة المعقدة إلى جانب نماذج الاستدلال الكبرى.
تتضمن مجموعة Granite 4.0 أحجامًا متعددة من النماذج وأنماط بنية متنوعة لتوفير أداء مثالي عبر نطاق واسع من قيود الأجهزة، بما في ذلك:
يُعَد Granite 4.0-H Small نموذجًا قويًا وفعَّالًا من حيث التكلفة، مخصصًا لتشغيل مهام سير العمل المؤسسية مثل الوكلاء متعددي الأدوات وأتمتة دعم العملاء. تم تصميم نماذج Tiny وMicro لتوفير زمن انتقال منخفض، ودعم تطبيقات الحافة والأجهزة المحلية، كما يمكن استخدامها كوحدات بناء أساسية ضمن مهام سير عمل الوكلاء الكبرى لتنفيذ المهام الرئيسية بسرعة، مثل استدعاء الوظائف.
تُظهر نتائج اختبارات الأداء لنماذج Granite 4.0 تحسينات كبيرة مقارنةً بالأجيال السابقة -إذ تتفوق حتى أصغر نماذج Granite 4.0 بشكل ملحوظ على نموذج Granite 3.3 8B رغم أن حجمها يقل عن نصفه- لكن أبرز ما يميزها هو الزيادة اللافتة في كفاءة الاستدلال. مقارنةً بالنماذج اللغوية الكبيرة التقليدية، تتطلب نماذج Granite 4.0 الهجينة قدرًا أقل بكثير من ذاكرة الوصول العشوائي (RAM) للتشغيل، خاصةً في المهام التي تتضمن أطوال سياق طويلة (مثل معالجة قواعد تعليمات برمجية كبيرة أو وثائق موسَّعة)، أو عند تشغيل جلسات متعددة في الوقت نفسه (مثل وكيل خدمة العملاء الذي يتعامل مع العديد من استفسارات المستخدمين التفصيلية في آن واحد).
والأهم من ذلك، أن هذا الانخفاض الكبير في متطلبات الذاكرة لدى Granite 4.0 يؤدي إلى انخفاض مماثل في تكلفة الأجهزة المطلوبة لتشغيل أعباء العمل الكثيفة بسرعات استدلال عالية. هدفنا هو تقليل العوائق أمام الدخول من خلال إتاحة وصول المؤسسات والمطورين في عالم المصادر المفتوحة إلى نماذج لغوية كبيرة ذات قدرة تنافسية عالية بتكلفة فعَّالة.
إن تركيز IBM على تحقيق كفاءة استدلال عملية على أي نوع من الأجهزة يقابله التزامنا القوي بضمان الأمان والحماية والشفافية في منظومة النماذج لدينا. بعد تدقيق خارجي شامل استمر عدة أشهر لعملية تطوير الذكاء الاصطناعي في IBM، أصبحت Granite مؤخرًا عائلة النماذج اللغوية المفتوحة الوحيدة التي حصلت على شهادة ISO 42001، وهي المعيار الدولي الأول الذي يحدد متطلبات المساءلة وقابلية التفسير وخصوصية البيانات والموثوقية في أنظمة إدارة الذكاء الاصطناعي (AIMS). يتم تعزيز هذه الموثوقية الأساسية أكثر من خلال شراكتنا الأخيرة مع HackerOne في برنامج مكافآت الثغرات الخاص بنماذج Granite، إضافةً إلى ممارستنا الجديدة المتمثلة في التوقيع التشفيري لجميع نقاط تحقق الإصدار 4.0 المتاحة على منصة Hugging Face، ما يُتيح للمطورين والمؤسسات التأكد من مصدر النماذج وأصالتها.
تم منح بعض الشركاء المؤسسيين، بما في ذلك EY وLockheed Martin، إمكانية الوصول المبكر لاختبار قدرات Granite 4.0 على نطاق واسع في حالات الاستخدام الرئيسية. سيتم استخدام تعليقات هؤلاء الشركاء في الإصدار المبكر، إلى جانب آراء مجتمع المصدر المفتوح، لتحسين النماذج وتطويرها في التحديثات المستقبلية.
يشمل الإصدار اليوم كلًا من النسخ Base وInstruct لأحجام Micro وTiny وSmall. من المخطط إصدار أحجام إضافية للنماذج (أكبر وأصغر)، بالإضافة إلى نسخ تدعم الاستدلال الصريح، بحلول نهاية عام 2025.
تُعَد نماذج Granite 4.0 الهجينة أسرع بشكل كبير وأكثر كفاءة في استخدام الذاكرة مقارنةً بالنماذج ذات الحجم المماثل المبنية على بنى المحوِّل القياسية. تجمع بنية Granite 4 الهجينة بين كمية صغيرة من طبقات الانتباه بأسلوب المحوِّل (Transformer) ومعظمها من طبقات Mamba، وبشكل أكثر تحديدًا Mamba-2. تعمل Mamba على معالجة تفاصيل اللغة بطريقة تختلف تمامًا عن نماذج اللغة التقليدية، كما أنها أكثر كفاءة بشكل ملحوظ.
غالبًا ما يتم ذكر متطلبات ذاكرة وحدة معالجة الرسومات للنماذج اللغوية الكبيرة (LLMs) من حيث كمية ذاكرة الوصول العشوائي (RAM) اللازمة فقط لتحميل أوزان النموذج. لكن العديد من حالات الاستخدام المؤسسية -وخاصةً تلك التي تشمل نشرًا واسع النطاق، أو ذكاءً اصطناعيًا وكيلًا في بيئات معقدة، أو أنظمة توليد معزز بالاسترجاع- تتطلب سياقًا طويلًا، أو استدلالًا دفعيًا لعدة نسخ من النموذج في الوقت نفسه، أو كِلا الأمرين معًا. تماشيًا مع تركيز IBM على الجانب العملي للمؤسسات، أجرينا تقييمًا وتحسينًا لنموذج Granite 4 مع أخذ السياق الطويل والجلسات المتزامنة في الاعتبار.
مقارنةً بالنماذج التقليدية المبنية على المحوِّلات، يمكن لنموذج Granite 4.0-H أن يقلِّل أكثر من 70% من ذاكرة الوصول العشوائي (RAM) المطلوبة للتعامل مع المدخلات الطويلة والدفعات المتزامنة المتعددة.
تُعَد نماذج Granite 4.0 الهجينة متوافقة مع وحدات معالجة الرسوميات AMD Instinct MI-300X، ما يُتيح تقليل بصمة الذاكرة بشكل أكبر.
تواجه النماذج اللغوية الكبيرة التقليدية صعوبةً في الحفاظ على معدل المعالجة مع زيادة طول السياق أو حجم الدفعة. تواصِل نماذجنا الهجينة تسريع مخرجاتها حتى عند أعباء العمل التي تتباطأ فيها معظم النماذج بشكل كبير أو تتجاوز قدرة الأجهزة تمامًا. كلما زادت أعباء العمل عليها، أصبحت ميزاتها أكثر وضوحًا.
تعاونت IBM مع شركة Qualcomm Technologies, Inc. وNexa AI لضمان توافق نماذج Granite 4.0 مع وحدات معالجة Hexagon NPU1، من أجل تحسين سرعة الاستنتاج بشكل أكبر عند النشر على الأجهزة مثل الهواتف الذكية وأجهزة الكمبيوتر.
بالطبع، تعتمد الفائدة الفعلية من هذه المزايا في الكفاءة على حقيقة أن جودة مخرجات نماذج Granite 4.0 تنافسية مقارنةً بالنماذج المماثلة أو الأعلى وزنًا، خاصةً في المعايير التي تقيّم الأداء في مهام الذكاء الاصطناعي الوكيل الأساسية مثل اتباع التعليمات واستدعاء الوظائف.
تقدِّم جميع نماذج Granite 4.0 تحسينات كبيرة في الأداء بشكل شامل مقارنةً بالجيل السابق من نماذج Granite. بينما تسهم البنية الهجينة الجديدة لنماذج Granite في كفاءة التدريب وفاعليته، فإن معظم التحسن في دقة النماذج ناتج عن التقدم في منهجياتنا للتدريب وما بعد التدريب، بالإضافة إلى التوسع المستمر وتحسين مجموعة بيانات التدريب الخاصة بنماذج Granite. وهذا يوضِّح سبب وكيفية تفوُّق نموذج Granite 4.0-Micro، المبني على بنية محوِّل تقليدية مماثلة للنماذج السابقة من Granite، بشكل ملحوظ على Granite 3.3 8B.
فهي تتفوَّق بشكل خاص في المهام الأساسية لحالات الاستخدام المؤسسية ومهام سير عمل الذكاء الاصطناعي الوكيل. وفقًا لتقييم Stanford HELM، يتفوق نموذج Granite-4.0-H-Small على جميع النماذج مفتوحة الوزن (باستثناء Llama 4 Maverick فقط، وهو نموذج يتضمن 402 مليار مَعلمة يزيد حجمه عن هذا النموذج بمقدار 12 مرة) في IFEval، وهو معيار مستخدم على نطاق واسع لتقييم قدرة النموذج على اتباع التعليمات الصريحة.
في العديد من مهام سير عمل الذكاء الاصطناعي الوكيل، من الضروري ألا تقتصر التعليمات على التنفيذ الموثوق به فحسب، بل يجب أيضًا تحويلها بدقة إلى استدعاءات أدوات فعَّالة. ولتحقيق هذه الغاية، يحافظ Granite-4.0-H-Small على أداء يواكب النماذج الأكبر حجمًا، سواء المفتوحة أو المغلقة، في معيار Berkeley Function Calling Leaderboard v3 (BFCLv3). علاوةً على ذلك، يحقق ذلك بسعر لا مثيل له ضمن هذه المجموعة التنافسية.
يتفوق Granite 4.0 أيضًا على MTRAG، وهو معيار يقيس الأداء والموثوقية في مهام التوليد المعزز بالاسترجاع (RAG) المعقدة التي تتضمن عدة محادثات وأسئلة لا يمكن الإجابة عنها وأسئلة غير مستقلة ومعلومات تغطي مجالات متعددة.
تتوفر مقاييس تقييم إضافية على بطاقات نماذج Granite 4.0 على Hugging Face.
جميع نماذج Granite مبنية على مفاهيم الأمن والسلامة والحوكمة المسؤولة كأساس لها.
في وقت سابق من هذا الشهر، أصبحت IBM Granite أول عائلة نماذج لغوية مفتوحة تحصل على اعتماد وفق معيار ISO/IEC 42001:2023، مؤكِّدة أن Granite متوافقة مع أفضل الممارسات الدولية المعترف بها للذكاء الاصطناعي الآمن والمسؤول، وأن نظام إدارة الذكاء الاصطناعي لدى IBM (AIMS) يفي بأعلى مستويات التدقيق. يمكن للمؤسسات الاعتماد على نماذج Granite 4.0 بثقة حتى في السياقات عالية المخاطر، مثل الصناعات الخاضعة لتنظيم صارم وبيئات النشر ذات المهام الحساسة.
مثل جميع نماذج Granite، تم تدريب نماذج Granite 4.0 بالكامل على بيانات تم اختيارها بعناية، والحصول عليها بطريقة أخلاقية، وموافقة للاستخدام المؤسسي. تعكس هذه الخطوة ثقتنا الكاملة في موثوقية نماذجنا، حيث توفِّر IBM تعويضًا غير محدود لأي مطالبات حقوق ملكية فكرية من أطراف ثالثة ضد المحتوى الذي تولِّده نماذج Granite عند استخدامه على IBM watsonx.ai.
وبالإضافة إلى اختباراتنا الداخلية المكثفة واختبارات الاختراق (Red-Teaming)، تعاونت IBM مؤخرًا مع HackerOne لإطلاق برنامج مكافآت الثغرات لنماذج Granite، مع تقديم مكافآت تصل إلى 100,000 دولار أمريكي مقابل تحديد أي ثغرات غير متوقعة أو أوضاع فشل أو نقاط ضعف قد تؤدي إلى كسر الحماية أو هجمات عدائية أخرى. ستُستخدم أي معلومات قيّمة يتم اكتشافها من قِبَل الباحثين المشاركين في برنامج مكافآت الثغرات لتوجيه التحسينات والتحديثات المستمرة لأمن نماذجنا، خاصةً من خلال توليد بيانات اصطناعية لتحسين مواءمة النموذج.
تركِّز IBM على سلامة وأمن نماذجنا نفسها، بالإضافة إلى سلسلة توزيع هذه النماذج. في هذا السياق، بدأت IBM بممارسة جديدة تتمثل في توقيع جميع نقاط تحقق نماذج Granite 4 بشكل تشفيري قبل الإصدار: تُرفق الآن جميع نقاط تحقق نماذج Granite بملف model.sig لتسهيل التحقق العام من مصدر النموذج وضمان سلامته وموثوقيته.
رغم مزاياها العديدة، تمتلك نماذج المحوِّل عيبًا أساسيًا: تزداد احتياجاتها الحاسوبية بشكل تربيعي مع طول التسلسل.إذا تضاعف طول السياق، فإن عدد العمليات الحسابية التي يجب على نموذج المحوِّل إجراؤها (وتخزينها في الذاكرة) يتضاعف أربع مرات. هذا "الاختناق التربيعي" يؤدي حتمًا إلى تباطؤ الأداء وزيادة التكلفة مع زيادة طول السياق. في أطوال السياق الطويلة، قد تستنفد هذه النماذج بسرعة سعة ذاكرة الوصول العشوائي (RAM) حتى على وحدات معالجة الرسومات الاستهلاكية عالية الأداء.
بينما تعتمد نماذج المحوِّل على الانتباه الذاتي، تستخدم Mamba آلية انتقائية مختلفة تمامًا وأكثر كفاءة بطبيعتها. تتزايد متطلبات Mamba الحاسوبية بشكل خطي مع طول التسلسل: عند مضاعفة طول السياق، يعمل Mamba فقط على مضاعفة الحسابات بشكل مزدوج، وليس بمضاعفتها أربع مرات. والأفضل من ذلك، أن متطلبات ذاكرة Mamba تظل ثابتة بغض النظر عن طول التسلسل.كلما زادت المهام الملقاة على نموذج Mamba، ظهرت مزاياه بشكل أكبر مقارنةً بالمحوِّلات.
ومع ذلك، لا تزال للمحوِّلات وميزة الانتباه الذاتي بعض الفوائد مقارنةً بنماذج Mamba وMamba-2، خاصةً في الأداء على المهام التي تتطلب التعلم في السياق (مثل المطالبة بخطوات قليلة). ولحسن الحظ، يجمع النموذج الهجين بين الاثنين ليقدّم أفضل ما في العالمين. للمزيد من الرؤى، راجِع لمحة سابقة عن Granite-4.0-Tiny-Preview.
تجمع البنية التي تشغِّل Granite 4.0-H-Micro وGranite 4.0-H-Tiny وGranite 4.0-H-Small بين طبقات Mamba-2 وكتل المحوِّلات التقليدية بشكل متسلسل بنسبة 1:9. في الأساس، تعمل كتل Mamba-2 على معالجة السياق العام بكفاءة، ونقل هذه المعلومات السياقية دوريًا عبر كتلة المحوِّل التي توفِّر تحليلًا أكثر تفصيلًا للسياق المحلي باستخدام الانتباه الذاتي قبل تمريرها إلى المجموعة التالية من طبقات Mamba-2.
تجدر الإشارة إلى أن معظم البنية التحتية التي تخدم النماذج اللغوية الكبيرة في العالم كانت مصممة تاريخيًا لنماذج المحوِّلات فقط. بعد الإطلاق التجريبي لنموذج Granite 4.0-Tiny-Preview في وقت سابق من هذا العام، تعاونّا بشكل واسع مع شركاء المنظومة لإرساء الدعم لبنية Granite 4 الهجينة في أطر عمل الاستدلال بما في ذلك vLLM وllama.cpp وNexaML وMLX استعدادًا لإصدار اليوم.
يعمل كلٌّ من Granite-4.0-H-Tiny وGranite-4.0-H-Small على تمرير ناتج كلٍّ من كتل Mamba-2 وTransformer إلى كتلة نهج مزيج الخبراء (MoE) الدقيقة، والتي طرأت على مواصفاتها بعض التغييرات منذ إصدار Granite 4.0-Tiny-Preview. بينما كانت وحدات MoE الدقيقة مجالًا للبحث النشط في IBM منذ إصدار Granite 3.0 في 2024، يُعَد Tiny وSmall أول نماذج MoE لدينا التي تستخدم خبراء مشتركين يتم تفعيلهم دائمًا، ما يحسِّن كفاءة المعاملات ويسمح للخبراء الآخرين بتطوير معرفة متخصصة بشكل أفضل.
يستخدم Granite 4.0-H-Micro طبقات تغذية أمامية كثيفة تقليدية بدلًا من كتل MoE، لكنه يحاكي البنية نفسها المشتركة بين Tiny وSmall.
أحد الجوانب الأكثر إثارة للاهتمام في النماذج اللغوية المعتمدة على نموذج الحالة المكانية (SSM) مثل Mamba هو قدرتها النظرية على التعامل مع تسلسلات ذات طول لا نهائي. تم تدريب جميع نماذج Granite 4.0 على عينات بيانات تصل إلى طول سياق يبلغ 512 ألف رمز مميز. تم التحقق من الأداء على مهام تتضمن طول سياق يصل إلى 128 ألف رمز مميز، لكن نظريًا يمكن أن يمتد طول السياق إلى أكثر من ذلك.
في نماذج المحوِّلات القياسية، يقتصر الحد الأقصى لنافذة السياق بشكل أساسي على قيود التشفير الموضعي. نظرًا لأن آلية الانتباه في المحوِّلات تعالج جميع الرموز المميزة دفعة واحدة، فإنها لا تحتفظ بأي معلومات حول ترتيب الرموز المميزة. يضيف التشفير الموضعي (PE) هذه المعلومات مرة أخرى. تشير بعض الدراسات إلى أن النماذج التي تستخدم تقنيات الترميز الموضعي الشائعة مثل Rotary Positional Encoding (RoPE) تواجه صعوبةً مع التسلسلات الأطول من تلك التي تدرَّبت عليها.2
لا تستخدم بنية Granite 4.0-H أي تشفير موضعي (NoPE). فقد وجدنا، ببساطة أنها لا تحتاج إليه: فنماذج Mamba بطبيعتها تحافظ على معلومات حول ترتيب الرموز المميزة؛ لأنها "تقرأ" الرموز بالتسلسل.
يتم تدريب جميع نماذج Granite 4.0، باختلاف بنيتها، على عينات مأخوذة من مجموعة البيانات نفسها التي تم تجميعها بعناية والتي تحتوي على 22 تريليون رمز مميز من بيانات التدريب الخاصة بالمؤسسات، بالإضافة إلى نفس منهجيات ما قبل التدريب المحسَّنة ونظام ما بعد التدريب وقالب الدردشة نفسه.
تم تدريب Granite 4.0 مسبقًا على مجموعة واسعة من العينات المنسَّقة بعناية من مصادر مثل DataComp-LM (DCLM) وGneissWeb وTxT360 وويكيبيديا ومصادر أخرى ذات صلة بالمؤسسات. خضعت النماذج أيضًا لمرحلة ما بعد التدريب لتعزيز أدائها في مهام المؤسسات، مستفيدةً من كلٍّ من مجموعات البيانات الاصطناعية والمفتوحة عبر مجالات تشمل اللغة والبرمجة والرياضيات والتفكير المنطقي وتعدُّد اللغات والسلامة واستدعاء الأدوات والتوليد المعزز بالاسترجاع (RAG) والأمن الإلكتروني. تم إعداد جميع مجموعات بيانات التدريب باستخدام إطار العمل مفتوح المصدر Data Prep Kit.
من أبرز الاختلافات عن أجيال Granite السابقة هو قرارنا بتقسيم نماذج Granite 4.0 بعد التدريب إلى نسخ مضبوطة على التعليمات (صدرت اليوم) ونسخ مخصصة للاستدلال (ستصدر لاحقًا هذا الخريف). تأكيدًا لنتائج الأبحاث الحديثة في الصناعة، وجدنا أثناء التدريب أن فصل النموذجين أدى إلى أداء أفضل في اتباع التعليمات لنماذج Instruct وأداء أفضل في الاستدلال المعقد لنماذج Thinking. ويضيف هذا ميزة أخرى تتمثل في تبسيط قوالب الدردشة لكلتا النسختين.
في وقت لاحق من هذا الخريف، ستنضم إلى نسخ Base وInstruct من نماذج Granite 4.0 نسخ "Thinking" المقابلة لها، والتي لا يزال يتم تدريبها لاحقًا لتحسين أدائها في المهام المنطقية المعقدة.
بحلول نهاية العام، نخطط أيضًا لإصدار أحجام إضافية من النماذج، بما في ذلك Granite 4.0 Medium، وأيضًا Granite 4.0 Nano، وهي مجموعة من النماذج الأصغر بكثير المصممة، من بين أمور أخرى، لتشغيل الاستدلال على أجهزة الحافة.
تتوفر الآن نماذج Granite 4.0 عبر مجموعة واسعة من مزوّدي المنصات وأطر عمل الاستدلال، سواء كنماذج مستقلة سريعة وفعَّالة أم كعناصر أساسية في سير العمل الجماعي جنبًا إلى جنب مع النماذج الكبيرة الرائدة. يمكنك أيضًا تجربتها على Granite Playground.
توفِّر بنية Granite Hybrid الجديدة دعمًا كاملًا ومحسَّنًا في vLLM 0.10.2 وHugging Face Transformers. تحظى بنية Granite Hybrid أيضًا بالدعم في llama.cpp وMLX، رغم أن العمل على تحسين الأداء بالكامل في بيئات التشغيل هذه لا يزال مستمرًا. نشكر شركاءَنا في المنظومة على تعاونهم، ونأمل أن يساهم عملنا في تسهيل المزيد من التجارب مع النماذج الهجينة.
تتوفر نماذج Granite 4.0 Instruct الآن في IBM watsonx.ai، استوديو تطوير الذكاء الاصطناعي المتكامل من IBM لتسهيل نشر الذكاء الاصطناعي بشكل بسيط وقابل للتوسع. تتوفر نماذج Granite 4.0 Instruct أيضًا عبر شركاء المنصة، بما في ذلك -حسب الترتيب الأبجدي- Dell Technologies (على Dell Pro AI Studio وDell Enterprise Hub) وDocker Hub وHugging Face وKaggle وLM Studio وNVIDIA NIM وOllama وOPAQUE وReplicate. تتوفر نماذج Granite 4.0 Base عبر Hugging Face.
يتم دعم نماذج Granite 4.0 أيضًا في Unsloth لتسهيل التخصيص السريع والفعَّال من حيث الذاكرة، ويمكن استخدامها في Continue لتشغيل مساعدين مخصصين للبرمجة بالذكاء الاصطناعي.
يمكن أن تساعدك الأدلة والوصفات في Granite Docs على البدء، ويشمل ذلك البرامج التعليمية المفيدة مثل:
