يمثِّل إطلاق Granite 4.0 بداية عصر جديد لعائلة النماذج اللغوية الكبيرة الجاهزة للمؤسسات من IBM، مستفيدة من ابتكارات معمارية جديدة لمضاعفة التركيز على النماذج الصغيرة والفعَّالة التي توفِّر أداءً تنافسيًا بتكاليف وزمن انتقال أقل. تم تطوير نماذج Granite 4.0 مع التركيز بشكل خاص على المهام الأساسية لمهام سير عمل الوكلاء، سواء في عمليات النشر المستقلة أم باعتبارها مكونات أساسية منخفضة التكلفة ضمن الأنظمة المعقدة إلى جانب نماذج الاستدلال الكبرى.

تتضمن مجموعة Granite 4.0 أحجامًا متعددة من النماذج وأنماط بنية متنوعة لتوفير أداء مثالي عبر نطاق واسع من قيود الأجهزة، بما في ذلك:

Granite-4.0-H-Small : نموذج هجين يعتمد على نهج مزيج الخبراء (MoE) يضم 32 مليار مَعلمة إجمالًا، منها 9 مليارات نشطة.

: نموذج هجين يعتمد على نهج مزيج الخبراء (MoE) يضم 32 مليار مَعلمة إجمالًا، منها 9 مليارات نشطة. Granite-4.0-H-Tiny : نموذج هجين يعتمد على نهج مزيج الخبراء (MoE) يضم 7 مليارات مَعلمة إجمالًا، منها مليار واحدة نشطة.

: نموذج هجين يعتمد على نهج مزيج الخبراء (MoE) يضم 7 مليارات مَعلمة إجمالًا، منها مليار واحدة نشطة. Granite-4.0-H-Micro : نموذج هجين كثيف يحتوي على 3 مليارات معلمة.

: نموذج هجين كثيف يحتوي على 3 مليارات معلمة. يتضمن هذا الإصدار أيضًا Granite-4.0-Micro، وهو نموذج كثيف يحتوي على 3 مليارات مَعلمة ويعتمد على بنية المحوِّل التقليدية القائمة على آلية الانتباه، ليتناسب مع المنصات والمجتمعات التي لا تدعم البنى الهجينة حتى الآن.

يُعَد Granite 4.0-H Small نموذجًا قويًا وفعَّالًا من حيث التكلفة، مخصصًا لتشغيل مهام سير العمل المؤسسية مثل الوكلاء متعددي الأدوات وأتمتة دعم العملاء. تم تصميم نماذج Tiny وMicro لتوفير زمن انتقال منخفض، ودعم تطبيقات الحافة والأجهزة المحلية، كما يمكن استخدامها كوحدات بناء أساسية ضمن مهام سير عمل الوكلاء الكبرى لتنفيذ المهام الرئيسية بسرعة، مثل استدعاء الوظائف.

تُظهر نتائج اختبارات الأداء لنماذج Granite 4.0 تحسينات كبيرة مقارنةً بالأجيال السابقة -إذ تتفوق حتى أصغر نماذج Granite 4.0 بشكل ملحوظ على نموذج Granite 3.3 8B رغم أن حجمها يقل عن نصفه- لكن أبرز ما يميزها هو الزيادة اللافتة في كفاءة الاستدلال. مقارنةً بالنماذج اللغوية الكبيرة التقليدية، تتطلب نماذج Granite 4.0 الهجينة قدرًا أقل بكثير من ذاكرة الوصول العشوائي (RAM) للتشغيل، خاصةً في المهام التي تتضمن أطوال سياق طويلة (مثل معالجة قواعد تعليمات برمجية كبيرة أو وثائق موسَّعة)، أو عند تشغيل جلسات متعددة في الوقت نفسه (مثل وكيل خدمة العملاء الذي يتعامل مع العديد من استفسارات المستخدمين التفصيلية في آن واحد).

والأهم من ذلك، أن هذا الانخفاض الكبير في متطلبات الذاكرة لدى Granite 4.0 يؤدي إلى انخفاض مماثل في تكلفة الأجهزة المطلوبة لتشغيل أعباء العمل الكثيفة بسرعات استدلال عالية. هدفنا هو تقليل العوائق أمام الدخول من خلال إتاحة وصول المؤسسات والمطورين في عالم المصادر المفتوحة إلى نماذج لغوية كبيرة ذات قدرة تنافسية عالية بتكلفة فعَّالة.