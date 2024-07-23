في يوم الثلاثاء 23 يوليو، أعلنت Meta عن إطلاق مجموعة Llama 3.1 من النماذج اللغوية الكبيرة متعدِّدة اللغات (LLMs). وتضم مجموعة Llama 3.1 نماذج ذكاء اصطناعي توليدي مفتوحة المصدر لإدخال/إخراج النصوص، مدرَّبة مسبقًا ومضبوطة وفق التعليمات، بأحجام 8B و70B ولأول مرة بعدد مَعْلمات يصل إلى 405B.
يُعد نموذج Llama 3.1-405B المضبوط وفق التعليمات أكبر وأقوى نموذج لغوي مفتوح المصدر متاح حاليًا، ومنافسًا لأفضل النماذج المملوكة في السوق، وسيكون متاحًا على IBM watsonx.ai بدءًا من اليوم، حيث يمكن نشره على IBM Cloud، أو في بيئة سحابة هجينة، أو محليًا داخل مراكز البيانات.
ويأتي طرح Llama 3.1 استكمالًا لإطلاق نماذج Llama 3 في 18 أبريل. وفي بيان الإطلاق، أوضحت Meta أن “هدفنا في المستقبل القريب هو أن يصبح Llama 3 متعدد اللغات ومتعدد الوسائط، وأن يدعم سياقات أطول، وأن نواصل تحسين الأداء العام في قدرات النماذج اللغوية الكبيرة مثل الاستدلال والبرمجة.”
ويُظهِر إطلاق Llama 3.1 اليوم تقدّمًا ملموسًا نحو هذا الهدف، بدءًا من الزيادة الكبيرة في طول السياق، مرورًا بتوسيع قدرات استخدام الأدوات، ووصولًا إلى تعزيز القدرات متعدِّدة اللغات.
في ديسمبر 2023، أطلقت Meta وIBM تحالف الذكاء الاصطناعي (AI Alliance) بالتعاون مع أكثر من 50 عضوًا مؤسِّسًا وشريكًا من مختلف أنحاء العالم. ويجمع تحالف الذكاء الاصطناعي مؤسسات رائدة من قطاعات الصناعة والشركات الناشئة والأوساط الأكاديمية ومجتمع البحث والجهات الحكومية، ويطمح إلى توجيه مسار تطوّر الذكاء الاصطناعي بما يعكس احتياجات مجتمعاتنا وتعقيداتها بأفضل صورة ممكنة. ومنذ تأسيسه، توسّع التحالف ليضمّ أكثر من 100 عضو.
وعلى نحو أكثر تحديدًا، يكرّس تحالف الذكاء الاصطناعي جهوده لبناء مجتمع مفتوح يمكّن المطوّرين والباحثين من تسريع الابتكار المسؤول، مع ترسيخ الثقة والسلامة والأمن، واحترام التنوّع، والحفاظ على الدقّة العلمية، وتعزيز القدرة التنافسية الاقتصادية. ومن هذا المنطلق، يدعم التحالف مشروعات تعمل على تطوير ونشر المقاييس المعيارية ومعايير التقييم، وتساعد في معالجة التحديات على مستوى المجتمع ككل، وتدعم تنمية مهارات الذكاء الاصطناعي عالميًا، وتشجّع تطوير حلول الذكاء الاصطناعي بصورة مفتوحة وآمنة ومفيدة.
ويسهم Llama 3.1 في تعزيز هذه الرسالة من خلال إتاحة عائلة نماذج متطورة مفتوحة المصدر، إلى جانب نظام بنائي للتطوير لمجتمع الذكاء الاصطناعي العالمي، يتيح لهم بناء الأفكار الجديدة وتجربتها وتوسيع نطاقها بمسؤولية. وإلى جانب النماذج الجديدة القوية، يتضمّن هذا الإصدار تدابير أمان متينة على مستوى النظام، وآليات جديدة لتقييم الأمن الإلكتروني، وضوابط محدثة تُطبَّق أثناء وقت الاستدلال. وتدفع هذه الموارد مجتمعةً نحو توحيد المعايير في تطوير واستخدام أدوات الثقة والسلامة الخاصة بالذكاء الاصطناعي التوليدي.
جرى التطرّق في إعلان Llama 3 الصادر في أبريل إلى النماذج القادمة التي تضم "أكثر من 400 مليار مُعلمة"، مع عرض بعض التقييمات الأولية للأداء، لكن الحجم الدقيق وتفاصيل هذه النماذج لم يُكشَف عنهما إلا مع إطلاق اليوم. ورغم أن Llama 3.1 يقدّم تحسينات كبيرة عبر جميع أحجام النماذج، فإن نموذج 405B الجديد مفتوح المصدر يحقق مستوى غير مسبوق من التكافؤ مع النماذج اللغوية الكبيرة (LLMs) المغلقة المصدر والرائدة في السوق.
وتقدّم الأرقام المحدّثة التي أعلنتها Meta اليوم صورة متكاملة عن المكانة التنافسية التي يحتلها نموذج 405B مقارنة بأحدث النماذج المتوفرة. وفيما يلي مقارنة أدائه مع أبرز النماذج اللغوية الكبيرة عبر مجموعة من المقاييس المعيارية الشائعة:[1]
وعند مقارنة نموذج 405B بأحدث النماذج المنافسة، لا ينبغي الاكتفاء بالنظر إلى مؤشرات الأداء المعيارية وحدها. فعلى عكس النماذج المغلقة المصدر التي لا يُتاح استخدامها إلا عبر واجهة برمجة تطبيقات (API) يمكن أن يتغيّر خلفها النموذج الأساسي من دون إشعار، يُعد Llama 3.1-405B منصة مستقرة يمكن البناء عليها، وتعديلها، بل وتشغيلها محليًا داخل بيئة المؤسسة. وهذا المستوى من التحكم وإمكانية التنبؤ يمثّل قيمة كبيرة للباحثين والمؤسسات وغيرها من الجهات التي تُولي أهمية لاستقرار الأداء وقابليّة تكرار النتائج.
تؤمن IBM، شأنها شأن Meta، بأن إتاحة نماذج مفتوحة قابلة للاستخدام العملي تساعد على تطوير منتجات أفضل وأكثر أمانًا، وتسارع وتيرة الابتكار، وتُسهم في بناء سوق ذكاء اصطناعي أكثر توازنًا وصحةً على المدى البعيد. ويقدّم نموذج مفتوح المصدر بهذا الحجم والتعقيد، بعدد 405 مليارات معلمة، فرصًا وحالات استخدام نوعية لمؤسسات بمختلف الأحجام.
وبخلاف استخدام النموذج مباشرةً في الاستدلال وتوليد النصوص — وهو استخدام قد يتطلّب، بحكم حجمه والمتطلبات الحوسبية المرتبطة به، أساليب مثل التكميم أو غيرها من تقنيات التحسين لتشغيله محليًا على معظم بيئات الأجهزة — يمكن توظيف نموذج 405B في ما يلي:
ولضمان انطلاقة ناجحة مع نماذج Llama 3.1، "توصي" Meta AI "بشدة" باستخدام منصة تُقدِّم — على غرار IBM watsonx — مجموعة من القدرات الأساسية مثل تقييم النماذج، وضوابط الأمان، وميزة التوليد المعزز بالاسترجاع (RAG).
قد يكون نموذج 405B الذي طال انتظاره أبرز ما لفت الأنظار في إصدار Llama 3.1، لكنه بالتأكيد ليس الميزة الوحيدة الجديرة بالذكر. فعلى الرغم من أن نماذج Llama 3.1 تشترك مع Llama 3 في بنية المحوِّل الكثيفة نفسها، فإنها تقدِّم في الوقت ذاته مجموعة من التحسينات الجوهرية على نظرائها من Llama 3 في جميع أحجام النماذج.
وفي جميع نماذج Llama 3.1 المدرَّبة مسبقًا والمضبوطة وفق التعليمات، جرى توسيع طول السياق بشكل كبير؛ إذ ارتفع من 8,192 رمزًا مميزًا في Llama 3 إلى 128,000 رمز مميز في Llama 3.1 — أي زيادة هائلة تبلغ نحو 1600%. وبذلك يصبح طول سياق Llama 3.1 مماثلًا لطول السياق في نسخة GPT-4o الموجَّهة لعملاء المؤسسات، وأكبر بدرجة ملحوظة من طول السياق في GPT-4 (أو نسخة GPT-4o المتاحة في ChatGPT Free)، وقريبًا من نافذة السياق التي تصل إلى 200,000 رمز مميز في Claude 3. وبما أن Llama 3.1 يمكن نشره على بنية المستخدم التقنية، سواء على أجهزته أو عبر مزوّد السحابة الذي يختاره، فإن طول السياق فيه لا يتعرّض عادةً لخفض مؤقت خلال فترات ارتفاع الطلب. وبالمثل، لا يخضع Llama 3.1 — في العموم — لقيود صارمة واسعة النطاق على حجم الاستخدام.
ويُقصَد بطول سياق النموذج — أو ما يُعرَف أيضًا بنافذة السياق — إجمالي كمية النص (مقاسةً بعدد الرموز المميزة) التي يستطيع النموذج اللغوي الكبير التعامل معها أو "تذكُّرها" في لحظة واحدة. عندما تتجاوز محادثة أو مستند أو قاعدة تعليمات برمجية الحد الأقصى لنافذة السياق في النموذج، لا بد من اختصار المحتوى أو تلخيصه حتى يتمكّن النموذج من المتابعة. وبفضل نافذة السياق الموسَّعة في Llama 3.1، يمكن لنماذج Llama الآن إدارة محادثات أطول بكثير من دون فقدان التفاصيل، واستيعاب مستندات أو عينات تعليمات برمجية أكبر حجمًا أثناء التدريب والاستدلال.
ورغم أنه لا يوجد سعر تحويل ثابت بين الكلمات والرموز المميزة، يمكن اعتماد تقدير تقريبي يساوي نحو 1.5 رمز مميز لكل كلمة. وبناءً على ذلك، فإن نافذة السياق التي تبلغ 128,000 رمز مميز في Llama 3.1 تعادل تقريبًا ما يقارب 85,000 كلمة. يُعَد Tokenizer Playground على منصة Hugging Face وسيلة سهلة لفهم وتجربة كيفية ترميز مدخلات النصوص في النماذج المختلفة.
وتواصل نماذج Llama 3.1 الاستفادة من أداة الترميز الجديدة (tokenizer) التي قُدِّمت مع Llama 3، والتي تُشفِّر اللغة بكفاءة أعلى بكثير مقارنةً بما كان عليه الحال في Llama 2.
وانسجامًا مع نهجها المسؤول في الابتكار، اتّبعت Meta أسلوبًا حذرًا ومدروسًا في التعامل مع مسألة توسيع طول السياق. وجدير بالذكر أن محاولات تجريبية سابقة في مجتمع المصدر المفتوح أسفرت عن نُسَخ مشتقّة من Llama ذات نوافذ سياق تصل إلى 128,000 رمز مميز، بل وحتى إلى مليون رمز مميز. وعلى الرغم من أن هذه المشاريع تمثّل مثالًا واضحًا على فوائد التزام Meta بالنماذج المفتوحة، فإن التعامل معها يتطلّب قدرًا من الحذر؛ إذ تشير أبحاث حديثة إلى أن نوافذ السياق الطويلة جدًا "تفتح سطح تعرُّض جديدًا وواسعًا للهجمات على نماذج اللغة الكبيرة (LLMs)" إذا لم يصاحبها إجراءات مضادة صارمة.
ولحسن الحظ، يتضمّن إصدار Llama 3.1 أيضًا مجموعة جديدة من ضوابط الحماية أثناء وقت الاستدلال. فإلى جانب الإصدارات المحدَّثة من Llama Guard وCyberSec Eval، يقدّم هذا الإصدار أداة Prompt Guard، التي توفّر تصفية لهجمات حَقْن الموجِّهات (Prompt Injections) سواء كانت مباشرة أو غير مباشرة. كما تعزِّز Meta تدابير الحد من المخاطر عبر أداة CodeShield، وهي أداة قوية لتصفية المخرجات أثناء وقت الاستدلال، صُمِّمت خصيصًا لمنع إدخال تعليمات برمجية غير آمنة — تُولِّدها نماذج اللغة الكبيرة — إلى أنظمة الإنتاج.
وكما هو الحال مع أي تطبيق للذكاء الاصطناعي التوليدي، من الحكمة دائمًا نشر النماذج على منصة تتمتّع بتدابير قوية للأمن والخصوصية والسلامة.
وأصبح كلٌّ من نماذج Llama 3.1 المدرَّبة مسبقًا والمضبوطة وفق التعليمات، بمختلف أحجامها، يدعم العمل بعدّة لغات. فإلى جانب الإنجليزية، تستطيع نماذج Llama 3.1 التفاعل بطلاقة مع لغات أخرى، من بينها الإسبانية والبرتغالية والإيطالية والألمانية والتايلاندية. وأوضحت Meta أن "بعض اللغات الأخرى" لا تزال في مرحلة التحقق بعد التدريب، ومن المتوقَّع إتاحتها في إصدارات لاحقة.
وقد جرى ضبط نماذج Llama 3.1 Instruct بدقة لاستخدام "الأدوات"، أي تحسين قدرتها على التكامل مع برامج وأدوات معيّنة تُكمِّل قدرات النموذج اللغوي الكبير أو توسِّعها. ويتضمَّن ذلك تدريب النموذج على إنشاء استدعاءات للأدوات الخاصة بالبحث، وتوليد الصور، وتنفيذ التعليمات البرمجية، وأدوات الاستدلال الرياضي، إلى جانب دعم استخدام الأدوات بأسلوب zero-shot المرتبط بالتعلّم بدون عينات؛ أي القدرة على الاندماج بسلاسة مع أدوات لم تظهر للنموذج أثناء مرحلة التدريب.
يمثّل هذا الإصدار الأخير من Meta فرصة استثنائية لضبط نماذج ذكاء اصطناعي توليدي متقدِّمة وتخصيصها بدقة بما يلائم حالة الاستخدام الخاصة بك.
ويأتي دعم Llama 3.1 ضمن التزام IBM بدفع الابتكار مفتوح المصدر في مجال الذكاء الاصطناعي، وتوفير إمكانية وصول عملائنا إلى أفضل النماذج مفتوحة المصدر على منصة watsonx، بما في ذلك نماذج الطرف الثالث وعائلة نماذج IBM Granite.
وتتيح منصة IBM watsonx للعملاء تخصيص تنفيذ النماذج مفتوحة المصدر مثل Llama 3.1 بالشكل الذي يناسب احتياجاتهم تمامًا؛ سواء من خلال مرونة نشر النماذج محليًا داخل بنية المؤسسة أو في بيئتهم السحابية المفضَّلة، أو عبر مهام سير عمل بديهية لعمليات الضبط الدقيق، وهندسة الموجِّهات، والتكامل مع تطبيقات المؤسسة. تمكّن من بناء تطبيقات الذكاء الاصطناعي المخصصة لعملك بسهولة، وإدارة جميع مصادر البيانات، وتسريع سير عمل الذكاء الاصطناعي المسؤول — وكل ذلك من خلال منصة واحدة.
سيتوفر نموذج Llama 3.1-405B اليوم على IBM watsonx.ai، على أن تلحق به قريبًا نماذج 8B و70B.
