مستطيلات تجريدية ثلاثية الأبعاد

قائمة بالنماذج اللغوية الكبيرة (LLMs)

قائمة النماذج اللغوية الكبيرة (LLMs)

أصبحت النماذج اللغوية الكبيرة (LLMs) الركيزة الأساسية في تطور الذكاء الاصطناعي الحديث. فقد أطلقت هذه النماذج عصر الذكاء الاصطناعي التوليدي، وهي اليوم التي ترسم ملامحه، بدءًا من تطبيقات روبوت المحادثة البسيطة وصولًا إلى الهندسة القائمة على الوكلاء وغيرها من مهام سير العمل المؤتمتة المعقدة التي يقودها وكلاء الذكاء الاصطناعي. وقد شكّل ظهورها نقطة تحول جوهرية في تاريخ التعلم الآلي.

ومع نضج هذه التقنية، يواصل عدد النماذج اللغوية الكبيرة (LLMs) الجديدة التزايد. ويواصل كبار مطوري الذكاء الاصطناعي، والشركات الناشئة الجديدة، والمؤسسات الراسخة ذات الحضور القوي، إطلاق نماذج جديدة وتحسينها باستمرار. وفي الوقت نفسه، يواصل مجتمع المصدر المفتوح ضبط النماذج اللغوية الكبيرة (LLMs) مفتوحة المصدر باستمرار، من خلال دمج النماذج الحالية وتعديلها بالاستناد إلى مجموعات بيانات مخصصة لإنتاج عدد لا حصر له من المتغيرات. لذلك، لا يمكن لأي قائمة للنماذج اللغوية الكبيرة (LLMs) أن تدّعي على نحو معقول أنها شاملة، وحتى القائمة "الأكثر شمولًا" لن تبقى كذلك طويلًا.

وفيما يلي قائمة ببعض أبرز النماذج اللغوية الكبيرة (LLMs) المتاحة اليوم وأفضلها أداءً. وفيما يلي بعض الملاحظات:

  • وتعطي هذه القائمة الأولوية للنماذج التي يواصل مطوروها دعمها وتحديثها بفاعلية، وتحافظ، في الحد الأدنى، على مستوى أداء تنافسي. ولذلك، فهي تستبعد عددًا من نماذج الأساس ذات التأثير التاريخي، مثل T5 من Google وGPT-3 من OpenAI وLlama 2 من Meta، مع أن بعض هذه النماذج لا يزال مستخدمًا في الأغراض البحثية.

لأغراض عملية، يمكن عمومًا تقسيم النماذج اللغوية الكبيرة (LLMs) إلى فئتين: نماذج مغلقة المصدر لا تتاح إلا بوصفها عروضًا تجارية من مطور النموذج، ونماذج مفتوحة تُتاح بحرية ومن دون مقابل.

تصميم ثلاثي الأبعاد لكرات تتدحرج على مسار

أحدث الأخبار والرؤى حول الذكاء الاصطناعي 


تتوفر معارف وأخبار منسقة بمهارة حول الذكاء الاصطناعي والسحابة وغيرها في نشرة Think الإخبارية الأسبوعية. 

النماذج اللغوية الكبيرة مغلقة المصدر

ولا يمكن الوصول إلى النموذج مغلق المصدر، أو النموذج المملوك، إلا مباشرةً عبر منصة مطور النموذج، أو عبر منصات أخرى منحها المطور ترخيصًا لاستخدام نموذجه، أو من خلال واجهة برمجة التطبيقات المملوكة لمزود النموذج.

ولأن مطوري النماذج المغلقة يتعاملون عادةً مع تفاصيلها التقنية بوصفها أسرارًا تجارية شديدة التحفّظ، فمن المتعذر عادةً معرفة حجم النموذج المغلق أو بنية الشبكة العصبية أو عملية التدريب على وجه اليقين. ويمكن استنتاج بعض التفاصيل، على سبيل المثال، من خلال مقارنة سرعة الاستدلال في نموذج مغلق، واستخدامه لذاكرة وحدات معالجة الرسوميات، وأدائه في الاختبارات المعيارية، بما يقابل ذلك في النماذج المفتوحة التي تُفصح علنًا عن تفاصيلها، لكن نادرًا ما يُؤكَّد هذا الاستنتاج، إن حدث أصلًا.

ومنذ نحو عام 2022 على الأقل، كانت معظم النماذج الرائدة الأحدث في أي وقت نماذج مغلقة، لكن هذا يعكس إلى حد كبير الظروف التاريخية الفعلية التي تشكّلت فيها هذه الصناعة، لا أي تفوق متأصل للنماذج المغلقة على النماذج المفتوحة. وفيما يلي بعض أبرز سلاسل النماذج المغلقة، مرتبةً أبجديًا.

Claude (Anthropic)

تُعد نماذج Claude اللغوية من Anthropic من بين الأعلى أداءً في العالم. وقد تأسست Anthropic أصلًا في عام 2021 بوصفها مختبرًا بحثيًا معنيًا بسلامة الذكاء الاصطناعي، على يد موظفين سابقين في OpenAI، ويقوم نهجها في تطوير النماذج على مفهوم فريد هو Constitutional AI. أما "Constitution" الخاص بنموذج Claude فهو وثيقة لا يقتصر دورها على توجيه سلوك موظفي Anthropic، بل يوجّه أيضًا سلوك نماذج Claude نفسها، بما في ذلك إنشاء بيانات تدريب اصطناعية.

منذ Claude 3 ، قدمت الأجيال المتعاقبة من Claude نماذج متعددة الوسائط بثلاثة أحجام مختلفة:

  • تُعد نماذج Claude Haiku أصغر نماذج Anthropic، وقد صُممت لتحقيق السرعة والكفاءة من حيث التكلفة. وعلى خلاف Sonnet وOpus، لا تُعد نماذج Haiku نماذج استدلالية؛ فما لم يُطلب منها ذلك صراحةً، فإنها لا تُظهر مسارات الاستدلال الخاصة بسلسلة التفكير (CoT).
  • وتُمثل نماذج Claude Sonnet الفئة متوسطة الحجم لدى Anthropic، وهي موجّهة إلى ما تراه الشركة التوازن الأمثل بين الأداء والكفاءة في معظم حالات الاستخدام. ويُعد كل من Sonnet وOpus نموذجين هجينين للاستدلال، ما يعني أنه يمكن تهيئتهما لتنفيذ الاستدلال القياسي أو استدلال سلسلة التفكير (CoT) التكيفي لحل المشكلات المعقدة متعددة الخطوات.
  • أما نماذج Claude Opus فهي أكبر نماذج Anthropic وأقواها، وقد صُممت لتقديم أداء رائد في المهام الصعبة.

ويمكن لكل من Claude Haiku وSonnet وOpus معالجة مدخلات النصوص والصوت والصور، وإخراج نصوص أو صوت على هيئة تحويل النص إلى كلام. وتاريخيًا، وعلى خلاف معظم منافسيها من النماذج المغلقة، لم تكن هذه النماذج، ولا منصة Claude التي تعتمد عليها، قادرة على توليد الصور، لكن اعتبارًا من 12 مارس 2026 أصبح Claude قادرًا على توليد الصور. وعند الوصول إلى هذه النماذج عبر واجهة برمجة تطبيقات Claude، يمكن للمستخدمين ضبط "مستوى الجهد" في عملية الاستدلال لدى Sonnet أو Opus على "أقصى مستوى" (max) أو "مستوى مرتفع" (high) أو "مستوى متوسط" (medium) أو "مستوى منخفض" (low) أو "مستوى تكيُّفي" (adaptive).

Gemini (Google)

أما Gemini فهي سلسلة النماذج اللغوية المغلقة من Google، وقد طورتها شركتها التابعة Google DeepMind، وأُطلقت لأول مرة في ديسمبر 2023. وتجدر الإشارة إلى أن Google Brain، التي اندمجت مع DeepMind لتشكيل Google DeepMind في عام 2023، هي الجهة المسؤولة عن ابتكار بنية نموذج المحوّل (transformer) التي أتاحت ظهور أول النماذج اللغوية الكبيرة (LLMs)، وذلك بعد نشر الورقة البحثية المحورية "Attention is All You Need" في عام 2017.

ومنذ مطلع عام 2025، أطلقت Google كل جيل من نماذج Gemini بثلاثة أحجام مختلفة، وجميعها نماذج استدلالية. عند الوصول إلى هذه النماذج عبر واجهة برمجة تطبيقات Gemini، يمكن للمستخدمين اختيار أحد "مستويات التفكير" المتعددة لتحديد مقدار الرموز المميزة والوقت اللذين سيقضيهما النموذج قبل توليد المخرجات النهائية.

  • تُعد نماذج Gemini Pro أكبر النماذج اللغوية الكبيرة من Google وأحدثها.

  • أما نماذج Gemini Flash، فقد صُممت، مقارنةً بنموذج Gemini Pro، لتحقيق سرعة أكبر.

  • وتُعد نماذج Gemini Flash-Lite نماذج سريعة وفعالة من حيث التكلفة، وقد صُممت للمهام كبيرة الحجم، مثل الترجمة واستخدام الأدوات القائم على الوكلاء.

وتتميز نماذج Gemini Pro وFlash وFlash-Lite بأنها متعددة الوسائط بطبيعتها، إذ يمكنها معالجة مدخلات النصوص والصوت والصور والفيديو، وتوليد مخرجات نصية. وعند الوصول إليها عبر منصة Gemini، يمكن توليد مخرجات متعددة الوسائط من خلال نماذج Gemini المنفصلة والمتخصصة لتوليد الصور أو الفيديو أو الموسيقى.

ومنذ إطلاق Gemini 2.5 Pro في مارس 2025، وهو الإصدار الذي حقق آنذاك أفضل أداء في القطاع عبر معظم المعايير الأكاديمية، أصبحت نماذج Gemini تنافس Claude وسلسلة GPT من OpenAI على صدارة النماذج اللغوية الكبيرة (LLMs) من حيث الأداء. وبوجه عام، تنتقل صفة النموذج "الأفضل" كلما طُرح نموذج رائد جديد ضمن إحدى هذه السلاسل الثلاث.

Grok (xAI)

أما Grok فهو سلسلة من النماذج اللغوية الكبيرة المملوكة طورتها xAI، وطرحتها لأول مرة في إصدار تجريبي على هيئة روبوت محادثة على X، المعروف سابقًا باسم Twitter، في نوفمبر 2023. وفي أبريل 2025، أتاحت xAI الوصول إلى Grok 3 عبر واجهة برمجة التطبيقات، وكان آنذاك أحدث نماذجها الرئيسية.

وواصلت تشكيلة نماذج Grok التغير عبر الأجيال المتعاقبة من الإصدارات.

  • وقد طُرح Grok 2 إلى جانب Grok 2 Mini، وهو أول إصدار في هذه السلسلة يعتمد على اختلاف الحجم. وتكرر هذا النهج نفسه مع Grok 3 في فبراير 2025.

  • أُطلق الجيل الرابع من نماذج Grok مع Grok 4 وGrok 4 Heavy في يوليو 2025. وفي خريف 2025، تلاهما Grok 4 Fast، ثم Grok 4.1، المتاح بخياري "Thinking" و"Non-thinking".

  • وفي أغسطس 2025، أصدرت xAI نموذج Grok Code Fast 1، وهو نموذج يركِّز على الكفاءة ومصمم للبرمجة القائمة على الوكلاء.

واعتبارًا من Grok 4، أصبحت نماذج Grok قادرة على معالجة مدخلات النصوص والصور والكلام. ومع أن النماذج اللغوية الكبيرة من Grok لا تستطيع تقديم مخرجات متعددة الوسائط، فإنه يمكن توليد مخرجات الصور والفيديو عبر نموذج Aurora من xAI من خلال منصة Grok Imagine.

وبصرف النظر عن أدائه بحد ذاته، ارتبط جانب كبير من تاريخ Grok، ولا سيما روبوت المحادثة Grok، بحالات من الجدل، مثل اتهامات بنشر معلومات مضللة عن الانتخابات، وإقحام وجهات نظر مستقطِبة في محادثات لا صلة لها بها، وترسيخ صور نمطية ضارة.

إصدارات مفتوحة المصدر

وقال Elon Musk، في تصريحات عامة: "نهجنا العام يقوم على أننا نجعل الإصدار الأخير مفتوح المصدر عندما يكون الإصدار التالي قد صدر بالكامل."1

وقد أتاحت xAI نموذج Grok 1 بوصفه نموذجًا مفتوح المصدر بموجب ترخيص Apache 2.0 في مارس 2024. ومع أن Grok 3 صدر في فبراير 2025، فإن الإصدار المفتوح المصدر التالي من أحد نماذج Grok لم يصدر إلا في أغسطس 2025. وعلى نحو يثير الالتباس، أعلنت xAI، ومعها Musk، أنها أتاحت "Grok 2.5" بوصفه نموذجًا مفتوح المصدر، 2 رغم أنه لم يكن قد أُعلن من قبل عن أي نموذج بهذا الاسم. بل إن بطاقة النموذج نفسها على Hugging Face تشير إليه باسم "Grok-2".

وفي ذلك الإعلان الصادر في أغسطس 2025، أشار Musk إلى أن Grok 3 سيُطرح هو الآخر بوصفه نموذجًا مفتوح المصدر "بعد نحو 6 أشهر". وبعد 8 أشهر، لم يُعلن بعد عن موعد طرح هذا الإصدار المفتوح المصدر.

GPT (OpenAI)

وتُنسب إلى سلسلة GPT من OpenAI، وهي اختصار لعبارة Generative Pretrained Transformer، إلى حد كبير بداية العصر الحالي للذكاء الاصطناعي التوليدي، ولا سيما بعد إطلاق ChatGPT في عام 2022 بالاعتماد على نموذج GPT-3.5.

لقد تغيّرت اتفاقيات OpenAI في تسمية النماذج ومتغيراتها تغيّرًا كبيرًا منذ عام 2022، وغالبًا على نحو يبعث على الالتباس. فعلى سبيل المثال، صدر GPT-4.1 بعد GPT-4.5، وكان نموذج الاستدلال o4 متاحًا في الوقت نفسه مع النموذج متعدد الوسائط غير الاستدلالي GPT-4o. وكان هذا النموذج مختلفًا تمامًا عن نموذج الاستدلال o4، كما أن أداءه كان أقل من أداء o3. وفي مطلع عام 2025، أقر Sam Altman، الرئيس التنفيذي لشركة OpenAI، قائلًا: "ندرك مدى التعقيد الذي وصلت إليه نماذجنا وعروض منتجاتنا."

ومنذ إصدار GPT-5 في أغسطس 2025، أصبحت العروض الموحدة للنماذج اللغوية الكبيرة لدى الشركة تشمل ما يلي:

  • يُعد GPT-5.x العرض الرئيسي للأغراض العامة من OpenAI. واعتبارًا من مارس 2026، يُعد GPT-5.4 أحدث إصدار من هذه النماذج.ومع أن جميع نماذج GPT-5 تُعد نماذج استدلالية، فإن GPT-5.4 يتوفر أيضًا في إصدار GPT-5.4 Pro، الذي "يستخدم قدرًا أكبر من الحوسبة للتفكير بمزيد من العمق وتقديم إجابات أفضل باستمرار."3 وتوفر OpenAI أيضًا GPT-5 Codex، وهو إصدار من GPT-5 خضع لضبط دقيق من أجل توليد التعليمات البرمجية القائم على الوكلاء على نحو أمثل، ويُحدَّث دوريًا تبعًا للإصدارات المحدَّثة من النموذج الأساسي.
  • ووفقًا للنظرات العامة التي تقدمها OpenAI عن نماذجها، يوفر GPT-5 mini "ذكاءً قريبًا من مستوى النماذج الرائدة لأحمال التشغيل الحساسة للتكلفة وذات زمن الانتقال القصير والحجم الكبير."
  • أما GPT-5 nano، فهو "أسرع إصدارات GPT-5 وأكثرها فعالية من حيث التكلفة."

كما أصدرت OpenAI نموذجين من نماذج GPT ذات الأوزان المفتوحة، وقد ورد شرحهما بالتفصيل في قسم "النماذج المفتوحة" من هذه المقالة.

Mistral AI

أما Mistral AI، وهي شركة مقرها فرنسا أسسها موظفون سابقون في Meta AI وGoogle DeepMind، فقد كرّست نفسها في البداية بالكامل للنماذج مفتوحة المصدر عند إطلاق أول نماذجها، Mistral 7B، في سبتمبر 2023. ومنذ ذلك الحين، انتقلت Mistral إلى نهج مختلط، إذ تتوفر إصدارات مفتوحة لكثير من نماذجها، في حين تظل بعض النماذج الرائدة مغلقة المصدر.

واعتبارًا من مارس 2026، تشمل النماذج اللغوية الكبيرة المملوكة والرائدة من Mistral AI ما يلي:

  • Mistral Medium 3.1، وهو نموذج متعدد الوسائط للأغراض العامة صدر في أغسطس 2025.

  • Codestral،وهو نموذج يركز على البرمجة "صُمم خصيصًا لإكمال ملء الفراغات عالية الدقة (FIM)" 4.

  • Magistral Medium 1.2، وهو نموذج استدلالي مكمل لنموذج Mistral Medium.

ويرد لاحقًا في هذه المقالة شرح عروض Mistral من النماذج ذات الأوزان المفتوحة.

أكاديمية الذكاء الاصطناعي

لماذا تعد نماذج الأساس نقلة نوعية في الذكاء الاصطناعي

تعرَّف على فئة جديدة من نماذج الذكاء الاصطناعي المرنة والقابلة لإعادة الاستخدام التي يمكن أن تفتح مصادر جديدة للإيرادات، وتُسهم في تقليل التكاليف، وزيادة الإنتاجية، ثم استخدم دليلنا لمعرفة المزيد من التفاصيل.

النماذج اللغوية الكبيرة مفتوحة المصدر

وفي التعلم الآلي، كثيرًا ما يُستخدم مصطلح المصدر المفتوح على نحو غير رسمي للإشارة إلى أدوات الذكاء الاصطناعي التي تُتاح تعليماتها البرمجية المصدرية مجانًا، لكن هذا المصطلح في الواقع توصيف رسمي تشرف عليه مبادرة المصدر المفتوح (Open Source Initiative). لا تُصادق مبادرة OSI على أي ترخيص باعتباره "معتمدًا من مبادرة المصدر المفتوح" إلا إذا رأت أن هذا الترخيص يفي بالمتطلبات العشرة الواردة في التعريف الرسمي للمصدر المفتوح (OSD).

ومعظم النماذج "مفتوحة المصدر" لا تستوفي جميع هذه المتطلبات. ولذلك، فإن مصطلح النموذج المفتوح، أو النموذج ذو الأوزان المفتوحة، يشير بدقة أكبر إلى أي نموذج لغوي كبير (LLM) يُوزَّع بحُرّية. ويشهد نطاق النماذج المفتوحة قدرًا كبيرًا من التفاوت. فالنموذج ذو الأوزان المفتوحة، من دون أن يكون مفتوح المصدر، يمكن استخدامه لتفعيل الاستدلال، بل ويمكن أيضًا ضبطه بدقة، لكن إذا لم تُوفَّر تعليماته البرمجية المصدرية كاملةً، فلن يكون ممكنًا تعديله بما يتجاوز تغيير قيم أوزانه من خلال الضبط الدقيق. وقد تحظر رخصته استخدام النموذج في بعض السيناريوهات، مثل البيئات التجارية، أو تفرض شروطًا محددة أخرى على استخدامه.

أما النموذج المفتوح المصدر فعلًا، الذي يُطرح مع تعليمات برمجية للتدريب ووصف لإجراءات تدريبه، فيمكن تعديله بالكامل بأي طريقة واستخدامه من دون قيود. أكثر تراخيص المصدر المفتوح شيوعًا وتوحيدًا هما ترخيص Apache 2.0 وترخيص MIT. ومع ذلك، تجدر الإشارة إلى أنه ما لم يوفّر مطور النموذج المفتوح المصدر تفاصيل بيانات تدريبه، فإن النموذج نفسه لا يكون قابلًا لإعادة الإنتاج بالكامل.

وتُعد الإصدارات مفتوحة المصدر عنصرًا أساسيًا في استمرار تطوير النماذج اللغوية الكبيرة (LLMs) وتحسينها، وهي مسؤولة إلى حد كبير عن إتاحة ابتكارها من الأساس. ويمكن عادةً الوصول إلى النماذج المفتوحة عبر مطور النموذج أو من خلال منصات مفتوحة المصدر شائعة، مثل GitHub وHugging Face. وفيما يلي قائمة ببعض سلاسل النماذج المفتوحة البارزة، مرتبة أبجديًا.

Cohere

أُطلقت Cohere، وهي شركة مقرها كندا ومن بين مؤسسيها أحد المشاركين في تأليف "Attention is All You Need"، في عام 2019. ومع أن الشركة تصدر تقارير تقنية مفصلة لكل نموذج لغوي كبير (LLM)، وتطرح هذه النماذج ظاهريًا بوصفها نماذج ذات أوزان مفتوحة، فإن Cohere ترخّص إصداراتها المفتوحة بموجب نسخة معدلة من ترخيص Creative Commons 4.0 تحظر الاستخدام التجاري.

Command

وتُعد Command سلسلة نماذج الأساس الرئيسية لدى Cohere، وقد صُممت لحالات استخدام المؤسسات.

  • وكان Command R أول أجيال نماذج Cohere المخصصة للمؤسسات، وقد طُرح في مارس 2024 في صورة نموذج يضم 35 مليار مَعْلمة، مع تركيز على التوليد المعزز بالاسترجاع (RAG) واستخدام الأدوات. وسرعان ما أعقبه في الشهر التالي Command R+، وهو إصدار يضم 104 مليار مَعْلمة. ثم انضم إليهما في ديسمبر من ذلك العام Command R7B الأصغر حجمًا.

  • أما Command A، وهو الجيل الثاني من نماذج Cohere المخصصة للمؤسسات، فقد صدر في مارس 2025 مع تركيز على مهام الأعمال والعلوم والتكنولوجيا والهندسة والرياضيات (STEM) ومهام البرمجة. وصدر النموذج الأصلي 111B لاحقًا في عدة إصدارات، منها Command A Reasoning وCommand A Translate، الذي خضع لضبط دقيق لتحسين أداء الترجمة عبر 23 لغة، وCommand A Vision، وهو نموذج لغة ورؤية (VLM) يجمع بين النموذج اللغوي الكبير (LLM) ومشفّر للرؤية.

في تعليق على Reddit في مارس 2026، أشار Aidan Gomez، الرئيس التنفيذي لشركة Cohere، إلى أن الشركة تعمل بنشاط على تطوير الجيل التالي من Command، وأنه سيكون أول نماذج mixture of experts (MoE) لدى الشركة.

Aya

Aya هي سلسلة النماذج لدى Cohere التي تركز على تعدد اللغات، وقد طُرحت لأول مرة في فبراير 2024 مع Aya 101، الذي كان، كما يوحي اسمه، "قادرًا على اتباع التعليمات في 101 لغة".

  • Aya Vision هو نموذج لغة ورؤية (VLM) متعدد الوسائط ومتعدد اللغات، ويتوفر بإصدارَي 8B و32B، مع قدرات تمتد عبر 23 لغة مختلفة.

  • أما Tiny Aya، الذي صدر في فبراير 2026، فهو سلسلة من النماذج متعددة اللغات خفيفة الوزن تضم 3.35 مليار مَعْلمة. Tiny Aya-Base هو نموذج مدرَّب مسبقًا يدعم أكثر من 70 لغة. أما Tiny Aya-Global فهو نظيره المضبوط بالتعليمات، ويدعم 67 لغة.

  • كما تضمن إصدار Tiny Aya متغيرات إقليمية متخصصة. فقد صُمم Tiny Aya-Earth للغات إفريقيا وغرب آسيا، وصُمم Tiny Aya-Fire للغات جنوب آسيا، وصُمم Tiny Aya-Water للغات آسيا والمحيط الهادئ واللغات الأوروبية.

DeepSeek

وتُعد DeepSeek جهة فاعلة أساسية في منظومة المصدر المفتوح، إذ أسهمت بعدد من الابتكارات في بُنى النماذج اللغوية الكبيرة (LLMs) وعمليات التدريب. وفي بعض الأحيان، نافس أداء نماذجها أداء أفضل النماذج المغلقة. وتُطرح نماذجها اللغوية الكبيرة (LLMs)، من حيث الأوزان والتعليمات البرمجية على السواء، بوصفها نماذج مفتوحة المصدر بموجب ترخيص MIT القياسي. كما تصدر DeepSeek بانتظام أوراقًا فنيّة تفصّل نتائجها وأساليبها.

  • ويُعد DeepSeek-V3 نموذج MoE كبيرًا، يضم 671 مليار مَعْلمة إجمالًا، منها 37 مليار مَعْلمة نشطة أثناء الاستدلال، وقد طُرح لأول مرة في أواخر عام 2024. وغالبًا ما يُنسب إلى هذا النموذج الفضل في إعادة بنية mixture of experts إلى صدارة الاهتمام السائد.

  • DeepSeek-R1 هو نموذج استدلال، جرى تطويره من خلال الضبط الدقيق لنموذج DeepSeek-V3 باستخدام تقنيات تعلم معزَّز كانت جديدة آنذاك. وشكّل DeepSeek-R1 محطة فارقة في تاريخ النماذج اللغوية الكبيرة (LLMs) مفتوحة المصدر. فهو لم يقتصر على منافسة أداء نموذج o1 من OpenAI، الذي كان يُعد قبل ذلك بلا منافس، بل أرفق أيضًا ورقة تقنية تتضمن تفاصيل كاملة عن منهجية التدريب لدى DeepSeek. وقد ألهم طرحه مباشرةً الجيل الأول من نماذج الاستدلال المفتوحة.

  • أما DeepSeek-V3.1، الذي صدر في أغسطس 2025، فهو نموذج استدلالي هجين، يمكن تهيئته لتشغيل كل من الاستدلال القياسي واستدلال سلسلة التفكير (CoT). ومن حيث الجوهر، جمع هذا النموذج بين DeepSeek-V3 وDeepSeek-R1 في نموذج واحد. ثم جاء أحدث تحديث له تحت اسم DeepSeek-V3.2 في أكتوبر 2025. كل من DeepSeek-V3.1 و DeepSeek-V3.2 ويحافظ كل من DeepSeek-V3.1 وDeepSeek-V3.2 على بنية MoE 671B-37B الخاصة بالنموذج الأصلي.

  • كما أصدرت DeepSeek عدة نماذج تحت اسم "DeepSeek-R1-Distill"، جرى تطويرها من خلال الضبط الدقيق لنماذج Qwen وLlama الأصغر حجمًا لمحاكاة DeepSeek-R1 عبر تقطير المعرفة.

وعلى الرغم من الشائعات المتكررة عن قرب صدور DeepSeek-V4، أو "DeepSeek-R2"، فإن هذه الإصدارات لم تر النور بعد.

Falcon (TII)

أما سلسلة Falcon من النماذج اللغوية الكبيرة (LLMs)، فتطوّرها Technology Innovation Institute (TTI) في الإمارات العربية المتحدة. ومع أن الجيل الأول من نماذج TII في عام 2023 عُرف على الأرجح بفضل Falcon-180B، الذي كان آنذاك واحدًا من أكبر النماذج مفتوحة المصدر المتاحة، فإن TII ركزت منذ ذلك الحين على نماذج أصغر. وقد ضم Falcon2 عدد 11 مليار مَعْلمة، في حين تراوحت نماذج Falcon3، وهي أول نماذج متعددة الوسائط من TII وصدرَت في ديسمبر 2024، بين مليار و10 مليارات.

وركزت أحدث أجيال نماذج Falcon على نماذج Mamba-Transformer الهجينة.

  • أما Falcon-H1، الذي صدر في مايو 2025، فيضم نماذج هجينة مدرَّبة مسبقًا ومضبوطة بالتعليمات، في إصدارات 0.5B و1.5B و3B و7B و34B. صدر Falcon-H1R في يناير 2026، وهو إصدار استدلالي من Falcon-H1-7B.

  • Falcon-H1-Tiny ، كما يوحي اسمها، هي إصدارات صغيرة للغاية من Falcon-H1، بأحجام 90 مليونًا و100 مليون و0.6 مليار. ويتوافر كل حجم منها في صورة نماذج أساسية، وكذلك في صورة إصدارات متخصصة خضعت لضبط دقيق لحالات استخدام محددة.

  • وتُعد نماذج Falcon-Edge عائلة من النماذج اللغوية الكبيرة (LLMs) التجريبية ذات 1 بت "BitNet"، وتتوفر بأحجام 1B و3B.

وتُطرح نماذج Falcon بموجب ترخيص Falcon مملوك، يستلهم إطار Apache 2.0، لكنه يضيف إليه شروطًا وقيودًا ملحوظة.

Gemma (Google)

أما Gemma فهي عائلة النماذج المفتوحة من Google. ووفقًا لشركة Google، فإن نماذج Gemma "مبنية على التقنية نفسها التي تشغّل نماذج Gemini."7

  • ويُعد Gemma 3، الذي صدر في مارس 2025، أحدث جيل من النموذج اللغوي الكبير الأساسي لدى Gemma. وقد تضمن الإصدار الأول من Gemma إصدارات مدرَّبة مسبقًا وأخرى مضبوطة بالتعليمات، بأحجام 1B و4B و12B و27B. وفي أغسطس 2025، أضافت Google إصدارًا أصغر يضم 270 مليون مَعْلمة. ويمكن لنماذج Gemma 3 معالجة مدخلات النصوص أو الصور، كما توفر دعمًا متعدد اللغات لأكثر من 140 لغة.
  • أما Gemma 3n، الذي صدر في يوليو 2025، فيتميز ببنية MatFormer تجريبية تتيح، في جوهرها، "تداخل" أي عدد من النماذج الأصغر ذات الأحجام المخصصة داخل نموذج واحد أكبر. وقد سُمّيت هذه البنية نسبةً إلى الدمى الروسية المتداخلة، المعروفة أيضًا باسم دمى "Matryoshka"، ومن هنا جاءت تسمية MatFormer. ويُطرح Gemma 3n بأحجام اسمية قدرها 2B و4B مَعْلمة، ويدعم مدخلات النصوص والصور والفيديو أو الصوت، لكنه يقتصر على المخرجات النصية فقط.

  • أما FunctionGemma فهو إصدار من Gemma 3 270 مليون خضع لضبط دقيق لاستخدام الأدوات، أو "function calling"، ومن هنا جاءت تسميته.

تُطرح نماذج Gemma بموجب ترخيص Gemma، الذي تتشابه شروط استخدامه مع شروط ترخيص Apache 2.0، لكنه يخضع لسياسة Gemma للاستخدامات المحظورة.

GLM (Z.ai)

أما GLM فهي عائلة من النماذج اللغوية الكبيرة (LLMs) من Z.ai، ومقرها بكين، وتُعرف أيضًا باسم Zhipu AI، وتهدف إلى تقديم أداء متقدم. وقد حققت الشركة نقلة مهمة مع GLM-4.5، الذي بدا، عند طرحه الأول في أواخر يوليو 2025، منافسًا لأفضل النماذج المفتوحة في العالم، بما في ذلك النماذج الرئيسية من DeepSeek وQwen، عبر المعايير الأكاديمية.

  • وقد طُرح GLM-4.5 بحجمين: النموذج اللغوي الكبير الرئيسي، وهو نموذج MoE واسع النطاق يضم 355 مليار مَعْلمة إجمالًا، منها 32 مليار مَعْلمة نشطة، والنموذج الأصغر GLM-4.5-Air الذي يضم 106 مليار مَعْلمة إجمالًا، منها 12 مليار مَعْلمة نشطة. أما GLM-4.5V فهو نموذج لغة ورؤية (VLM) مبني على نموذج الأساس GLM-4.5-Air، ويضيف قدرات رؤية الكمبيوتر وفهم الفيديو.

  • أما GLM-4.6، وهو إصدار محدَّث من GLM-4.5 صدر في 30 سبتمبر 2025، فلم يتضمن إصدارًا أصغر مخصصًا للنصوص فقط. لكن الشركة أصدرت في مطلع ديسمبر GLM-4.6V، وهو تحديث لنموذج GLM-4.5V، إلى جانب GLM-4.6V-Flash، وهو نموذج كثيف يضم 9 مليار مَعْلمة.

  • أما GLM-4.7، وهو تحديث للنموذج الرئيسي المخصص للنصوص فقط وصدر في أواخر ديسمبر 2025، فقد أضاف GLM-4.7-Flash، وهو نموذج لغوي كبير أصغر بكثير لا يضم سوى 30 مليار مَعْلمة إجمالًا، منها 3 مليارات مَعْلمة نشطة.

  • يُعَد GLM-5 ،الذي صدر في فبراير 2026، أكبر بكثير من الإصدارات السابقة، إذ يضم 744 مليار مَعْلمة إجمالًا، منها 40 مليار مَعْلمة نشطة.

Granite (IBM)

أما IBM Granite فهي سلسلة من النماذج اللغوية الكبيرة (LLMs) مفتوحة المصدر، مُحسَّنة لحالات استخدام المؤسسات، وتركز أساسًا على النماذج الصغيرة والعملية والفعالة. وقد طُرحت Granite لأول مرة في سبتمبر 2023، ثم برزت بقوة مع إصدار Granite 3.0 في أكتوبر 2024، حين وصلت سلسلة Granite إلى مستوى أداء ينافس أداء أبرز النماذج المفتوحة المماثلة لها في الحجم.

أُطلقت Granite 4 في أكتوبر 2025، وقدمت بنية هجينة جديدة تجمع بين Mamba2 وTransformer، بهدف تحقيق سرعة أعلى وكفاءة أفضل في استخدام الذاكرة، لا سيما في ظل أحمال التشغيل الكبيرة، مقارنةً بنماذج المحوّل التقليدية.

  • ويُعد Granite 4-H Small نموذج MoE هجينًا يضم 32 مليار مَعْلمة إجمالًا، منها 9 مليارات مَعْلمة نشطة. كما تضم Granite 4 نموذج MoE هجينًا آخر هو Granite 4-H Tiny، بإجمالي 7 مليارات مَعْلمة، منها مليار مَعْلمة نشطة، إلى جانب نموذج هجين كثيف هو Granite 4-H Micro، يضم 3 مليارات مَعْلمة نشطة.

  • أما Granite 4 Micro فهو نموذج كثيف يضم 3 مليارات مَعْلمة، ومبني على بنية محوّل تقليدية، بخلاف نماذج 4-H.
  • وفيما يخص Granite 4 Nano ، فهي سلسلة من النماذج الهجينة التي تجمع بين Mamba وTransformer، إلى جانب نماذج Transformer التقليدية، بأحجام تتراوح من 350 مليون مَعْلمة إلى مليار مَعْلمة.

  • ويُعد Granite 4 1B-Speech نموذجًا لتحويل الكلام إلى نص، وقد صُمم للتعرف التلقائي على الكلام (ASR) والترجمة التلقائية ثنائية الاتجاه للكلام (AST).

وجميع نماذج Granite مطروحة بوصفها مفتوحة المصدر بموجب ترخيص Apache 2.0 القياسي، ومدرَّبة على بيانات آمنة للمؤسسات. وفي أكتوبر 2025، أصبحت سلسلة Granite أول عائلة كبرى من النماذج المفتوحة تحصل على شهادة ISO-42001

GPT-OSS (OpenAI)

أما GPT-OSS فهي نماذج OpenAI اللغوية ذات الأوزان المفتوحة، وقد طُرحت في أغسطس 2025 بموجب ترخيص Apache 2.0 القياسي. وهي أول النماذج اللغوية الكبيرة (LLMs) المفتوحة من الشركة منذ إصدار GPT-2 في عام 2019.

  • ويُعد GPT-OSS-120B نموذج MoE يضم 117 مليار مَعْلمة إجمالًا، منها 5.1 مليارات مَعْلمة نشطة، وقد صُمم للاستخدامات العامة وللمهام التي تستفيد من الاستدلال المتقدم.

  • أما GPT-OSS-20B فهو نموذج MoE يضم 21 مليار مَعْلمة، منها 3.6 مليارات مَعْلمة نشطة، وهو مخصص للاستخدامات ذات زمن الانتقال المنخفض وللنشر المحلي.

وقد دُرِّب كلا نموذجي GPT-OSS باستخدام تكميم أوزانهما بدقة 4 بت، مما زاد سرعتهما بدرجة كبيرة وخفّض متطلبات الذاكرة مقارنةً بالنماذج التقليدية المماثلة في الحجم.

Kimi (Moonshot AI)

أما Kimi فهي سلسلة من النماذج المفتوحة طورتها Moonshot AI، ومقرها بكين.

  • ويُعد Kimi-K2 نموذج MoE ضخمًا مخصصًا للنصوص فقط، يضم تريليون مَعْلمة إجمالًا، منها 32 مليار مَعْلمة نشطة. وقد حظي باهتمام واسع عند طرحه في يوليو 2025، بعدما نافس نماذج GPT-4.1 وClaude Opus 4، وتفوّق أحيانًا عليهما، في معايير البرمجة الرئيسية.

  • كما أثار Kimi-K2 Thinking، وهو الإصدار الاستدلالي من Kimi-K2، اهتمامًا مماثلًا بعدما نافس مرة أخرى أبرز النماذج المغلقة في معايير الذكاء الاصطناعي الوكيل الصعبة.9

  • أما Kimi-K2.5 فهو تحديث للإصدار Kimi-K2 يضيف قدرات رؤية متعددة الوسائط. ويمكن تشغيله في عدة "أوضاع"، صُمم كل منها لحالات استخدام محددة.

وتُطرح نماذج Kimi بموجب ترخيص MIT مُعدَّل، يُلزم المستخدمين بأن "يعرضوا "Kimi K2" بشكل بارز على واجهة المستخدم" لأي منتج يزيد عدد مستخدميه النشطين شهريًا على 100 مليون مستخدم، أو تتجاوز إيراداته الشهرية 20 مليون دولار أمريكي.

Llama (Meta)

أما نماذج Llama من Meta، التي كُتبت في الأصل بصيغة LLaMA، وهي اختصار لعبارة "Large Language Model Meta AI"، فقد شكّلت جزءًا أساسيًا من تاريخ النماذج اللغوية الكبيرة (LLMs) المفتوحة. وقد ساعدت الإصدارات المبكرة من Llama على إتاحة منهجيات النماذج اللغوية الكبيرة (LLMs) على نطاق أوسع، وأسهمت في تشكيل كثير من الأعراف القياسية في تطوير هذه النماذج، من التدريب إلى البنية واختلافات الأحجام.

  • وقد طُرح Llama 2، الذي صدر في يوليو 2023، بأحجام 7 مليارات و13 مليارًا و70 مليار مَعْلمة.

  • أما Llama 3، الذي صدر في أبريل 2024 بأحجام 8 مليارات و70 مليار مَعْلمة، فقد نافس كثيرًا من النماذج المغلقة الرائدة عبر المعايير الأكاديمية. وسّع Llama 3.1 طول سياق النماذج على نحو كبير، وأضاف في يوليو من ذلك العام إصدارًا ضخمًا غير مسبوق آنذاك يضم 405 مليارات مَعْلمة. وأضاف Llama 3.2 إصدارات أصغر حجمًا، إلى جانب قدرات للرؤية، في حين جاء Llama 3.3 بنموذج واحد يضم 70 مليار مَعْلمة، ونافس أداؤه أداء Llama 3.1 الذي يضم 405 مليارات مَعْلمة.

  • تم إصدار Llama 4 بنموذجين كبيرين متعددي الوسائط من فئة MoE: Llama 4 Maverick، بإجمالي 400 مليار مَعْلمة، منها 17 مليار مَعْلمة نشطة، وLlama 4 Scout، بإجمالي 109 مليارات مَعْلمة، منها 19 مليار مَعْلمة نشطة. ومع أن أداء هذه النماذج تجاوز أداء أجيال Llama السابقة بوضوح عبر معظم المعايير، فإن نماذج Llama 3 ما تزال أكثر النماذج اللغوية الكبيرة (LLMs) انتشارًا لدى Meta، كما يتضح من عدد التنزيلات على Hugging Face.10

ومع أن Meta تستخدم كثيرًا مصطلح "مفتوح المصدر"، فإن نماذج Llama تُطرح بموجب ترخيص Llama مخصص يفرض قيودًا على الاستخدام والإسناد وإمكانية الوصول. ولذلك، انتقدت Open Source Initiative استخدام Meta لهذا المصطلح.

Minimax

أما MiniMax Group، ومقرها شنغهاي، فقد طرحت أول نموذج لغوي كبير (LLM) يحمل اسمها، وهو MiniMax-Text-01، إلى جانب نموذج لغة ورؤية (VLM) مصاحب هو MiniMax-VL-01، في يناير 2025. ومنذ ذلك الحين، برزت الشركة بوصفها واحدة من أبرز مطوري النماذج اللغوية الكبيرة (LLMs) في الصين، مع تركيز على النماذج واسعة النطاق ونوافذ السياق الطويلة.

  • أما MiniMax-M1، الذي صدر في يونيو 2025، فهو نموذج استدلالي مخصص للنصوص فقط، جرى تطويره من خلال الضبط الدقيق لنموذج MiniMax-Text-01. ومثل سابقه، فهو نموذج MoE كبير يضم 456 مليار مَعْلمة إجمالًا، مع تنشيط 45.9 مليار مَعْلمة لكل رمز مميز.
  • أما MiniMax-M2، فيقدم أداءً وكفاءةً أفضل من M1. ويضم هذا النموذج 230 مليار مَعْلمة إجمالًا، مع بنية MoE أدق تفعّل 10 مليارات مَعْلمة فقط لكل رمز مميز. وقد صدر في أكتوبر 2025، ثم حُدّث بعد شهرين تحت اسم MiniMax-M2.1. كما توفر MiniMax أيضًا MiniMax-M2-her، وهو إصدار خضع لضبط دقيق لأداء الأدوار القائم على الشخصيات.

  • MiniMax-M2.5 وMiniMax-M2.5-Lightning، اللذان صدرا في فبراير 2026، حققا مزيدًا من التحسين في الأداء، ونافسا Claude Opus 4.5 في بعض معايير البرمجة. وهما متطابقان من جميع الجوانب باستثناء السرعة ومعدل الإنتاجية؛ إذ يولد إصدار "Lightning" المخرجات بسرعة مضاعفة.

  • أما MiniMax-M2.7، الذي صدر في مارس 2026، فهو تحديث لنموذج MiniMax-M2.5، وتقول الشركة إن هذا التحديث أسهم في تدريب النموذج ذاته.11

وتُطرح نماذج MiniMax بموجب ترخيص MIT معدل.

Mistral AI

وإلى جانب نماذجها مغلقة المصدر، تطرح Mistral AI مجموعة متنوعة من النماذج المفتوحة التي تحظى بتقدير واسع. وتُطرح معظم نماذج Mistral المفتوحة، لا كلها، بموجب ترخيص Apache 2.0 القياسي.

  • ويستخدم Mistral Large 3 بنية MoE مستوحاة من DeepSeek-V3، ويضم 675 مليار مَعْلمة إجمالًا، منها 41 مليار مَعْلمة نشطة. ويعادل أداؤه في الاختبارات المعيارية تقريبًا أداء DeepSeek-V3.1 وKimi-K2.1.12 وقد صدر في ديسمبر 2025، وهو متعدد اللغات ومتعدد الوسائط، وقادر على معالجة مدخلات النصوص والصور.

  • أما Ministral 3 فهي سلسلة النماذج الصغيرة لدى Mistral، وتُطرح بأحجام 3 مليارات و8 مليارات و14 مليار مَعْلمة، وفي إصدارات أساسية، وأخرى مضبوطة بالتعليمات، وأخرى استدلالية.

  • أما Mistral Small 3.2 فهو نموذج لغوي كبير يضم 24 مليار مَعْلمة، وصدر في يونيو 2025. ويُقارب أداؤه أداء Ministral 3 14B الأحدث.

  • وتعد Devstral سلسلة النماذج لدى Mistral المخصصة للهندسة القائمة على الوكلاء. ويضم Devstral 2، الذي صدر في ديسمبر 2025، نموذجين. ويُطرح Devstral 2 123B بموجب ترخيص MIT مُعدَّل، ويُلزم المؤسسات التي تتجاوز إيراداتها الشهرية 20 مليون دولار أمريكي بالتقدم بطلب للحصول على ترخيص تجاري من Mistral. يُطرح Devstral Small 2 24B بموجب ترخيص Apache 2.0 القياسي.

  • أما Mixtral، الذي صدر في ديسمبر 2023، فهو نموذج لغوي كبير (LLM) أسهم في الأصل في شيوع بنية mixture of experts في النماذج اللغوية. واعتبارًا من مطلع عام 2026، ما يزال إصداره 8x7B يحظى بشعبية كبيرة على Hugging Face، مع أكثر من 700000 تنزيل شهريًا.13

Nemotron (NVIDIA)

وتحظى سلسلة النماذج اللغوية الكبيرة المفتوحة من NVIDIA، وهي شركة رائدة في تصنيع الأجهزة، بتقدير كبير بفضل أدائها وأدبياتها البحثية وابتكاراتها البنيوية.

  • أما NVIDIA-Nemotron-Nano v2 فهي عائلة من نماذج Mamba-2-LLM الهجينة، وتتوفر بأحجام 9 مليارات و12 مليار مَعْلمة، وهي قادرة على تنفيذ كل من الاستدلال والاستدلال القياسي. وقد طُرحت في أغسطس 2025 بموجب اتفاقية ترخيص النماذج المفتوحة NVIDIA Open Model License Agreement المخصصة، التي تتضمن شروطًا ملحوظة تتعلق بالمسؤوليات القانونية، والاستخدام، وحق NVIDIA في إدخال تعديلات مستقبلية على الاتفاقية.

  • أما Nemotron 3 Nano، الذي صدر في ديسمبر 2025، فيضم نموذجين: Nemotron-3-Nano-4B وNemotron-3-Nano-30B-A3B، وهو نموذج MoE يضم 30 مليار مَعْلمة إجمالًا، منها 3 مليارات مَعْلمة نشطة. وقد طُرح هذان النموذجان بموجب ترخيص NVIDIA Nemotron Open Model License، الذي لا يتضمن حق NVIDIA في إجراء تحديثات مستقبلية أحادية الجانب على الشروط.

  • وفيما يخص Nemotron 3 Super، فهو نموذج MoE أكبر، يضم 120 مليار مَعْلمة إجمالًا، منها 12 مليار مَعْلمة نشطة، وقد صدر في مارس 2026.

Olmo (AllenAI)

أما Olmo، الذي طوّره Allen Institute for AI "Ai2"، فهو من بين أكثر النماذج مفتوحة المصدر انفتاحًا بالمعنى الحقيقي، إذ يطرح Ai2 عادةً جميع التعليمات البرمجية والأوزان ونقاط التحقق التدريبية ومجموعات البيانات المرتبطة بها، إلى جانب إصدار قياسي بموجب ترخيص Apache 2.0.

  • وأما Olmo 3، الذي صدر في نوفمبر 2025، فيضم نماذج محول كثيفة بأحجام 7 مليارات و32 مليار مَعْلمة. تُطرح هذه النماذج في إصدارات أساسية، وإصدارات مضبوطة بالتعليمات، وإصدارات "Think". وفي ديسمبر 2025، تلقى نموذج 32 مليار مَعْلمة تحديثًا تحت اسم Olmo 3.1.
  • أما Olmo Hybrid، الذي صدر في مارس 2026، فهو نموذج يضم 7 مليارات مَعْلمة، ويعتمد على بنية هجينة تجريبية تجمع بين بنية المحول (Transformer) وشبكات RNN الخطية، استنادًا إلى بنية Gated DeltaNet التي اشتهرت بها Qwen.

Phi (Microsoft)

أما Phi فهي سلسلة النماذج المفتوحة من Microsoft، وقد ركزت تاريخيًا على النماذج الصغيرة. وتُطرح هذه النماذج بموجب ترخيص MIT القياسي.

  • ويُعد Phi 4 نموذجًا لغويًا كبيرًا مخصصًا للنصوص فقط، ويضم 14 مليار مَعْلمة، وقد طُرح لأول مرة في ديسمبر 2024.

  • أما Phi 4-mini، الذي صدر في فبراير 2025، فهو نموذج أصغر يضم 3.8 مليارات مَعْلمة.

  • وأما Phi 4-multimodal، الذي طُرح إلى جانب Phi 4-mini، فهو يدعم مدخلات النصوص والصور والكلام.

  • وفيما يخص Phi 4-Reasoning-Vision، الذي صدر في مارس 2026، فهو نموذج يضم 15 مليار مَعْلمة، ويضيف قدرات استدلالية شاملة متعددة الوسائط عبر الصور والنصوص والمستندات.

Qwen (Alibaba)

وأما سلسلة Qwen من النماذج اللغوية الكبيرة (LLMs)، التي طورتها Alibaba، فقد أصبحت من بين أكثر النماذج المفتوحة شعبية في القطاع. وتقدم هذه السلسلة مجموعة واسعة من أحجام النماذج وبُناها وقدراتها، بما يلائم احتياجات متنوعة لدى المطورين.

  • ويضم Qwen3 نماذج المحول كثيفة مخصصة للنصوص فقط، بأحجام 0.6 مليار و1.7 مليار و4 مليارات و8 مليارات و14 مليارًا و32 مليار مَعْلمة، إلى جانب نماذج MoE بأحجام 30 مليار مَعْلمة - 3 مليارات مَعْلمات نشطة، وكذلك النموذج الرئيسي Qwen3-235B-A22B. وتُطرح جميع نماذج Qwen3 في إصدارات أساسية، وإصدارات استدلالية، وإصدارات مضبوطة بالتعليمات.

  • أما Qwen3-Next فهو نموذج MoE تجريبي مخصص للنصوص فقط، ويضم 80 مليار مَعْلمة، منها 3 مليارات مَعْلمات نشطة، ويستبدل آلية الانتباه القياسية بشبكات Gated Delta Networks، المستوحاة من Mamba-2، وبآلية Gated Attention.

  • أما Qwen3-Omni فهو نموذج متعدد الوسائط بطبيعته، ومبني على Qwen3-30B-A3B، ويدعم مدخلات النصوص والصور والصوت والفيديو، إلى جانب مخرجات النصوص أو الكلام.

  • Qwen3-Coder-Next هو نسخة من Qwen3-Next مضبوطة بدقة لتوليد التعليمات البرمجية.

  • أما Qwen3.5، الذي صدر في فبراير 2026، فهو عائلة من النماذج متعددة الوسائط تستخدم البنية التي قُدمت أول مرة في Qwen3-Next. وتضم هذه العائلة نماذج أساسية ونماذج استدلالية هجينة بأحجام 0.8 مليار و2 مليار و4 مليارات و9 مليارات و27 مليار مَعْلمة، إلى جانب نماذج MoE بأحجام 35 مليار مَعْلمة - 3 مليارات مَعْلمات نشطة، و122 مليار مَعْلمة - 10 مليارات مَعْلمات نشطة، وكذلك النموذج الرئيسي 397 مليار مَعْلمة - 17 مليار مَعْلمة نشطة. وأما Qwen3.5-397B-A17B فيهدف إلى منافسة نماذج Gemini وGPT وClaude الرائدة من حيث الأداء المتقدم.

مؤلف

Dave Bergmann

Senior Staff Writer, AI Models

IBM Think

حلول ذات صلة
IBM Bob

تسريع عملية تسليم البرامج مع Bob، شريكك المدعوم بالذكاء الاصطناعي للتطوير الآمن والمدرك للأهداف.

استكشف ®IBM Bob
IBM® watsonx Orchestrate

يمكنك بسهولة تصميم مساعدي ووكلاء الذكاء الاصطناعي القابلين للتوسع وأتمتة المهام المتكررة وتبسيط العمليات المعقدة باستخدام IBM watsonx Orchestrate.

استكشف watsonx Orchestrate
حلول الذكاء الاصطناعي

استفِد من الذكاء الاصطناعي في عملك بالاستعانة بخبرة IBM الرائدة في مجال الذكاء الاصطناعي ومحفظة حلولها التي ستكون بجانبك.

استكشف حلول الذكاء الاصطناعي
اتخذ الخطوة التالية

أينما كنت ضمن دورة حياة تطوير البرمجيات، فإن Bob يساندك عبر تقديم تقييمات قائمة على الوكلاء ومدركة للهدف ومتوافقة مع متطلبات الأمان، بما يسرّع تسليم برمجيات عالية الجودة.

  1. اكتشف IBM Bob
  2. استكشف watsonx Orchestrate