ما المقصود بنماذج الأساس؟

ما المقصود بنماذج الأساس؟

نماذج الأساس هي نماذج ذكاء اصطناعي (AI) مدرَّبة على مجموعات بيانات ضخمة، وقادرة على أداء مجموعة واسعة من المهام العامة. وتشكِّل الأساس أو الركيزة لبناء تطبيقات أكثر تخصصًا.

مرونتها وحجمها الهائل يميّزها عن نماذج التعلم الآلي التقليدية، التي يتم تدريبها على مجموعات بيانات أصغر لأداء مهام محددة، مثل اكتشاف الكائنات أو التنبؤ بالتوجهات. تستخدم نماذج الأساس، في المقابل، التعلم بالنقل لتطبيق المعرفة المكتسبة من مهمة معينة على مهمة أخرى. وهذا يجعلها مناسبة لمجالات أوسع، بما في ذلك رؤية الكمبيوتر، ومعالجة اللغة الطبيعية، والتعرُّف على الكلام.

صاغ باحثو مركز ستانفورد لأبحاث نماذج الأساس ومعهد الذكاء الاصطناعي المرتكز على الإنسان مصطلح "نماذج الأساس" في ورقة بحثية عام 2021. يَصِف الباحثون هذه النماذج بأنها "تحوُّل جذري" ويشرحون السبب وراء تسميتها: "نموذج الأساس في حد ذاته غير مكتمل، لكنه يشكِّل الأساس المشترك الذي يُبنى عليه العديد من النماذج المخصصة لمهام محددة من خلال التكييف. كما اخترنا مصطلح "الأساس" للدلالة على أهمية الاستقرار البنائي والسلامة والأمان: فالأساسات ضعيفة البنية قد تؤدي إلى الكوارث، بينما الأساسات المتينة توفِّر قاعدة موثوقًا بها للتطبيقات المستقبلية".1

كيف تعمل نماذج الأساس؟

غالبًا ما يتضمن بناء نموذج الأساس مجموعة من الخطوات مشابهة لتطوير نموذج التعلم الآلي التقليدي:

  1. جمع البيانات
  2. اختيار الوسائط
  3. تحديد بنية النموذج
  4. التدريب
  5. التقييم

1. جمع البيانات

الخطوة الأولى هي تجميع مجموعة ضخمة من البيانات من مصادر متنوعة. يُتيح هذا التنوع الكبير من البيانات غير المصنّفة وغير المنظمة لنماذج الأساس استنتاج الأنماط، والتعرُّف على العلاقات، وفهم السياق، وتعميم المعرفة.

2. اختيار الوسائط

تُشير الوسائط إلى نوع البيانات التي يمكن للنموذج معالجتها، بما في ذلك الصوت والصور والأكواد البرمجية والنصوص والفيديو. يمكن أن تكون نماذج الأساس أحادية الوسائط أو متعددة الوسائط. تم تصميم النماذج أحادية الوسائط للتعامل مع نوع واحد من البيانات، مثل استقبال مدخلات نصية وإصدار مخرجات نصية. يمكن أن تجمع النماذج متعددة الوسائط بين المعلومات من طرائق متعددة، مثل أخذ مطالبة نصية وإنشاء صورة أو إنتاج نصوص مكتوبة من تسجيل صوتي.

3. تحديد بنية النموذج

يستخدم العديد من نماذج الأساس بنية التعلم العميق، التي تعتمد على شبكات عصبية متعددة الطبقات لمحاكاة عملية اتخاذ القرار في الدماغ البشري.

يُعَد نوع نماذج التعلم العميق المعروف باسم نموذج المحوِّل البنية المفضلة لنماذج الأساس، خاصةً تلك الخاصة بمعالجة اللغة الطبيعية مثل سلسلة نماذج المحوِّل التوليدي المدرَّب مسبقًا (GPT). وفيما يلي لمحة موجزة عن بنية المحوِّلات:

  • تحوّل أدوات التشفير تسلسلات المدخلات إلى تمثيلات رقمية تسمى التضمينات التي تلتقط دلالات الرموز ومواقعها في تسلسل المدخلات.

  • تُتيح آلية الانتباه الذاتي تركيز الانتباه على الرموز الأكثر أهمية في تسلسل المدخلات في بعض الحالات، بغض النظر عن موقعها.

  • تستخدم أدوات فك التشفير آلية الانتباه الذاتي وتضمينات أجهزة التشفير لإنشاء تسلسل المخرجات الأكثر احتمالاً من الناحية الإحصائية.

نماذج الانتشار هي بنية أخرى يتم تنفيذها في نماذج الأساس. تعمل الشبكات العصبية القائمة على الانتشار تدريجيًا على "نشر" بيانات التدريب بضوضاء عشوائية، ثم تتعلم عكس عملية الانتشار هذه لإعادة بناء البيانات الأصلية. تُستخدم نماذج الانتشار بشكل أساسي في نماذج الأساس التي تحوِّل النص إلى صورة، مثل Imagen من Google، وDALL-E من OpenAI (ابتداءً من DALL-E 2)، وStable Diffusion من Stability AI.

4. التدريب

يتضمن التدريب عادةً التعلم الذاتي الخاضع للإشراف، حيث يتعلم نموذج الأساس الارتباطات المتأصلة في البيانات غير المصنّفة. تتم عملية التدريب عبر عدة تكرارات، حيث يتم ضبط أوزان النموذج لتقليل أخطاء التنبؤ، ويتم ضبط المَعلمات الفائقة للعثور على متغيّرات التكوين المثالية للتدريب. يمكن أيضًا تطبيق طرق التنظيم لتصحيح فرط التخصيص عندما يتطابق النموذج بشكل مفرط أو كامل مع بيانات التدريب، ولتحسين قدرة نموذج الأساس على التعميم.

5. التقييم

يمكن التحقق من أداء نموذج الأساس باستخدام معايير موحَّدة. يمكن أن توفِّر النتائج من هذه التقييمات مزيدًا من التحسينات أو تحسينات الأداء.

تكييف نماذج الأساس

يمكن أن يكون تطوير نموذج أساس من الصفر عملية مكلفة ومكثفة من الناحية الحسابية وتستغرق وقتًا طويلًا. لهذا السبب، قد تفكر المؤسسات في تكييف نماذج الأساس الحالية لتلبية احتياجاتها الخاصة. يمكن الوصول إلى هذه النماذج من خلال واجهة برمجة التطبيقات (API) أو باستخدام نسخة محلية من النموذج.

فيما يلي طريقتان شائعتان للتكيف:

الضبط الدقيق

أثناء الضبط الدقيق، يعمل نموذج الأساس المدرَّب مسبقًا على تكييف معرفته العامة لأداء مهمة محددة. يشمل ذلك تدريبًا إضافيًا باستخدام التعلم الخاضع للإشراف على مجموعة بيانات أصغر خاصة بالمجال أو بالمهمة، تحتوي على أمثلة مصنّفة. يتم تحديث مَعلمات النموذج لتحسين أداءه في المهمة.

نظرًا لأن الضبط الدقيق يغيّر مَعلمات النموذج، فقد يؤثِّر ذلك في كيفية أداء النموذج في المهام الأخرى. يُعَد إنشاء مجموعة بيانات مصنّفة أيضًا عملية شاقة.

المطالبة

تستلزم هذه الطريقة تقديم مطالبة لتخصيص نموذج الأساس لمهمة معينة. تأتي المطالبة على شكل تعليمات مرتبطة بالمهمة أو أمثلة ذات صلة بالمهمة توجِّه النموذج، ما يمكِّنه من فهم السياق وإنتاج مخرجات محتملة، وهي قدرة تُعرَف باسم التعلم في السياق.

على الرغم من أن المطالبة لا تتطلب تدريب النموذج أو تغيير مَعلماته، فإن الأمر قد يستغرق عدة محاولات للحصول على المطالبة الصحيحة التي تُهيئ النموذج لفهم السياق وإجراء تنبؤات مناسبة.

حالات استخدام نماذج الأساس

تعني قابلية التكيف والطبيعة العامة لنماذج الأساس أنها يمكن تطبيقها في مجموعة متنوعة من التطبيقات الواقعية: 

  • رؤية الكمبيوتر

  • معالجة اللغة الطبيعية

  • الرعاية الصحية

  • التشغيل الآلي

  • إنشاء كود برمجي

رؤية الكمبيوتر

يمكن استخدام نماذج الأساس لتوليد الصور وتصنيفها وللكشف عن الكائنات وتحديدها ووصفها. تُعَد DALL-E وImagen وStable Diffusion أمثلة على نماذج الأساس التي تحوِّل النص إلى صورة.

معالجة اللغة الطبيعية

تُعَد النماذج اللغوية الكبيرة (LLMs) فئة من نماذج الأساس تتفوق في معالجة اللغة الطبيعية وفهمها. تشمل قدراتها الإجابة عن الأسئلة، وتلخيص النصوص، وتحويل المقاطع الصوتية إلى نص، والترجمة، وإنشاء التعليقات التوضيحية على الفيديو، وغيرها.

فيما يلي بعض نماذج الأساس الشائعة في مجال معالجة اللغة الطبيعية:

  • كان نموذج BERT (تمثيلات التشفير ثنائية الاتجاه من المحوِّلات) واحدًا من أول نماذج الأساس. تم تدريب نظام الذكاء الاصطناعي مفتوح المصدر هذا، الذي أصدرته Google في عام 2018، على مجموعة نصوص عادية فقط.2

  • BLOOM هو نموذج لغوي متعدد اللغات متاح للجميع ومدرَّب على 46 لغة. وهو نتيجة جهد تعاوني بين Hugging Face وBigScience، مجتمع من الباحثين في مجال الذكاء الاصطناعي.3

  • تُعَد Claude مجموعة نماذج الأساس التابعة لشركة Anthropic، وتتمتع بقدرات متقدمة في الاستدلال ومعالجة عدة لغات.

  • يُعَد GPT، نموذج الأساس من OpenAI، العمود الفقري لـ ChatGPT، روبوت المحادثة المدعوم بالذكاء الاصطناعي التوليدي التابع للشركة. يعمل GPT-3.5 على تشغيل الإصدار المجاني من ChatGPT، بينما يعتمد الإصدار المتميز على GPT-4. سلسلة GPT-4 هي أيضًا نموذج الذكاء الاصطناعي التوليدي الذي يدعم مساعد Copilot AI من Microsoft.

  • تُعَد Granite سلسلة نماذج الأساس اللغوية الكبيرة (LLM) الرائدة من IBM، والقائمة على بنية المحوِّل المدعومة بآلية فك التشفير فقط. تم تحسين نموذج الدردشة Granite 13b لاستخدامه في سيناريوهات الحوار، ويعمل بشكل جيد مع الوكلاء الافتراضيين وتطبيقات الدردشة. تم تدريب نموذج Granite متعدد اللغات لفهم النصوص وتوليدها بالإنجليزية والألمانية والإسبانية والفرنسية والبرتغالية.

  • يُعد PaLM 2 نموذج اللغة من الجيل التالي لدى Google، ويتمتع بقدرات محسَّنة في المعالجة متعددة اللغات والاستدلال.

الرعاية الصحية

في مجال الرعاية الصحية، يمكن أن يساعد نموذج الأساس على تنفيذ مجموعة من المهام. بدءًا من تلخيص زيارات المرضى والبحث في الأدبيات الطبية، ووصولًا إلى الإجابة عن أسئلة المرضى، ومطابقة المرضى مع التجارب السريرية، وتسهيل اكتشاف الأدوية. على سبيل المثال، يمكن للنموذج اللغوي Med-PaLM 2 الإجابة عن الأسئلة الطبية، وتعمل Google على تصميم نسخة متعددة الوسائط يمكنها دمج المعلومات من الصور الطبية.4

التشغيل الآلي

في مجال الروبوتات، يمكن لنماذج الأساس مساعدة الروبوتات على التكيف بسرعة مع بيئات جديدة وتعميم معرفتها عبر مهام وسيناريوهات وتجسيدات روبوتية مختلفة. على سبيل المثال، يعمل نموذج اللغة متعدد الوسائط المتجسد PaLM-E على نقل المعرفة من مجالات اللغة والصور في PaLM إلى أنظمة الروبوتات، ويتم تدريبه على بيانات أجهزة استشعار الروبوت.5

إنشاء كود برمجي

يمكن أن يساعد نموذج الأساس على إكمال وتصحيح الأخطاء وشرحها وإنشاء التعليمات البرمجية بلغات البرمجة المختلفة. وتشمل نماذج الأساس لتحويل النص إلى كود ما يلي: Claude من Anthropic، وCodey وPaLM 2 من Google، وعائلة Granite Code من IBM المدرَّبة على 116 لغة برمجة.

مع وجود هذا العدد الكبير من الخيارات، كيف يمكن للمؤسسات اختيار نموذج الأساس المناسب لتطوير الذكاء الاصطناعي؟ إليك إطار عمل مكوَّنًا من ست خطوات لاختيار نموذج الذكاء الاصطناعي يمكن أن يساعد على ذلك:

فوائد نماذج الأساس

البناء على نماذج الأساس يمكن أن يؤدي إلى الأتمتة والابتكار داخل المؤسسات. وفيما يلي فوائد أخرى يمكن للشركات الحصول عليها من نماذج الأساس:

تسريع الوقت المناسب لتحقيق القيمة والتوسع: اعتماد النماذج القائمة يُلغي مرحلتَي التطوير والتدريب المسبق، ما يمكِّن الشركات من تخصيص النماذج المضبوطة بدقة ونشرها بسرعة.

الوصول إلى البيانات: لا تحتاج المؤسسات إلى تجميع كميات كبيرة من البيانات للتدريب المسبق، والتي قد لا تكون لديها الموارد للحصول عليها.

الدقة والأداء الأساسيين: لقد تم تقييم نماذج الأساس مسبقًا من حيث الدقة والأداء، ما يوفر نقطة انطلاق عالية الجودة.

انخفاض التكلفة: لن تحتاج الشركات إلى الإنفاق على الموارد اللازمة لإنشاء نموذج الأساس من الألف إلى الياء.

تحديات نماذج الأساس

كما هو الحال مع نماذج الذكاء الاصطناعي الأخرى، لا تزال نماذج الأساس تواجه مخاطر الذكاء الاصطناعي. يُعَد هذا عاملًا يجب أخذه في الاعتبار بالنسبة للمؤسسات التي تفكِّر في نماذج الأساس باعتبارها التقنية التي تدعم مهام سير عملها الداخلية أو تطبيقات الذكاء الاصطناعي التجاري.

التحيز: يمكن للنموذج أن يتعلم من التحيز البشري الموجود في بيانات التدريب، وقد ينتقل هذا التحيز إلى مخرجات النماذج المضبوطة بدقة.

التكاليف الحاسوبية: لا يزال استخدام نماذج الأساس القائمة يتطلب ذاكرة كبيرة وأجهزة متقدمة مثل وحدات معالجة الرسومات (GPUs) وموارد حاسوبية أخرى لضبطها ونشرها وصيانتها.

خصوصية البيانات: قد يتم تدريب نماذج الأساس على البيانات التي تم الحصول عليها دون موافقة أو علم أصحابها. كن حذرًا عند إدخال البيانات في الخوارزميات لتجنُّب انتهاك حقوق الطبع والنشر للآخرين أو الكشف عن معلومات شخصية أو معلومات أعمال خاصة.

الأثر البيئي: يتطلب تدريب وتشغيل نماذج الأساس واسعة النطاق عمليات حوسبة مكثفة تستهلك الكثير من الطاقة، ما يساهم في زيادة انبعاثات الكربون واستهلاك المياه.

الهلوسة: يُعَد التحقق من نتائج نماذج الأساس للذكاء الاصطناعي أمرًا ضروريًا لضمان إنتاجها لمخرجات صحيحة من الناحية الواقعية.

أحدث اتجاهات الذكاء الاصطناعي، يقدمها لك الخبراء

احصل على رؤى منسقة حول أهم أخبار الذكاء الاصطناعي وأكثرها إثارةً للاهتمام. اشترِك في خدمة رسائل Think الإخبارية الأسبوعية. راجع بيان الخصوصية لشركة IBM.

شكرًا لك! لقد اشتركت بنجاح.

سيتم تسليم اشتراكك باللغة الإنجليزية. ستجد رابط إلغاء الاشتراك في كل رسالة إخبارية. يمكنك إدارة اشتراكاتك أو إلغاء اشتراكك هنا. راجع بيان خصوصية IBM لمزيد من المعلومات.

أكاديمية الذكاء الاصطناعي

لماذا تعد نماذج الأساس نقلة نوعية في الذكاء الاصطناعي

تعرَّف على فئة جديدة من نماذج الذكاء الاصطناعي المرنة والقابلة لإعادة الاستخدام التي يمكن أن تفتح مصادر جديدة للإيرادات، وتُسهم في تقليل التكاليف، وزيادة الإنتاجية، ثم استخدم دليلنا لمعرفة المزيد من التفاصيل.

حلول ذات صلة
نماذج الأساس

استكشف مكتبة نماذج الأساس من IBM في محفظة watsonx لتوسيع نطاق الذكاء الاصطناعي التوليدي لأعمالك بثقة.

اكتشف watsonx.ai
حلول الذكاء الاصطناعي

استفد من الذكاء الاصطناعي في عملك بالاستعانة بخبرة IBM الرائدة في مجال الذكاء الاصطناعي ومحفظة حلولها المتوفرة لك.

استكشف حلول الذكاء الاصطناعي
الاستشارات والخدمات المتعلقة بالذكاء الاصطناعي

أعدّ ابتكار عمليات ومهام سير العمل الحساسة بإضافة الذكاء الاصطناعي لتعزيز التجارب وصنع القرارات في الوقت الفعلي والقيمة التجارية.

استكشف خدمات الذكاء الاصطناعي
اتخِذ الخطوة التالية

استكشف مكتبة نماذج الأساس من IBM في محفظة IBM watsonx لتوسيع نطاق الذكاء الاصطناعي التوليدي لأعمالك بثقة.

استكشف watsonx.ai استكشف حلول الذكاء الاصطناعي
الحواشي

1 On the Opportunities and Risks of Foundation Models, Stanford Center for Research on Foundation Models and Stanford Institute for Human-Centered Artificial Intelligence, 2021

2 Open Sourcing BERT: State-of-the-Art Pre-training for Natural Language Processing, Google Research, 2 November 2018

3 BigScience Large Open-science Open-access Multilingual Language Model, Hugging Face, 6 July 2022

4 Med-PaLM, Google Research, Accessed 8 October 2024

5 PaLM-E: An embodied multimodal language model, Google Research, 10 March 2023