أحدث اتجاهات الذكاء الاصطناعي، يقدمها لك الخبراء
احصل على رؤى منسقة حول أهم أخبار الذكاء الاصطناعي وأكثرها إثارةً للاهتمام. اشترِك في خدمة رسائل Think الإخبارية الأسبوعية. راجع بيان الخصوصية لشركة IBM.
نماذج الأساس هي نماذج ذكاء اصطناعي (AI) مدرَّبة على مجموعات بيانات ضخمة، وقادرة على أداء مجموعة واسعة من المهام العامة. وتشكِّل الأساس أو الركيزة لبناء تطبيقات أكثر تخصصًا.
مرونتها وحجمها الهائل يميّزها عن نماذج التعلم الآلي التقليدية، التي يتم تدريبها على مجموعات بيانات أصغر لأداء مهام محددة، مثل اكتشاف الكائنات أو التنبؤ بالتوجهات. تستخدم نماذج الأساس، في المقابل، التعلم بالنقل لتطبيق المعرفة المكتسبة من مهمة معينة على مهمة أخرى. وهذا يجعلها مناسبة لمجالات أوسع، بما في ذلك رؤية الكمبيوتر، ومعالجة اللغة الطبيعية، والتعرُّف على الكلام.
صاغ باحثو مركز ستانفورد لأبحاث نماذج الأساس ومعهد الذكاء الاصطناعي المرتكز على الإنسان مصطلح "نماذج الأساس" في ورقة بحثية عام 2021. يَصِف الباحثون هذه النماذج بأنها "تحوُّل جذري" ويشرحون السبب وراء تسميتها: "نموذج الأساس في حد ذاته غير مكتمل، لكنه يشكِّل الأساس المشترك الذي يُبنى عليه العديد من النماذج المخصصة لمهام محددة من خلال التكييف. كما اخترنا مصطلح "الأساس" للدلالة على أهمية الاستقرار البنائي والسلامة والأمان: فالأساسات ضعيفة البنية قد تؤدي إلى الكوارث، بينما الأساسات المتينة توفِّر قاعدة موثوقًا بها للتطبيقات المستقبلية".1
غالبًا ما يتضمن بناء نموذج الأساس مجموعة من الخطوات مشابهة لتطوير نموذج التعلم الآلي التقليدي:
الخطوة الأولى هي تجميع مجموعة ضخمة من البيانات من مصادر متنوعة. يُتيح هذا التنوع الكبير من البيانات غير المصنّفة وغير المنظمة لنماذج الأساس استنتاج الأنماط، والتعرُّف على العلاقات، وفهم السياق، وتعميم المعرفة.
تُشير الوسائط إلى نوع البيانات التي يمكن للنموذج معالجتها، بما في ذلك الصوت والصور والأكواد البرمجية والنصوص والفيديو. يمكن أن تكون نماذج الأساس أحادية الوسائط أو متعددة الوسائط. تم تصميم النماذج أحادية الوسائط للتعامل مع نوع واحد من البيانات، مثل استقبال مدخلات نصية وإصدار مخرجات نصية. يمكن أن تجمع النماذج متعددة الوسائط بين المعلومات من طرائق متعددة، مثل أخذ مطالبة نصية وإنشاء صورة أو إنتاج نصوص مكتوبة من تسجيل صوتي.
يستخدم العديد من نماذج الأساس بنية التعلم العميق، التي تعتمد على شبكات عصبية متعددة الطبقات لمحاكاة عملية اتخاذ القرار في الدماغ البشري.
يُعَد نوع نماذج التعلم العميق المعروف باسم نموذج المحوِّل البنية المفضلة لنماذج الأساس، خاصةً تلك الخاصة بمعالجة اللغة الطبيعية مثل سلسلة نماذج المحوِّل التوليدي المدرَّب مسبقًا (GPT). وفيما يلي لمحة موجزة عن بنية المحوِّلات:
تحوّل أدوات التشفير تسلسلات المدخلات إلى تمثيلات رقمية تسمى التضمينات التي تلتقط دلالات الرموز ومواقعها في تسلسل المدخلات.
تُتيح آلية الانتباه الذاتي تركيز الانتباه على الرموز الأكثر أهمية في تسلسل المدخلات في بعض الحالات، بغض النظر عن موقعها.
تستخدم أدوات فك التشفير آلية الانتباه الذاتي وتضمينات أجهزة التشفير لإنشاء تسلسل المخرجات الأكثر احتمالاً من الناحية الإحصائية.
نماذج الانتشار هي بنية أخرى يتم تنفيذها في نماذج الأساس. تعمل الشبكات العصبية القائمة على الانتشار تدريجيًا على "نشر" بيانات التدريب بضوضاء عشوائية، ثم تتعلم عكس عملية الانتشار هذه لإعادة بناء البيانات الأصلية. تُستخدم نماذج الانتشار بشكل أساسي في نماذج الأساس التي تحوِّل النص إلى صورة، مثل Imagen من Google، وDALL-E من OpenAI (ابتداءً من DALL-E 2)، وStable Diffusion من Stability AI.
يتضمن التدريب عادةً التعلم الذاتي الخاضع للإشراف، حيث يتعلم نموذج الأساس الارتباطات المتأصلة في البيانات غير المصنّفة. تتم عملية التدريب عبر عدة تكرارات، حيث يتم ضبط أوزان النموذج لتقليل أخطاء التنبؤ، ويتم ضبط المَعلمات الفائقة للعثور على متغيّرات التكوين المثالية للتدريب. يمكن أيضًا تطبيق طرق التنظيم لتصحيح فرط التخصيص عندما يتطابق النموذج بشكل مفرط أو كامل مع بيانات التدريب، ولتحسين قدرة نموذج الأساس على التعميم.
يمكن التحقق من أداء نموذج الأساس باستخدام معايير موحَّدة. يمكن أن توفِّر النتائج من هذه التقييمات مزيدًا من التحسينات أو تحسينات الأداء.
يمكن أن يكون تطوير نموذج أساس من الصفر عملية مكلفة ومكثفة من الناحية الحسابية وتستغرق وقتًا طويلًا. لهذا السبب، قد تفكر المؤسسات في تكييف نماذج الأساس الحالية لتلبية احتياجاتها الخاصة. يمكن الوصول إلى هذه النماذج من خلال واجهة برمجة التطبيقات (API) أو باستخدام نسخة محلية من النموذج.
فيما يلي طريقتان شائعتان للتكيف:
أثناء الضبط الدقيق، يعمل نموذج الأساس المدرَّب مسبقًا على تكييف معرفته العامة لأداء مهمة محددة. يشمل ذلك تدريبًا إضافيًا باستخدام التعلم الخاضع للإشراف على مجموعة بيانات أصغر خاصة بالمجال أو بالمهمة، تحتوي على أمثلة مصنّفة. يتم تحديث مَعلمات النموذج لتحسين أداءه في المهمة.
نظرًا لأن الضبط الدقيق يغيّر مَعلمات النموذج، فقد يؤثِّر ذلك في كيفية أداء النموذج في المهام الأخرى. يُعَد إنشاء مجموعة بيانات مصنّفة أيضًا عملية شاقة.
تستلزم هذه الطريقة تقديم مطالبة لتخصيص نموذج الأساس لمهمة معينة. تأتي المطالبة على شكل تعليمات مرتبطة بالمهمة أو أمثلة ذات صلة بالمهمة توجِّه النموذج، ما يمكِّنه من فهم السياق وإنتاج مخرجات محتملة، وهي قدرة تُعرَف باسم التعلم في السياق.
على الرغم من أن المطالبة لا تتطلب تدريب النموذج أو تغيير مَعلماته، فإن الأمر قد يستغرق عدة محاولات للحصول على المطالبة الصحيحة التي تُهيئ النموذج لفهم السياق وإجراء تنبؤات مناسبة.
تعني قابلية التكيف والطبيعة العامة لنماذج الأساس أنها يمكن تطبيقها في مجموعة متنوعة من التطبيقات الواقعية:
رؤية الكمبيوتر
معالجة اللغة الطبيعية
الرعاية الصحية
التشغيل الآلي
إنشاء كود برمجي
يمكن استخدام نماذج الأساس لتوليد الصور وتصنيفها وللكشف عن الكائنات وتحديدها ووصفها. تُعَد DALL-E وImagen وStable Diffusion أمثلة على نماذج الأساس التي تحوِّل النص إلى صورة.
تُعَد النماذج اللغوية الكبيرة (LLMs) فئة من نماذج الأساس تتفوق في معالجة اللغة الطبيعية وفهمها. تشمل قدراتها الإجابة عن الأسئلة، وتلخيص النصوص، وتحويل المقاطع الصوتية إلى نص، والترجمة، وإنشاء التعليقات التوضيحية على الفيديو، وغيرها.
فيما يلي بعض نماذج الأساس الشائعة في مجال معالجة اللغة الطبيعية:
كان نموذج BERT (تمثيلات التشفير ثنائية الاتجاه من المحوِّلات) واحدًا من أول نماذج الأساس. تم تدريب نظام الذكاء الاصطناعي مفتوح المصدر هذا، الذي أصدرته Google في عام 2018، على مجموعة نصوص عادية فقط.2
BLOOM هو نموذج لغوي متعدد اللغات متاح للجميع ومدرَّب على 46 لغة. وهو نتيجة جهد تعاوني بين Hugging Face وBigScience، مجتمع من الباحثين في مجال الذكاء الاصطناعي.3
تُعَد Claude مجموعة نماذج الأساس التابعة لشركة Anthropic، وتتمتع بقدرات متقدمة في الاستدلال ومعالجة عدة لغات.
يُعَد GPT، نموذج الأساس من OpenAI، العمود الفقري لـ ChatGPT، روبوت المحادثة المدعوم بالذكاء الاصطناعي التوليدي التابع للشركة. يعمل GPT-3.5 على تشغيل الإصدار المجاني من ChatGPT، بينما يعتمد الإصدار المتميز على GPT-4. سلسلة GPT-4 هي أيضًا نموذج الذكاء الاصطناعي التوليدي الذي يدعم مساعد Copilot AI من Microsoft.
تُعَد Granite سلسلة نماذج الأساس اللغوية الكبيرة (LLM) الرائدة من IBM، والقائمة على بنية المحوِّل المدعومة بآلية فك التشفير فقط. تم تحسين نموذج الدردشة Granite 13b لاستخدامه في سيناريوهات الحوار، ويعمل بشكل جيد مع الوكلاء الافتراضيين وتطبيقات الدردشة. تم تدريب نموذج Granite متعدد اللغات لفهم النصوص وتوليدها بالإنجليزية والألمانية والإسبانية والفرنسية والبرتغالية.
يُعد PaLM 2 نموذج اللغة من الجيل التالي لدى Google، ويتمتع بقدرات محسَّنة في المعالجة متعددة اللغات والاستدلال.
في مجال الرعاية الصحية، يمكن أن يساعد نموذج الأساس على تنفيذ مجموعة من المهام. بدءًا من تلخيص زيارات المرضى والبحث في الأدبيات الطبية، ووصولًا إلى الإجابة عن أسئلة المرضى، ومطابقة المرضى مع التجارب السريرية، وتسهيل اكتشاف الأدوية. على سبيل المثال، يمكن للنموذج اللغوي Med-PaLM 2 الإجابة عن الأسئلة الطبية، وتعمل Google على تصميم نسخة متعددة الوسائط يمكنها دمج المعلومات من الصور الطبية.4
في مجال الروبوتات، يمكن لنماذج الأساس مساعدة الروبوتات على التكيف بسرعة مع بيئات جديدة وتعميم معرفتها عبر مهام وسيناريوهات وتجسيدات روبوتية مختلفة. على سبيل المثال، يعمل نموذج اللغة متعدد الوسائط المتجسد PaLM-E على نقل المعرفة من مجالات اللغة والصور في PaLM إلى أنظمة الروبوتات، ويتم تدريبه على بيانات أجهزة استشعار الروبوت.5
يمكن أن يساعد نموذج الأساس على إكمال وتصحيح الأخطاء وشرحها وإنشاء التعليمات البرمجية بلغات البرمجة المختلفة. وتشمل نماذج الأساس لتحويل النص إلى كود ما يلي: Claude من Anthropic، وCodey وPaLM 2 من Google، وعائلة Granite Code من IBM المدرَّبة على 116 لغة برمجة.
مع وجود هذا العدد الكبير من الخيارات، كيف يمكن للمؤسسات اختيار نموذج الأساس المناسب لتطوير الذكاء الاصطناعي؟ إليك إطار عمل مكوَّنًا من ست خطوات لاختيار نموذج الذكاء الاصطناعي يمكن أن يساعد على ذلك:
البناء على نماذج الأساس يمكن أن يؤدي إلى الأتمتة والابتكار داخل المؤسسات. وفيما يلي فوائد أخرى يمكن للشركات الحصول عليها من نماذج الأساس:
تسريع الوقت المناسب لتحقيق القيمة والتوسع: اعتماد النماذج القائمة يُلغي مرحلتَي التطوير والتدريب المسبق، ما يمكِّن الشركات من تخصيص النماذج المضبوطة بدقة ونشرها بسرعة.
الوصول إلى البيانات: لا تحتاج المؤسسات إلى تجميع كميات كبيرة من البيانات للتدريب المسبق، والتي قد لا تكون لديها الموارد للحصول عليها.
الدقة والأداء الأساسيين: لقد تم تقييم نماذج الأساس مسبقًا من حيث الدقة والأداء، ما يوفر نقطة انطلاق عالية الجودة.
انخفاض التكلفة: لن تحتاج الشركات إلى الإنفاق على الموارد اللازمة لإنشاء نموذج الأساس من الألف إلى الياء.
كما هو الحال مع نماذج الذكاء الاصطناعي الأخرى، لا تزال نماذج الأساس تواجه مخاطر الذكاء الاصطناعي. يُعَد هذا عاملًا يجب أخذه في الاعتبار بالنسبة للمؤسسات التي تفكِّر في نماذج الأساس باعتبارها التقنية التي تدعم مهام سير عملها الداخلية أو تطبيقات الذكاء الاصطناعي التجاري.
التحيز: يمكن للنموذج أن يتعلم من التحيز البشري الموجود في بيانات التدريب، وقد ينتقل هذا التحيز إلى مخرجات النماذج المضبوطة بدقة.
التكاليف الحاسوبية: لا يزال استخدام نماذج الأساس القائمة يتطلب ذاكرة كبيرة وأجهزة متقدمة مثل وحدات معالجة الرسومات (GPUs) وموارد حاسوبية أخرى لضبطها ونشرها وصيانتها.
خصوصية البيانات: قد يتم تدريب نماذج الأساس على البيانات التي تم الحصول عليها دون موافقة أو علم أصحابها. كن حذرًا عند إدخال البيانات في الخوارزميات لتجنُّب انتهاك حقوق الطبع والنشر للآخرين أو الكشف عن معلومات شخصية أو معلومات أعمال خاصة.
الأثر البيئي: يتطلب تدريب وتشغيل نماذج الأساس واسعة النطاق عمليات حوسبة مكثفة تستهلك الكثير من الطاقة، ما يساهم في زيادة انبعاثات الكربون واستهلاك المياه.
الهلوسة: يُعَد التحقق من نتائج نماذج الأساس للذكاء الاصطناعي أمرًا ضروريًا لضمان إنتاجها لمخرجات صحيحة من الناحية الواقعية.
احصل على رؤى منسقة حول أهم أخبار الذكاء الاصطناعي وأكثرها إثارةً للاهتمام. اشترِك في خدمة رسائل Think الإخبارية الأسبوعية. راجع بيان الخصوصية لشركة IBM.
تسريع عملية تسليم البرامج مع Bob، شريكك المدعوم بالذكاء الاصطناعي للتطوير الآمن والمدرك للأهداف.
يمكنك بسهولة تصميم مساعدي ووكلاء الذكاء الاصطناعي القابلين للتوسع وأتمتة المهام المتكررة وتبسيط العمليات المعقدة باستخدام IBM watsonx Orchestrate.
استفِد من الذكاء الاصطناعي في عملك بالاستعانة بخبرة IBM الرائدة في مجال الذكاء الاصطناعي ومحفظة حلولها التي ستكون بجانبك.
1 On the Opportunities and Risks of Foundation Models, Stanford Center for Research on Foundation Models and Stanford Institute for Human-Centered Artificial Intelligence, 2021
2 Open Sourcing BERT: State-of-the-Art Pre-training for Natural Language Processing, Google Research, 2 November 2018
3 BigScience Large Open-science Open-access Multilingual Language Model, Hugging Face, 6 July 2022
4 Med-PaLM, Google Research, Accessed 8 October 2024
5 PaLM-E: An embodied multimodal language model, Google Research, 10 March 2023