نماذج الانتشار تتحدّى GPT مع ظهور الجيل التالي من الذكاء الاصطناعي

صورة من الخلف لشخص يتابع شاشة كمبيوتر بينما يكتب تعليمات برمجية.

مؤلف

Sascha Brodsky

Staff Writer

IBM

فئة جديدة من نماذج الذكاء الاصطناعي تنافس هيمنة الأنظمة من نمط GPT، وتَعِدُ ببدائل أسرع وأقل تكلفة، وربما أكثر قدرة أيضًا.

أصدرت شركة Inception Labs، وهي شركة ناشئة أسسها باحثون من جامعة Stanford، مؤخرًا Mercury، وهو نموذج لغوي قائم على أسلوب الانتشار (dLLM) يعمل على تنقيح عبارات كاملة دفعة واحدة، بدلًا من التنبؤ بالكلمات كلمةً تلو الأخرى. وعلى عكس النماذج اللغوية الكبيرة التقليدية (LLMs) التي تعتمد نهج الانحدار الذاتي، حيث تُولِّد كلمة واحدة في كل مرة استنادًا إلى النص السابق، تقوم نماذج الانتشار بتحسين النص بشكل تكراري عبر سلسلة من خطوات التنقيح.

تقول Stefano Ermon، أستاذ علوم الكمبيوتر في Stanford University والمؤسس المشارك لمختبرات Inception Labs، في حديثه إلى IBM Think: "النماذج اللغوية القائمة على الانتشار (dLLMs) توسّع حدود الممكن." ويضيف: "يقدّم Mercury سرعة وكفاءة غير مسبوقتين، ومن خلال الاستفادة من قدرة حوسبية أعلى في وقت الاختبار، ستضع نماذج dLLM معيارًا جديدًا للجودة وتُسهم في تحسين رضا العملاء عن تطبيقات الذكاء الاصطناعي الطرفي وتطبيقات المؤسسات."

ويرى Benjamin Hoover، مهندس في IBM Research، أن الاتجاه أصبح واضحًا، فيقول: "إنها مسألة عامين أو ثلاثة أعوام فقط قبل أن يبدأ معظم الناس في الانتقال إلى استخدام نماذج الانتشار. عندما اطّلعت على نموذج Inception Labs أدركت أن هذا التحول سيأتي عاجلًا لا آجلًا."

ميزة نموذج الانتشار

لا تعمل نماذج الانتشار وفق القواعد نفسها التي تحكم الذكاء الاصطناعي التقليدي. فالنماذج الانحدارية الذاتية مثل GPT تبني الجملة كلمة تلو الأخرى، إذ تتنبأ برمز مميز واحد في كل خطوة. فإذا كان النموذج يولّد العبارة الإنجليزية "To whom it may concern"، فإنه يتنبأ أولًا بكلمة "To"، ثم "whom"، ثم "it"، وهكذا، خطوة بعد أخرى. أمّا نماذج الانتشار فتعكس هذا الأسلوب. فهي لا تجمع النص بشكل تسلسلي، بل تبدأ بنسخة أولية مشوَّشة لمقطع كامل ثم تعمل على تنقيحه عبر عدة مراحل متتابعة. يشبه ذلك فنانًا يرسم مخططًا أوليًا عامًا للمشهد ثم يعود لصقل التفاصيل، بدلًا من رسم كل عنصر على حدة وبالترتيب. ومن خلال النظر إلى الجملة أو الفقرة كوحدة متكاملة في كل مرحلة، تستطيع نماذج الانتشار توليد استجابات أسرع، وغالبًا أكثر تماسكًا ودقة من مخرجات النماذج اللغوية الكبيرة (LLMs) التقليدية.

ويرى Hoover أن هذه التقنية تمثّل صيغة حديثة لفكرة معروفة، فيقول: "نماذج الانتشار في جوهرها آليات لتصحيح الأخطاء؛ فهي تبدأ بإدخال مليء بالأخطاء ثم تزيل هذه الأخطاء تدريجيًا إلى أن تصل إلى المخرج المطلوب."

تصميم ثلاثي الأبعاد لكرات تتدحرج على مسار

أحدث الأخبار والرؤى حول الذكاء الاصطناعي 


تتوفر معارف وأخبار منسقة بمهارة حول الذكاء الاصطناعي والسحابة وغيرها في نشرة Think الإخبارية الأسبوعية. 

اختراق حاجز اللغة

وقد استُخدمت نماذج الانتشار على نطاق واسع في توليد الصور؛ إذ تعتمد نماذج مثل DALL·E وStable Diffusion وMidjourney على تنقية صور مشوَّشة وتحويلها إلى مخرجات بصرية عالية الجودة. ومع ذلك، فإن تطبيق هذا النهج على النصوص أكثر صعوبة، لأن اللغة تتطلّب التزامًا صارمًا بقواعد النحو وبناء الجملة.

يقول Ermon: "لقد واجهت محاولات عديدة لاستخدام نماذج الانتشار في توليد النصوص صعوبات كبيرة في السابق. وما مكّن Mercury من النجاح حيث تعثّر الآخرون هو ابتكارات خاصة في كلٍّ من خوارزميات التدريب وخوارزميات الاستدلال." وعلى عكس الصور، التي يمكن تنقيتها تدريجيًا حتى تتخذ أشكالًا يمكن التعرّف عليها، تخضع اللغة لقواعد نحوية صارمة تجعل عملية التنقيح التكراري أكثر تعقيدًا.

يشير Hoover إلى نموذج Mercury من Inception Labs بوصفه مثالًا بارزًا على كيفية تمكّن نماذج الانتشار من تضييق الفجوة، موضحًا: "هذا النموذج أثبت أن النماذج المعتمدة على الانتشار قادرة على المنافسة، بل إنه في الواقع أسرع وأكثر كفاءة من نماذج الانحدار الذاتي المماثلة."

مستقبل نماذج الانتشار

ويمكن أن تؤدي الكفاءة التي تحققها النماذج اللغوية الكبيرة المعتمدة على الانتشار (dLLMs) إلى تغيير معادلة نشر حلول الذكاء الاصطناعي، خصوصًا في تطبيقات المؤسسات التي تمثّل فيها التكلفة والسرعة عاملين حاسمين. فالنماذج اللغوية الكبيرة التقليدية تتطلّب قدرة حوسبية ضخمة، ما يجعل تشغيلها عالي التكلفة، في حين تعد نماذج الانتشار بتقديم أداء مماثل أو أفضل بكثير، وبتكلفة أقل بكثير. وغالبًا ما تكون نماذج الانتشار أكثر كفاءة لأنها تنقّح متتاليات نصية كاملة بالتوازي، بدلًا من توليد كل كلمة على حدة كما هو الحال في النماذج اللغوية الكبيرة التقليدية، وهو ما يقلّل النفقات الحوسبية.

يقول Ermon: "عملاؤنا والمتبنّون الأوائل يطوّرون حاليًا تطبيقات مدعومة بنماذج dLLM في مجالات تشمل دعم العملاء والمبيعات والألعاب. وهم يجعلون تطبيقاتهم أكثر استجابة، وأكثر ذكاءً، وأقل تكلفة."

ويرى Hoover أن الأثر قد يكون أوسع من ذلك، فيوضح: "في الوقت الحالي، يُقَيَّد الذكاء الاصطناعي باستهلاك الطاقة؛ فالنماذج الكبيرة تستهلك كميات هائلة من الطاقة. أما نماذج الانتشار فتعمل بطريقة مختلفة، تتيح تحقيق مستويات أعلى بكثير من الكفاءة." على المدى البعيد، قد نشهد أنظمة ذكاء اصطناعي قائمة على نماذج الانتشار تعمل على عتاد تناظري، بما يخفض تكاليف الطاقة بدرجة كبيرة.

الحوسبة التناظرية، التي تعالج المعلومات باستخدام إشارات كهربائية مستمرة بدلًا من العمليات الثنائية، طُرحت منذ زمن بعيد باعتبارها حلًا محتملًا لمعضلة استهلاك الطاقة في أنظمة الذكاء الاصطناعي. ويرى Hoover أن نماذج الانتشار ملائمة بصورة خاصة لهذا النهج، فيقول:

"هذه النماذج قابلة للتفسير بطبيعتها. وهذا يعني أنه يمكننا إسقاط عملياتها الداخلية مباشرة على دوائر تناظرية، وهو أمر يصعب تحقيقه كثيرًا مع بنيات التعلّم العميق التقليدية."

أكاديمية الذكاء الاصطناعي

كن خبيرًا في الذكاء الاصطناعي

اكتسب المعرفة لتحديد أولويات استثمارات الذكاء الاصطناعي التي تدفع نمو الأعمال. ابدأ مع أكاديمية الذكاء الاصطناعي المجانية اليوم وتولَّ زمام المبادرة لتعزيز مستقبل الذكاء الاصطناعي في مؤسستك.

حلول ذات صلة
IBM watsonx.ai

تدريب الذكاء الاصطناعي التوليدي والتحقق من صحته وضبطه ونشره، وكذلك قدرات نماذج الأساس والتعلم الآلي باستخدام IBM watsonx.ai، وهو استوديو الجيل التالي من المؤسسات لمنشئي الذكاء الاصطناعي. أنشئ تطبيقات الذكاء الاصطناعي بسرعة أكبر وببيانات أقل.

اكتشف watsonx.ai
حلول الذكاء الاصطناعي

استفد من الذكاء الاصطناعي في عملك بالاستعانة بخبرة IBM الرائدة في مجال الذكاء الاصطناعي ومحفظة حلولها المتوفرة لك.

استكشف حلول الذكاء الاصطناعي
خدمات الذكاء الاصطناعي

أعدّ ابتكار عمليات ومهام سير العمل الحساسة بإضافة الذكاء الاصطناعي لتعزيز التجارب وصنع القرارات في الوقت الفعلي والقيمة التجارية.

استكشف خدمات الذكاء الاصطناعي
اتخِذ الخطوة التالية

احصل على وصول شامل إلى القدرات التي تغطي دورة حياة تطوير الذكاء الاصطناعي. تمكَّن من إنتاج حلول ذكاء اصطناعي قوية بفضل الواجهات سهلة الاستخدام وعمليات سير العمل السلسة وإمكانية الوصول إلى واجهات برمجة التطبيقات ومجموعات تطوير البرامج القياسية في الصناعة.

استكشف watsonx.ai احجز عرضًا توضيحيًا مباشرًا