لم تشهد أي تقنية في تاريخ البشرية هذا القدر من الاهتمام في فترة زمنية قصيرة مثل الذكاء الاصطناعي التوليدي (Gen AI). تستثمر العديد من شركات التكنولوجيا الرائدة مليارات الدولارات في تدريب النماذج اللغوية الكبيرة (LLMs). لكن هل يمكن لهذه التقنية تبرير الاستثمار؟ هل يمكن أن ترتقي فعلًا إلى مستوى الضجة الإعلامية؟
في ربيع 2023 -وهو وقت طويل نسبيًا في مجال الذكاء الاصطناعي- أصدرت Goldman Sachs تقريرًا يقدِّر أن ظهور الذكاء الاصطناعي التوليدي قد يزيد الناتج المحلي الإجمالي العالمي بنسبة 7% سنويًا، أي ما يعادل أكثر من 7 تريليونات دولار أمريكي إضافية كل عام.
كيف يمكن للذكاء الاصطناعي التوليدي تحقيق ذلك؟ إن تطبيقات هذه التقنية عديدة، ولكن يمكن وصفها بشكل عام بأنها تحسين كفاءة الاتصال بين البشر والآلات. سيؤدي هذا التحسن إلى أتمتة المهام ذات المستوى المنخفض وتعزيز القدرات البشرية، ما يُتيح للعمال إنجاز المزيد بكفاءة أكبر.
بسبب التطبيقات الواسعة وتعقيدات الذكاء الاصطناعي التوليدي، قد تدفع العديد من التقارير الإعلامية القراء إلى الاعتقاد بأن هذه التقنية حل سحري شامل تقريبًا. في الواقع، ميَّز هذا المنظور معظم التغطية الإعلامية حول الذكاء الاصطناعي التوليدي مع إطلاق ChatGPT والأدوات الأخرى التي جعلت التقنية شائعة في 2022، حيث توقَّع بعض المحللين أننا على وشك تغيير جذري سيعيد تشكيل مستقبل العمل.
لم يمضِ على ذلك عامان، إلا إن الحماسة الإعلامية تجاه الذكاء الاصطناعي التوليدي قد هدأت قليلًا. في يونيو، أصدرت Goldman Sachs تقريرًا آخر بتقييم أكثر توازنًا، متسائلة عما إذا كانت فوائد الذكاء الاصطناعي التوليدي يمكن أن تبرّر الاستثمار البالغ تريليون دولار في تطويره. نشرت Financial Times، إلى جانب وسائل إعلام أخرى، مقال رأي يعكس وجهة نظر متشككة مماثلة. قام فريق رسائل IBM Think الإخبارية بتلخيص بعض هذه الشكوك والرد عليها في منشور سابق.
أدَّت تقلبات السوق المالية اللاحقة إلى إعلان عدد من المحللين أن "فقاعة الذكاء الاصطناعي" على وشك الانفجار، وأن تصحيحًا للسوق على نطاق انهيار شركات الإنترنت في التسعينيات قد يحدث.
يمكن تقسيم الشكوك الإعلامية حول الذكاء الاصطناعي التوليدي إلى أربع أزمات رئيسية يواجهها المطورون:
هذه عقبات جادة، لكن الكثيرين لا يزالون متفائلين بأن حل المشكلة الأخيرة (حالات الاستخدام) سيساعد على معالجة الثلاث الأخرى. الخبر السار هو أنهم بدأوا بالفعل بتحديد حالات استخدام ذات قيمة فعلية والعمل عليها.
يقول Chris Hay، المهندس المتميز بشركة IBM: "الذكاء الاصطناعي التوليدي يُحدِث تأثيرًا واضحًا وقابلًا للقياس علينا وعلى عملائنا، ويغيّر بشكل جوهري طريقة عملنا". "وهذا يشمل جميع الصناعات والتخصصات، بدءًا من تحويل عمليات الموارد البشرية وتحوُّلات التسويق عبر المحتوى الخاص بالعلامات التجارية ووصولًا إلى مراكز الاتصال أو تطوير البرمجيات". يعتقد Hay أننا في مرحلة تصحيحية غالبًا ما تلي فترة من الحماس المفرط، وربما يمكن اعتبار التشاؤم الإعلامي الأخير محاولة لموازنة التصريحات السابقة التي تبدو الآن، من منظور رجعي، وكأنها مبالغ فيها.
يقول Hay، في إشارة إلى أحد التنبؤات الأخيرة الأكثر تشاؤمًا بشأن مستقبل الذكاء الاصطناعي: "لا أريد أن أكون ذلك المحلل، ولا أن أكون الشخص الذي يقول: الذكاء الاصطناعي لن يفعل شيئًا مفيدًا خلال السنوات العشر القادمة، لأن هذا القول سيلاحقك طوال حياتك".
قد يتبين أن هذه التصريحات قصيرة النظر مثل الادعاءات التي قالت إن الإنترنت في بداياته لن يحقق الكثير، أو تخمين Thomas Watson، مؤسس IBM، في عام 1943 بأن العالم لن يحتاج لأكثر من خمسة أجهزة كمبيوتر. يرى Hay أن جزءًا من المشكلة يكمن في أن الإعلام غالبًا ما يربط الذكاء الاصطناعي التوليدي بتطبيق أضيق مثل روبوتات المحادثة المدعومة بالنماذج اللغوية الكبيرة مثل ChatGPT، والتي قد لا تكون بالفعل مجهزة لحل كل التحديات التي تواجه المؤسسات.
إذا بدأنا نواجه عوائق في الإمدادات -سواء في البيانات أم الحوسبة أم الطاقة- يرى Hay أن المهندسين سيبدعون لإيجاد حلول لهذه العوائق.
يقول Hay: "عندما تتوفر لديك وفرة من شيء ما، فإنك تستهلكه. إذا كان لديك مئات الآلاف من وحدات معالجة الرسومات متاحة، فسوف تستخدمها. ولكن عندما تكون لديك قيود، تصبح أكثر إبداعًا".
على سبيل المثال، تمثِّل البيانات الاصطناعية وسيلة واعدة للتغلب على أزمة البيانات. يتم إنشاء هذه البيانات بطريقة خوارزمية لمحاكاة خصائص البيانات الواقعية، ويمكن أن تُستخدم كبديل أو مكمِّل لها. بينما يجب على مهندسي التعلم الآلي توخي الحذر من الإفراط في استخدام البيانات الاصطناعية، قد يساعد النهج الهجين في التغلب على ندرة البيانات الواقعية على المدى القصير. على سبيل المثال، تم تدريب نماذج Microsoft PHI-3.5 الأخيرة أو نماذج Hugging Face SMOL باستخدام كميات كبيرة من البيانات الاصطناعية، ما أدى إلى إنتاج نماذج صغيرة عالية الكفاءة.
النماذج اللغوية الكبيرة اليوم تستهلك طاقة هائلة، لكن لا يوجد ما يدعو للاعتقاد أن البنى الحالية للمحوِّلات هي التصميم النهائي. تحظى النماذج القائمة على SSM، مثل Mistral Codestral Mamba وJamba 1.5 وFalcon Mamba 1.5، بشعبية متزايدة بفضل قدرتها على التعامل مع سياقات أطول. تكتسب البنى الهجينة التي تستخدم أنواعًا متعددة من النماذج شعبية أيضًا. بخلاف البنية المعمارية، يجد المهندسون قيمة في أساليب أخرى، مثل التحويل الكمّي (Quantization)، والشرائح المصممة خصيصًا للاستدلال، والضبط الدقيق، وهي تقنية في التعلم العميق تتضمن تكييف نموذج مدرَّب مسبقًا لحالات استخدام محددة.
يقول Hay: "أود أن أرى مزيدًا من التركيز على مجتمع الضبط الدقيق في الصناعة، بدلًا من مرحلة التدريب المسبق. فالتدريب المسبق هو الجزء الأكثر تكلفة في العملية". ويُعَد الضبط الدقيق أقل تكلفة بكثير، ومن المحتمل أن تتمكن من تحقيق قيمة أكبر منه".
يقترح Hay أنه في المستقبل، قد يكون لدينا عدد أكبر من وحدات معالجة الرسومات (GPU) مما نعرفه بما يجب أن نفعله لأن تقنياتنا أصبحت أكثر كفاءة. وقد قام مؤخرًا بتجربة تحويل كمبيوتر محمول شخصي إلى آلة قادرة على تدريب النماذج. ومن خلال إعادة بناء مسارات البيانات الأكثر كفاءة وتعديل التجميعات، فإنه يكتشف طرقًا للعمل ضمن القيود. كان بإمكانه فعل كل ذلك بشكل طبيعي على وحدة معالجة الرسومات H100 Tensor Core باهظة الثمن، لكن عقلية الندرة مكنته من إيجاد طرق أكثر كفاءة لتحقيق النتائج المطلوبة. كانت الحاجة أم الاختراع.
أصبحت النماذج أصغر حجمًا وأكثر قوة.
يقول Hay: "إذا نظرت إلى النماذج الصغيرة الحالية، فستجد أنها تدرَّبت على عدد أكبر من الرموز مقارنةً بالنماذج الكبيرة في العام الماضي. الناس يضعون عددًا أكبر من الرموز في النماذج الصغيرة، وهذه النماذج تصبح أكثر كفاءة وسرعة".
يقول Brent Smolinksi، الرئيس العالمي لاستراتيجية التكنولوجيا والبيانات والذكاء الاصطناعي في IBM: "عندما نفكر في تطبيقات الذكاء الاصطناعي لحل المشكلات الحقيقية للأعمال، نجد أن هذه النماذج المتخصصة تصبح أكثر أهمية". وتشمل هذه ما يُعرَف باسم النماذج الصغيرة للّغة والنماذج غير التوليدية، مثل نماذج التنبؤ، والتي تتطلب مجموعة بيانات أضيق نطاقًا. وفي هذا السياق، غالبًا ما تفوق جودة البيانات كميتها. بالإضافة إلى ذلك، تستهلك هذه النماذج المتخصصة طاقة أقل وتكون أسهل في التحكم بها.
ويضيف Smolinksi: "هناك الكثير من الأبحاث لتطوير خوارزميات أكثر كفاءة من حيث الحسابات". النماذج الأكثر كفاءة تعالج جميع الأزمات الأربع المقترحة: فهي تستهلك بيانات وطاقة وحوسبة أقل، وبفضل سرعتها تفتح فرصًا جديدة لحالات الاستخدام.
يقول Smolinksi: "النماذج اللغوية الكبيرة رائعة لأنها تتميز بواجهة محادثة طبيعية جدًا، وكلما زادت البيانات التي يتم إدخالها فيها، أصبح الحوار أكثر طبيعية". "لكن هذه النماذج اللغوية الكبيرة، عند استخدامها في مجالات أو مشكلات ضيقة النطاق، معرضة للعوائق، وهذه مشكلة حقيقية". لذلك، غالبًا ما يختار عملاؤنا النماذج اللغوية الصغيرة، وإذا لم تكن واجهة التفاعل مثالية تمامًا، فذلك مقبول، لأنه في بعض المشكلات لا تحتاج إلى أن تكون كذلك.
قد لا يكون الذكاء الاصطناعي التوليدي حلًا لكل شيء، لكنه أداة قوية ضمن أدواتنا. لنأخذ على سبيل المثال سير العمل الوكيل، الذي يُشير إلى نهج متعدد الخطوات لاستخدام النماذج اللغوية الكبيرة ووكلاء الذكاء الاصطناعي لأداء المهام. يتصرف هؤلاء العملاء بدرجة من الاستقلالية والقدرة على اتخاذ القرار، ويتفاعلون مع البيانات والأنظمة وأحيانًا الأشخاص، لإكمال المهام الموكلة إليهم. يمكن تصميم وكلاء متخصصين للتعامل مع مهام أو مجالات خبرة محددة، ما يوفر المعرفة والخبرة العميقة التي قد تفتقر إليها النماذج اللغوية الكبيرة. ويمكن لهؤلاء الوكلاء الاعتماد على بيانات أكثر تخصصًا أو دمج الخوارزميات والنماذج الخاصة بالمجال.
تخيَّل شركة اتصالات حيث يعمل سير العمل الوكيل تم تنسيقه بواسطة نموذج لغوي كبير على إدارة استفسارات دعم العملاء بكفاءة. عندما يقدِّم العميل طلبًا، يعمل النموذج اللغوي الكبير على معالجة الاستفسار وتصنيف المشكلة وتنشيط وكلاء محددين للتعامل مع المهام المختلفة. على سبيل المثال، يقوم وكيل واحد باسترجاع تفاصيل حساب العميل والتحقق من صحة المعلومات المقدمة، بينما يتولى وكيل آخر تشخيص المشكلة، مثل إجراء فحوصات على الشبكة أو مراجعة الفروقات في الفواتير.
عندما يتم تحديد المشكلة، يضع وكيل ثالث حلًا لها، سواء أكان ذلك إعادة ضبط الأجهزة أم تقديم استرداد مالي أو جدولة زيارة فني. بعد ذلك، يساعد النموذج اللغوي الكبير وكيل الاتصال على صياغة رد شخصي للعميل، ما يضمن وضوح الرسالة واتباعها لأسلوب العلامة التجارية للشركة. بعد حل المشكلة، يتم بدء تعليقات، حيث يجمع الوكيل آراء العملاء لتقييم مستوى رضاهم. إذا كان العميل غير راضٍ، فإن النموذج اللغوي الكبير يراجع التعليقات وقد يفعِّل إجراءات متابعة أخرى، مثل اتصال من وكيل بشري.
على الرغم من تعدد استخدامات النماذج اللغوية الكبيرة، فإنها قد تواجه صعوبة في المهام التي تتطلب خبرة عميقة في مجال محدد أو معرفة متخصصة، خاصةً عندما تقع هذه المهام خارج نطاق بيانات التدريب الخاصة بالنموذج. كما أنها بطيئة وغير مناسبة لاتخاذ القرارات في الوقت الفعلي في البيئات الديناميكية. في المقابل، يمكن للوكلاء العمل بشكل مستقل واستباقي، في الوقت الفعلي، وباستخدام خوارزميات أبسط لصناعة القرار.
على عكس النماذج اللغوية الكبيرة الأحادية والكبيرة، يمكن تصميم الوكلاء ليتمكنوا من التعلم والتكيّف مع بيئتهم. يمكنهم استخدام التعلم المعزز أو حلقات التعليقات لتحسين الأداء مع مرور الوقت، مع تعديل الاستراتيجيات بناءً على نجاح أو فشل المهام السابقة. تولِّد مهام سير العمل الوكيلة بيانات جديدة بحد ذاته، والتي يمكن استخدامها لاحقًا في التدريب الإضافي للنماذج.
يوضِّح هذا السيناريو أن النموذج اللغوي الكبير يشكِّل جزءًا مفيدًا من حل مشكلة أعمال، لكنه ليس الحل الكامل بمفرده. وهذه أخبار جيدة، لأن النموذج اللغوي الكبير غالبًا ما يكون الجزء الأكثر تكلفة في سلسلة القيمة.
يرى Smolinksi أن الناس غالبًا ما يبالغون عندما يتحمسون لتقنية جديدة. قد نظن أن تقنية جديدة ستحوِّل العالم، وعندما تفشل في ذلك، قد نصبح متشائمين بشكل مفرط.
يقول: "أعتقد أن الحل يكمن في الوسط"، مؤكدًا أن الذكاء الاصطناعي يجب أن يكون جزءًا من استراتيجية أوسع لحل مشكلات الأعمال. "عادةً لا يكون الذكاء الاصطناعي بمفرده، وحتى لو كان كذلك، فإنه غالبًا ما يستخدم عدة أنواع من نماذج الذكاء الاصطناعي معًا لحل المشكلة. لكن عليك أن تبدأ بالمشكلة. إذا كان هناك تطبيق للذكاء الاصطناعي يمكن أن يؤثِّر بشكل ملموس في قدرتك على اتخاذ القرار، ما يؤدي بدوره إلى تأثير مالي ملموس، فركِّز على تلك المجالات، ثم حدِّد كيفية تطبيق المجموعة المناسبة من التقنيات والذكاء الاصطناعي. استفِد من كل أدواتك المتاحة، وليس فقط النماذج اللغوية الكبيرة، بل من مجموعة الأدوات المتوفرة بأكملها".
بالنسبة لما يُعرَف باسم "أزمة حالات الاستخدام"، يثق Hay بأن المزيد من حالات الاستخدام المقنعة التي تبرر تكلفة هذه النماذج ستظهر قريبًا.
يقول: "إذا انتظرت حتى تصبح التقنية مثالية ودخلت السوق فقط بعد أن يستقر كل شيء، فهذه طريقة مؤكَّدة لتتعرض للاضطراب. لست متأكدًا من أنني سأخاطر بذلك".