نحن نقف على أعتاب ثورة الذكاء الاصطناعي. على مدار العقد الماضي، نشأ التعلم العميق من التصادم الزلزالي بين توفر البيانات وقوة الحوسبة الهائلة، ما مكَّن مجموعة من قدرات الذكاء الاصطناعي المذهلة. لكننا واجهنا تحديًا متناقضًا: فالأتمتة تتطلب عمالة مكثفة. قد يبدو الأمر وكأنه مزحة ولكنه ليس كذلك، ويعلم أي شخص حاول حل مشكلات الأعمال باستخدام الذكاء الاصطناعي ذلك.
على الرغم من قوة أدوات الذكاء الاصطناعي التقليدية، فإنها قد تكون باهظة الثمن وتستغرق وقتًا طويلاً ويصعب استخدامها. يجب جمع البيانات بعناية وتنسيقها وتصنيفها بتعليقات توضيحية خاصة بالمهمة لتدريب نماذج الذكاء الاصطناعي. يتطلب بناء نموذج مهارات متخصصة يصعب العثور عليها — وتتطلب كل مهمة جديدة تكرار العملية. ونتيجة لذلك، ركزت الشركات بشكل أساسي على أتمتة المهام التي تتسم بوجود بيانات وفيرة وقيمة أعمال عالية، تاركة كل شيء آخر دون اهتمام. لكن بدأ هذا يتغير.
أدّى ظهور المحولات وطرائق التعلّم الآلي الخاضع للإشراف الذاتي إلى إتاحة الاستفادة من كميات هائلة من البيانات غير المُصنَّفة، مما مهّد الطريق لنماذج كبيرة مُدرَّبة مسبقًا تُعرَف أحيانًا باسم "نماذج الأساس". وقد أسهمت هذه النماذج الكبيرة في خفض التكاليف وتقليل الجهد المطلوب لعمليات الأتمتة.
توفر نماذج الأساس أساسًا قويًا ومتعدد الاستخدامات لمجموعة متنوعة من تطبيقات الذكاء الاصطناعي. يمكننا استخدام نماذج الأساس لأداء المهام بسرعة ببيانات مصنفة محدودة وبأقل جهد؛ وفي بعض الحالات، نحتاج فقط إلى وصف المهمة للنموذج بهدف تشجيعه على حلها.
لكن هذه التقنيات القوية تفرض أيضًا مخاطر وتحديات جديدة على المؤسسات. يتم تدريب العديد من النماذج الحالية على مجموعات بيانات غير معروفة الجودة والمصدر، ما يؤدي إلى استجابات مسيئة أو متحيزة أو غير صحيحة من الناحية الواقعية. إن النماذج الأكبر حجمًا باهظة الثمن وتستهلك الكثير من الطاقة في التدريب والتشغيل، كما أنها معقدة في النشر.
لقد طورنا في IBM نهجًا يتناول التحديات الأساسية لاستخدام نماذج الأساس للمؤسسات. اليوم، أعلنا عن watsonx.ai، وهو بوابة IBM لأحدث أدوات الذكاء الاصطناعي وتقنياته الموجودة في السوق اليوم. وفي شهادة على مدى سرعة تحرك هذا المجال، فإن بعض الأدوات لا يتجاوز عمرها أسابيع، ونحن نضيف أدوات جديدة أثناء كتابتي لهذه السطور.
ما يشتمل عليه حلّ watsonx.ai — بوصفه جزءًا من مجموعة عروض watsonx الأشمل من IBM التي أُعلن عنها هذا الأسبوع — متنوّع وسيواصل التطوّر، غير أن وعدنا الرئيسي يظل واحدًا: تقديم منتجات أتمتة آمنة ومن فئة المؤسسات.
ويمثّل ذلك جزءًا من عملنا المستمر في IBM لتسريع رحلة عملائنا لاستخلاص القيمة من هذا النموذج الجديد في الذكاء الاصطناعي. سأستعرض هنا عملنا لبناء حزمة من نماذج الأساس من فئة المؤسسات والمدرَّبة من IBM، بما في ذلك نهجنا في بنى البيانات وبنى النماذج. كما سأستعرض محفظتنا الجديدة وأدواتنا التي تُمكِّن المؤسسات من بناء ونشر حلول قائمة على نماذج الأساس، باستخدام مجموعة واسعة من النماذج مفتوحة المصدر، بالإضافة إلى نماذجنا الخاصة.
إن جودة البيانات مهمة. من الطبيعي أن يميل نموذج الذكاء الاصطناعي المدرب على بيانات متحيزة إلى إنتاج مخرجات متحيزة. تتفاقم هذه المشكلة في عصر نماذج الأساس، حيث تأتي البيانات المستخدمة للتدريب عادةً من مصادر متعددة، وتكون وفيرة لدرجة أنه لا يمكن لأي إنسان تدقيقها بشكل معقول.
نظرًا لأن البيانات هي الوقود الذي يغذّي نماذج الأساس، فقد ركّزنا في IBM على تنسيق كل ما يدخل في هذه النماذج بعناية فائقة. لقد طوّرنا أدوات مدعومة بالذكاء الاصطناعي لتصفية بياناتنا بشكل صارم من مظاهر خطاب الكراهية والألفاظ النابية، ومن أي قيود متعلقة بالترخيص أو مظاهر التحيّز. وعند رصد بيانات غير مقبولة، نقوم بإزالتها، وإعادة تدريب النموذج، ثم نكرر هذه العملية.
إن تنظيم البيانات مهمة لا تنتهي أبدًا. نحن نعمل على تطوير أساليب جديدة لتحسين جودة البيانات وضوابطها وتحسينها، وذلك لتلبية مجموعة متطورة من المتطلبات القانونية والتنظيمية. لقد أنشأنا إطار عمل لتتبع البيانات غير المنسقة التي تم تنظيمها والأساليب المستخدمة والنماذج التي لمستها كل نقطة بيانات.
نواصل جمع بيانات عالية الجودة للمساعدة في معالجة بعض من أكثر تحديات الأعمال إلحاحًا عبر مجالات متنوّعة مثل المالية والقانون والأمن السيبراني والاستدامة. ونحن نستهدف حاليًا أكثر من تيرابايت واحد من النصوص المنسَّقة بعناية لتدريب نماذج الأساس لدينا، بالإضافة إلى تعليمات برمجية منسَّقة، وبيانات الأقمار الصناعية، وبيانات وسجلات أحداث شبكات تكنولوجيا المعلومات.
يعمل IBM Research أيضًا على تطوير تقنيات لغرس الثقة طوال دورة حياة نموذج الأساس، لتقليل التحيز وتحسين سلامة النموذج. ويشمل عملنا في هذا المجال برنامج FairIJ، الذي يحدد نقاط البيانات المتحيزة في البيانات المستخدمة لضبط النموذج، بحيث يمكن تحريرها. وتتيح لنا طرق أخرى -مثل إعادة برمجة العدالة- إمكانية التخفيف من أوجه التحيز في النموذج حتى بعد تدريبه.
يقدم استوديو watsonx.ai® الجديد من شركة IBM مجموعة من نماذج الأساس التي تهدف إلى تقديم قيمة مؤسسية. وقد تم دمجها في مجموعة من منتجات IBM التي سيتم توفيرها لعملاء IBM في الأشهر القادمة.
إدراكًا منا بأنه لا يمكن لحل واحد أن يناسب الجميع، فإننا نبني عائلة من نماذج الأساس للغة والكود البرمجي بأحجام وهياكل مختلفة. تحمل كل عائلة من النماذج اسمًا رمزيًا مستوحى من علم الجيولوجيا —الجرانيت والحجر الرملي والأوبسيديان والأردواز — ما يجمع بين الابتكار المتطور من IBM ومجتمع البحث المفتوح. يمكن تخصيص كل نموذج لمجموعة من مهام المؤسسة.
تعتمد نماذج Granite على هيكلية قائمة على أداة فك التشفير فقط (Decoder-only)، تشبه GPT، وتُستخدم لمهام الذكاء الاصطناعي التوليدي. تستخدم نماذجSandton هيكلية المشفّر/فكّ التشفير (Encoder-Decoder)، وهي مناسبة تمامًا لعمليات الضبط الدقيق على مهام مُحدَّدة، قابلة للتبديل مع نماذج T5 الشائعة من Google. تعتمد نماذج Obsidian على هيكلية معيارية جديدة طوّرتها IBM Research، وتوفّر كفاءة عالية في استدلال النماذج (Inference) وأداءً قويًا عبر مجموعة واسعة من المهام. يشير Slate إلى عائلة من النماذج القائمة على المشفّر فقط (Encoder-only) (المستندة إلى RoBERTa). وعلى الرغم من أنها ليست توليدية، فإنها تُعد سريعة وفعّالة للعديد من مهام معالجة اللغة الطبيعية المؤسسية. جميع نماذج watsonx.ai مُدرّبة على بحيرة بيانات مركزة على المؤسسات تم تنظيمها من قِبل IBM، على حاسوبنا الذكاء الاصطناعي الفائق المصمم خصيصا للسحابة الأصلية، Vela.
تُعَد الكفاءة والاستدامة من المبادئ الجوهرية في تصميم watsonx.ai. في IBM Research، ابتكرنا تقنيات جديدة لتدريب النماذج بكفاءة، من بينها خوارزمية "LiGO" التي تعيد استخدام النماذج الصغيرة وتُنمّيها لتصبح نماذج أكبر. يمكن أن توفّر هذه الطريقة ما بين 40% و70% من الوقت والتكلفة وانبعاثات الكربون اللازمة لتدريب النموذج. ولتحسين سرعات الاستدلال، نستفيد من خبرتنا العميقة في التكميم، أي تقليص النماذج من تمثيل الأعداد ذات الفاصلة العائمة بدقة 32-بت إلى صيغ أعداد صحيحة أصغر بكثير. إن خفض دقّة نماذج الذكاء الاصطناعي يحقق مكاسب كبيرة في الكفاءة دون التضحية بمستوى الدقّة. ونأمل قريبًا تشغيل هذه النماذج المضغوطة على رقاقة الذكاء الاصطناعي المحسّنة لدينا IBM AIU.
الجزء الأخير من نموذج الأساس هو إنشاء برنامج سهل الاستخدام لضبط النماذج ونشرها. تم تحسين مجموعة الاستدلال السحابية الأصلية من IBM، والمبنية على RedHat OpenShift، لتدريب نماذج الأساس وخدمتها. يمكن للمؤسسات الاستفادة من مرونة OpenShift لتشغيل النماذج من أي مكان، بما في ذلك محليًا.
لقد أنشأنا مجموعة من الأدوات في watsonx.ai توفر للعملاء واجهة مستخدم سهلة الاستخدام ومكتبات سهلة الاستخدام للمطورين لبناء حلول قائمة على نموذج الأساس. تتيح خدمة Prompt Lab لدينا للمستخدمين أداء مهام الذكاء الاصطناعي بسرعة من خلال بعض الأمثلة التي تم تصنيفها. يتيح Tuning Studio إمكانية تخصيص النموذج بشكل سريع وقوي باستخدام بياناتك الخاصة، استنادًا إلى تقنيات الضبط الدقيق الفعالة الحديثة التي طورتها IBM Research.
وبالإضافة إلى نماذج IBM نفسها، يوفّر watsonx.ai وصولًا سلسًا إلى مجموعة واسعة من النماذج مفتوحة المصدر، تتيح للمؤسسات تجربتها وتطويرها بسرعة على نحو تكراري. وفي إطار شراكة جديدة مع Hugging Face، ستوفّر IBM عبر watsonx.ai آلاف نماذج الأساس ومجموعات البيانات والمكتبات مفتوحة المصدر من Hugging Face. ومن جانبها، ستقدّم Hugging Face جميع نماذج IBM وأدواتها المملوكة ومفتوحة الوصول على منصة watsonx.ai.
ولتجربة نموذج جديد، يكفي أن تختاره من القائمة المنسدلة. يمكنك التعرّف على المزيد حول الاستوديو من خلال هذا الرابط.
تغير نماذج الأساس مشهد الذكاء الاصطناعي، وقد تسارعت وتيرة التقدم في السنوات الأخيرة. نحن في IBM متحمسون للمساعدة في رسم حدود هذا المجال سريع التطور وتحويل الابتكار إلى قيمة حقيقية للمؤسسة.