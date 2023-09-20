تمثّل نماذج الأساس (FMs) بداية حقبة جديدة في التعلم الآلي (ML) والذكاء الاصطناعي (AI)، مما يتيح تطويرًا أسرع لنماذج الذكاء الاصطناعي القابلة للتكييف مع مجموعة واسعة من المهام اللاحقة وضبطها بدقة لمجموعة متنوعة من التطبيقات.
ومع تزايد أهمية معالجة البيانات في موضع تنفيذ الأعمال، يتيح تشغيل نماذج الذكاء الاصطناعي على حافة المؤسسة تقديم تنبؤات شبه لحظية مع الالتزام بمتطلبات سيادة البيانات والخصوصية.ومن خلال الجمع بين قدرات IBM watsonx الخاصة بنماذج الأساس (FMs) وحوسبة الحافة، يمكن للمؤسسات تشغيل أحمال تشغيل الذكاء الاصطناعي الخاصة بالضبط الدقيق لنماذج الأساس وعمليات الاستدلال بها على الحافة التشغيلية. ويسمح ذلك للمؤسسات بتوسيع نطاق نشر حلول الذكاء الاصطناعي على الحافة، مع تقليل وقت وتكلفة النشر وتحقيق أزمنة استجابة أسرع.
تُدرَّب نماذج الأساس (FMs) على مجموعات كبيرة من البيانات غير الموسومة على نطاق واسع، وهي تقود تطبيقات الذكاء الاصطناعي (AI) المتقدّمة. يمكن تكييفها مع مجموعة واسعة من المهام النهائية وضبطها بدقة لمجموعة من التطبيقات. نماذج الذكاء الاصطناعي الحديثة، التي تُنفِّذ مهام محددة ضمن مجال واحد، بدأت تفسح المجال لنماذج الأساس (FMs)، لأنها تتعلّم بصورة أكثر عمومية وتعمل عبر مجالات ومشكلات متعددة. كما يوحي الاسم، يمكن أن يشكّل نموذج الأساس (FM) قاعدة للعديد من تطبيقات نماذج الذكاء الاصطناعي.
وتُسهم نماذج الأساس في معالجة تحدّيين رئيسيين كانا يعيقان المؤسسات عن توسيع نطاق اعتماد الذكاء الاصطناعي. أولًا، تنتج المؤسسات كميات هائلة من البيانات غير الموسومة، ولا يُوسَم منها إلا جزء محدود لاستخدامه في تدريب نماذج الذكاء الاصطناعي. ثانيًا، تُعَد مهمة وسم البيانات وإضافة الشروح لها مهمة كثيفة الاعتماد على الجهد البشري، وغالبًا ما تتطلّب مئات الساعات من وقت الخبراء المتخصّصين في المجال (SMEs). وهذا ما يجعل توسيع النطاق عبر حالات الاستخدام مكلفًا للغاية، لأنه سيتطلّب أعدادًا كبيرة من خبراء المجال وخبراء البيانات. ومن خلال استيعاب كميات هائلة من البيانات غير الموسومة واستخدام تقنيات التعلم الآلي الخاضع للإشراف الذاتي لتدريب النماذج، أزالت نماذج الأساس (FMs) هذه الاختناقات وفتحت الطريق أمام اعتماد الذكاء الاصطناعي على نطاق واسع في مختلف أقسام المؤسسة. وهذه الكميات الهائلة من البيانات الموجودة في كل نشاط تجاري لا تزال تنتظر إطلاق إمكاناتها لتوليد رؤى معمّقة للأعمال.
النماذج اللغوية الكبيرة (LLMs) هي فئة من نماذج الأساس (FMs) تتكوّن من طبقات من الشبكات العصبية التي جرى تدريبها على هذه الكميات الهائلة من البيانات غير المعنونة. وتستخدم هذه النماذج خوارزميات التعلم الآلي الخاضع للإشراف الذاتي لتنفيذ مجموعة متنوعة من مهام معالجة اللغة الطبيعية (NLP) بطرق تشبه إلى حد كبير طريقة استخدام البشر للغة (انظر الشكل 1).
هناك عدة خطوات لبناء ونشر نموذج أساس (FM). وتشمل هذه الخطوات استيعاب البيانات، واختيار البيانات، والمعالجة المسبقة للبيانات، والتدريب المسبق لنموذج الأساس (FM)، وضبط النموذج لمهمة لاحقة أو أكثر، وتشغيل عمليات الاستدلال، وإدارة البيانات ونماذج الذكاء الاصطناعي وإدارة دورة حياتها — وهي مجتمعة تُعرَف باسم FMOps.
وللمساعدة في كل ما سبق، توفّر IBM للمؤسسات الأدوات والقدرات اللازمة للاستفادة من قوة هذه نماذج الأساس (FMs) عبر محفظة منتجات الذكاء الاصطناعي IBM watsonx، المصمَّمة لمضاعفة تأثير الذكاء الاصطناعي على مستوى المؤسسة بأكملها. يتكوّن IBM watsonx من المكوّنات التالية:
اتجاه رئيسي آخر هو الأهمية المتزايدة للحوسبة على حافة المؤسسة، مثل المواقع الصناعية، وأرضيات التصنيع، ومتاجر التجزئة، ومواقع حافة مزوّدي الاتصالات، وغيرها. وبشكل أكثر تحديدًا، يتيح الذكاء الاصطناعي على حافة المؤسسة معالجة البيانات في موضع تنفيذ الأعمال لإجراء تحليلات في زمن شبه حقيقي. تُعتبَر حافة المؤسسة الموقع الذي تُولَّد فيه كميات هائلة من بيانات المؤسسات، حيث يمكن للذكاء الاصطناعي أن يقدّم رؤى أعمال قيّمة وفي الوقت المناسب وقابلة للتنفيذ.
ويُتيح تشغيل نماذج الذكاء الاصطناعي على الحافة تقديم تنبؤات في زمن شبه حقيقي، مع الالتزام بمتطلبات سيادة البيانات والخصوصية. ويقلّل ذلك بشكل كبير من زمن الانتقال المرتبط عادةً بجمع بيانات الفحص ونقلها وتحويلها ومعالجتها. ويسمح العمل على الحافة بحماية بيانات المؤسسة الحسّاسة وتقليل تكاليف نقل البيانات، مع تحقيق أزمنة استجابة أسرع.
ومع ذلك، فإن توسيع نطاق نشر حلول الذكاء الاصطناعي على الحافة ليس مهمة سهلة في ظل التحديات المتعلقة بالبيانات (تنوّعها، وحجمها، والمتطلبات التنظيمية) والقيود المفروضة على الموارد (القدرة الحاسوبية، والاتصال الشبكي، والتخزين، وحتى مهارات تكنولوجيا المعلومات). ويمكن تصنيف هذه التحديات بشكل عام في فئتين:
طوّرت IBM بنيةً للحافة تعالج هذه التحديات من خلال تقديم نموذج جهاز متكامل يجمع بين المكوّنات المادية والبرمجية (HW/SW) لعمليات نشر الذكاء الاصطناعي على الحافة. وتتكوّن هذه البنية من عدة مفاهيم رئيسية تسهم في تعزيز قابلية التوسع في عمليات نشر الذكاء الاصطناعي:
ويمكن الاستفادة من بنية موزّعة بنموذج المحور والأطراف (hub-and-spoke) لتوسيع نطاق عمليات نشر الذكاء الاصطناعي المؤسسية على الحافة، حيث يعمل مركز بيانات سحابي مركزي أو مركز بيانات المؤسسة كمحور، بينما يعمل جهاز حافة متكامل (edge-in-a-box appliance) كنقطة طرفية في موقع الحافة.ويوضّح نموذج المحور والأطراف، الممتد عبر بيئات السحابة الهجينة وبيئات الحافة، بشكل أفضل التوازن المطلوب للاستفادة المثلى من الموارد اللازمة لعمليات نماذج الأساس (FMs) (انظر الشكل 2).
إن التدريب المسبق لهذه النماذج اللغوية الكبيرة الأساسية (LLMs) وأنواع أخرى من نماذج الأساس، باستخدام تقنيات التعلم الآلي الخاضع للإشراف الذاتي على مجموعات ضخمة من البيانات غير الموسومة، يتطلّب في العادة موارد حوسبية كبيرة (وحدات معالجة رسوميات "GPUs")، ويُفضَّل تنفيذه في طبقة المحور. وتتيح الموارد الحوسبية شبه غير المحدودة وأكوام البيانات الضخمة المخزّنة غالبًا في السحابة إجراء التدريب المسبق للنماذج ذات الأعداد الكبيرة من المعلمات، وتحقيق تحسين مستمر في دقة هذه النماذج الأساسية من نماذج الأساس.
من ناحية أخرى، يمكن ضبط نماذج الأساس (FMs) هذه للمهام اللاحقة — التي لا تتطلّب سوى بضع عشرات أو مئات من عينات البيانات الموسومة وخدمات الاستدلال — باستخدام عدد محدود فقط من وحدات معالجة الرسوميات (GPUs) على حافة المؤسسة. ويتيح ذلك بقاء البيانات الحسّاسة المُعنونة (أو ما يُعرف ببيانات الأصول الجوهرية للمؤسسة) داخل البيئة التشغيلية للمؤسسة بأمان، مع تقليل تكاليف نقل البيانات في الوقت نفسه.
وباستخدام نهج متكامل لتطبيقات الحافة يشمل الواجهة الأمامية والخلفية للتطبيقات (Full Stack)، يمكن لعالم البيانات تنفيذ الضبط الدقيق للنماذج، ثم اختبارها ونشرها. ويمكن إنجاز ذلك كلّه ضمن بيئة واحدة، مما يقلِّص دورة حياة التطوير اللازمة لتقديم نماذج ذكاء اصطناعي جديدة إلى المستخدمين النهائيين. وتوفّر منصّات مثل Red Hat OpenShift Data Science (RHODS) وRed Hat OpenShift AI، الذي أُعلن عنه مؤخرًا، أدوات تمكِّن من التطوير والنشر السريعين لنماذج ذكاء اصطناعي جاهزة للإنتاج في بيئات سحابية موزَّعة وبيئات الحافة.
وأخيرًا، فإن تشغيل نموذج الذكاء الاصطناعي المضبوط بدقة على حافة المؤسسة يقلِّل بشكل كبير من زمن الانتقال المرتبط عادةً بجمع البيانات ونقلها وتحويلها ومعالجتها. إن فصل مرحلة التدريب المسبق في السحابة عن مرحلتي الضبط الدقيق والاستدلال على الحافة يخفِّض التكلفة التشغيلية الإجمالية، من خلال تقليل الوقت اللازم وتكاليف نقل البيانات المرتبطة بأي مهمة استدلال (انظر الشكل 3).
ولإثبات قيمة هذا الطرح من البداية إلى النهاية، جرى ضبط نموذج أساس تجريبي للبنية التحتية المدنية يستند إلى نموذج Vision Transformer، بعد تدريبه مسبقًا باستخدام مجموعات بيانات عامة وأخرى مخصَّصة للصناعة، ثم نشره لتنفيذ عمليات الاستدلال على مجموعة حافة مكوَّنة من ثلاث عُقد (spoke). وشملت مجموعة البرمجيات Red Hat OpenShift Container Platform وRed Hat OpenShift Data Science. وكانت مجموعة الحافة هذه متصلة أيضًا بمثيل يعمل في السحابة من حل Red Hat Advanced Cluster Management for Kubernetes (RHACM).
تم تنفيذ التوفير القائم على السياسات بدون تدخل يدوي باستخدام Red Hat Advanced Cluster Management for Kubernetes (RHACM) وذلك عبر السياسات ووسوم التوزيع، التي تربط مجموعات الحافة المحددة بمجموعة من عناصر البرمجيات والتكوينات. وقد جرى تثبيت هذه العناصر البرمجية — التي تمتد عبر كامل المجموعة التقنية وتشمل الحوسبة والتخزين والشبكات وأحمال تشغيل الذكاء الاصطناعي — باستخدام مشغلات OpenShift، إلى جانب تزويد خدمات التطبيقات المطلوبة، وتكوين تخزين S3 Bucket.
تم ضبط نموذج الأساس المدرَّب مسبقًا (FM) للبنية التحتية المدنية باستخدام Jupyter Notebook ضمن Red Hat OpenShift Data Science (RHODS)، وذلك بالاعتماد على بيانات موسومة لتصنيف ستة أنواع من العيوب المكتشفة في الجسور الخرسانية. كما جرى عرض تقديم الاستدلال لهذا النموذج المضبوط باستخدام خادم Triton. وإضافة إلى ذلك، أُتيحت مراقبة الحالة التشغيلية لنظام الحافة من خلال تجميع مؤشرات قابلية الملاحظة من مكونات العتاد والبرمجيات عبر Prometheus، وعرضها ضمن لوحة المعلومات المركزية في RHACM على السحابة. يمكن لمؤسسات البنية التحتية المدنية نشر نماذج الأساس هذه في مواقع الحافة الخاصة بها، واستخدام صور الطائرات بدون طيار لاكتشاف العيوب في زمن شبه حقيقي، مما يسرّع الوصول إلى الرؤى التشغيلية ويخفض تكلفة نقل كميات كبيرة من البيانات عالية الدقة من السحابة وإليها.
ويتيح الجمع بين قدرات IBM watsonx الخاصة بنماذج الأساس (FMs) وجهاز حافة متكامل (edge-in-a-box) للمؤسسات تشغيل أحمال تشغيل الذكاء الاصطناعي الخاصة بضبط النماذج والاستدلال عليها مباشرة في بيئات الحافة التشغيلية. يستطيع هذا الجهاز التعامل مع حالات استخدام معقدة مباشرة دون إعدادات إضافية، كما يؤسس نموذج hub-and-spoke للإدارة المركزية، والأتمتة، والخدمة الذاتية. وبفضل ذلك، يمكن تقليص زمن نشر نماذج الأساس على الحافة من أسابيع إلى ساعات، مع تحقيق موثوقية أعلى وأمان أفضل ونتائج قابلة للتكرار.
