أحدث اتجاهات الذكاء الاصطناعي، يقدمها لك الخبراء
احصل على رؤى منسقة حول أهم أخبار الذكاء الاصطناعي وأكثرها إثارةً للاهتمام. اشترِك في خدمة رسائل Think الإخبارية الأسبوعية. راجع بيان الخصوصية لشركة IBM.
ودورة حياة الذكاء الاصطناعي هي عملية منظمة وتكرارية تشمل تخطيط أنظمة الذكاء الاصطناعي وتدريبها ونشرها وصيانتها. ولا تقتصر هذه الدورة على تدريب نماذج التعلم الآلي فحسب، بل تشمل أيضًا جمع بيانات التدريب وإعدادها، والأنظمة المخصصة لتقييم أداء النماذج وتحسينه، ودمج النماذج المُدرَّبة في تطبيقات الذكاء الاصطناعي العملية.
وتشمل دورة حياة الذكاء الاصطناعي كل شيء، بدءًا من القرار الأولي باستخدام الذكاء الاصطناعي لحل مشكلة محددة، ووصولًا إلى الاستخدام الفعلي لنموذج مُدرَّب ضمن مهمة سير عمل في العالم الحقيقي. ويرتبط مفهوم دورات حياة الذكاء الاصطناعي ارتباطًا وثيقًا بمجالي عمليات التعلم الآلي (MLOps) وأنظمة إدارة الذكاء الاصطناعي (AIMS)، وكلاهما يتطلب نهجًا منهجيًا لتطوير الذكاء الاصطناعي وحوكمته وصيانته.
ويكمن جوهر مفهوم دورات حياة تطوير الذكاء الاصطناعي في أن حلول الذكاء الاصطناعي لا تُصمَّم ولا تُنشر بمعزل عن السياق، بل هي أنظمة ديناميكية تعتمد فعاليتها المستمرة على التخطيط الدقيق والمراقبة الحثيثة. وهناك ترابطات أساسية بين كل خطوة من خطوات تطوير الذكاء الاصطناعي وتنفيذه، ويُعد فهم هذه الترابطات أمرًا ضروريًا لبناء حلول مدعومة بالذكاء الاصطناعي تكون ناجحة وقابلة للتوسع ومستدامة.
وستستعرض هذه المقالة كل واحدة من الخطوات الأساسية في دورة حياة الذكاء الاصطناعي.
احصل على رؤى منسقة حول أهم أخبار الذكاء الاصطناعي وأكثرها إثارةً للاهتمام. اشترِك في خدمة رسائل Think الإخبارية الأسبوعية. راجع بيان الخصوصية لشركة IBM.
وتُعد مرحلة التخطيط المرحلة الأولى، وربما الأهم، في إدارة دورة حياة الذكاء الاصطناعي، وفيها تحدد حالة الاستخدام لتطبيق الذكاء الاصطناعي لديك: أي المشكلة التي تستخدم الذكاء الاصطناعي للمساعدة في حلها، والمهام المحددة التي يمكنه تنفيذها للمساهمة في ذلك. ويجب أن تستند جميع القرارات اللاحقة إلى القرارات المتخذة خلال عملية التخطيط.
ومن الضروري التحلي بالدقة ومراعاة جميع الاحتمالات والسيناريوهات المحتملة. فإغفال بعض الاعتبارات لا يوفّر جهدًا، بل يؤجله فحسب ويزيده تعقيدًا. وينبغي إشراك جميع الأطراف المعنية ذات الصلة والتشاور معها في مرحلة التخطيط، للاستفادة من خبراتها أو وجهات نظرها الخاصة، ولضمان وجود توافق بشأن الكيفية التي ستمضي بها الأمور لاحقًا.
حدّد نطاق مشروعك في مجال الذكاء الاصطناعي. ما الجوانب في مشكلتك التي سينفذها حل الذكاء الاصطناعي لديك أو سيساعد في معالجتها؟ وما الجوانب الخارجة عن نطاقه؟
حدِّد احتياجاتك. ضمن مجالات المشكلة التي ستستعين فيها بالذكاء الاصطناعي، ما الذي تحتاج إليه تحديدًا؟ من المهم فهم ما هو ممكن وما هو غير ممكن، سواء من حيث قدرات الذكاء الاصطناعي المتاحة حاليًا أو الموارد المتوفرة للمضي في تنفيذ هذا المشروع.
عرّف النجاح. ما الذي يُعد نتيجة ناجحة، من الناحيتين النوعية، وبخاصة الكمية؟ ويتيح تحديد مقاييس النجاح مبكرًا استخدامها في توجيه قرارات التصميم وضبط تطوير نظام الذكاء الاصطناعي لديك وتحسينه.
قيِّم المخاطر. حدّد أي أوجه قد يؤثر بها حل الذكاء الاصطناعي لديك، وفق النطاق المحدد حتى الآن، سلبًا في مؤسستك أو مستخدميك. وينبغي رصد المخاطر الأخلاقية ومخاطر السمعة والمخاطر المالية ومعالجتها قبل الانتقال إلى مرحلة جمع البيانات، لا سيما أن الإدارة غير الكافية للبيانات كثيرًا ما تكون مصدرًا لهذه المخاطر.
وعلى المستوى التقني، تُعد جودة بيانات التدريب وكميتها العامل الأهم في قوة نماذج الذكاء الاصطناعي لديك.
ضع في اعتبارك أن التعلم الآلي كله يعتمد على التعرّف التطبيقي على الأنماط. ويستخدم نموذج التعلم الآلي المُدرَّب الأنماط التي "تعلّمها" من بيانات تدريبه ليستنتج المخرج الأمثل لمدخل معيّن. وتُعد جودة البيانات الكافية ضرورية لضمان توافق الأنماط التي يتعلمها النموذج مع أنماط البيانات الجديدة التي سيُجري عليها الاستدلال في التطبيقات العملية. كما أن توافر حجم كافٍ من البيانات ضروري لضمان أن يكون النموذج قد تعلّم جميع الأنماط التي سيحتاج إلى الاستناد إليها، وكذلك لتجنب الإفراط في تخصيص البيانات (Overfitting).
وقيّم مصادر البيانات ذات الصلة المتاحة لك، بدءًا من مجموعات البيانات مفتوحة المصدر المتوفرة عبر منصات مثل Hugging Face وKaggle، مرورًا بجمع البيانات من الويب، وصولًا إلى الاستفادة من البيانات المملوكة لمؤسستك. عندما تكون البيانات عالية الجودة نادرة للغاية أو باهظة التكلفة، يمكن للبيانات الاصطناعية أحيانًا أن تسد هذه الفجوات. يمكنها أحيانًا أن تسد الفجوات.
نادرًا ما تكون البيانات غير المُنسَّقة جاهزة للتعلم الآلي، إذ تتطلب عادةً قدرًا من المعالجة المسبقة قبل استخدامها في مسارات تدريب النماذج. وتُعد هندسة الميزات جزءًا مهمًا من هذه العملية.
ويتطلب التعلم الخاضع للإشراف وسم البيانات، وهو ما يستلزم غالبًا قدرًا من التدخل البشري اليدوي الذي يستغرق وقتًا، وإن كانت الأتمتة تتيح في كثير من الأحيان تبسيط هذه العملية. وسيتطلب وسم البيانات في بعض المجالات المتخصصة الاستعانة بخبراء. وحتى مجموعات البيانات التي تتضمن بيانات موسومة مسبقًا ينبغي فحصها للتأكد من دقة الوسوم وملاءمتها لحالة الاستخدام الخاصة بك.
ويجب تطبيع البيانات المستمدة من مصادر مختلفة وتوحيدها من حيث الوحدات والتنسيق. فعلى سبيل المثال، سيؤدي تدريب نموذج على بيانات طقس معروضة بالدرجتين المئوية ودرجات فهرنهايت حتمًا إلى الفشل.
ولا ينبغي التخلص من البيانات ببساطة بعد تدريب النموذج. بل ينبغي تخزينها وصيانتها تحسبًا للحاجة يومًا ما إلى تدقيق نظامك، أو استقصاء مشكلات الأداء، أو إعادة إنتاج نماذجك، أو الامتثال للمتطلبات التنظيمية الواردة في اللائحة العامة لحماية البيانات GDPR أو لأطر مماثلة.
وتُعد حوكمة البيانات السليمة عنصرًا أساسيًا في قابلية تفسير الذكاء الاصطناعي، وخصوصية البيانات، والامتثال التنظيمي، ولا سيما في القطاعات وحالات الاستخدام التي تتضمن بيانات تحتوي على معلومات حساسة. كما أنها عنصر ضروري لإنشاء مسارات بيانات من شأنها تبسيط الحصول على البيانات على نحو قابل للتوسع، خاصةً عندما تعتمد مهمة سير عمل الذكاء الاصطناعي لديك على بيانات مملوكة تُحدَّث باستمرار.
وتأتي بعد ذلك مرحلة اختيار النموذج، أي اختيار بنية النموذج الأنسب لحالة الاستخدام وبيانات التدريب والموارد الحاسوبية المتاحة لديك. توجد مجموعة هائلة من خوارزميات التعلم الآلي، تمتد من نماذج الانحدار الصغيرة والبسيطة إلى الشبكات العصبية الضخمة والمتقدمة. وليس النموذج الأكبر والأكثر تطورًا دائمًا هو الخيار الأَولى: فهناك مهام تكون فيها نماذج التعلم العميق الضخمة مبالغًا فيها، بل توجد أيضًا مهام تتفوق فيها نماذج التعلم الآلي التقليدية على نظيراتها من نماذج التعلم العميق.
وعندما يتعلق الأمر بالذكاء الاصطناعي التوليدي، فإن تدريب النماذج اللغوية الكبيرة (LLMs) وأنواع أخرى من النماذج التوليدية من الصفر يتطلب استثمارًا هائلًا في الوقت والبيانات والأجهزة والطاقة. وفي معظم الحالات، يكون تلبية الحاجة إلى نموذج توليدي مخصص أفضل من خلال الضبط الدقيق لنموذج مُدرَّب مسبقًا. ولكن حتى ضمن عالم النماذج الجاهزة، هناك نطاق واسع جدًا من حيث حجم النموذج وبنيته وقدراته.
وتُعد التقييمات المعيارية دليلًا مفيدًا لتحديد النماذج التي تجيد مهام معينة، لكنها لا ينبغي أن تُؤخذ بوصفها مسلّمات. وإذا كانت مشكلتك محددة بوضوح، فمن المفيد استكشاف جدوى وضع معايير مخصصة تعكس مباشرةً الأداء في المهام المحددة التي ستحتاج إلى أن ينفذها النموذج. وسيكون ذلك مفيدًا أيضًا في مرحلة تقييم النموذج لاحقًا.
وبعيدًا عن الذكاء الاصطناعي التوليدي، فإن معظم حلول الذكاء الاصطناعي تتطلب تدريب نموذجك الخاص. ويقدم شرحنا الخاص بتدريب النماذج مزيدًا من المعلومات حول عملية تطوير النموذج، بدءًا من أنواع التعلم الآلي المختلفة، مرورًا باختيار دالة الخسارة، أو دالة المكافأة في التعلم المعزَّز، وصولًا إلى تحسين معلمات النموذج ومعلماته الفائقة. وعادةً ما يكون قدر من التجريب ضروريًا قبل الوصول إلى البنية المثالية ونهج التعلم الأنسب.
وفي نهاية المطاف، يتمثل الهدف من تدريب النموذج في تعديل معلماته إلى أن يبلغ أداؤه على الأمثلة الواردة في مجموعة بيانات التدريب مستوى مقبولًا من الدقة.
تدريب النموذج هو عملية تكرارية، ولا يسير دائمًا بصورة خطية ثابتة. ومن المهم حفظ "نقاط تحقق" لأوزان النموذج على فترات منتظمة طوال عملية التدريب. وفي غياب هذا النوع من التحكم في الإصدارات، قد يكون تحديث واحد للنموذج كارثيًا ويضطرك إلى البدء من جديد. ويُعد التحكم في الإصدارات أيضًا ممارسة ضرورية لتصحيح الأخطاء، وقابلية إعادة الإنتاج، والتعاون بين الفرق.
غير أن تحسين أداء النموذج على بيانات التدريب ليس، في حد ذاته، الهدف الأساسي من تدريب النموذج. فالهدف الحقيقي من تدريب النموذج هو تطوير نموذج يتمتع بقدرة جيدة على التعميم على بيانات جديدة لم يسبق له الاطلاع عليها. ويجب توخي الحذر لتجنب الإفراط في تخصيص البيانات (Overfitting)، الذي يمكن فهمه على أنه المقابل في التعلم الآلي لفكرة "التدريس من أجل الاختبار"، أي أنه أقرب إلى الحفظ الآلي منه إلى "المعرفة" الفعلية.
ويُعد التقييم بعد التدريب ضروريًا للتأكد من أن النموذج يعمم جيدًا على البيانات التي لم يرها من قبل. وتختبر عملية التحقق جودة مخرجات النموذج باستخدام مجموعة بيانات منفصلة تضم مدخلات جديدة تشبه مهام العالم الحقيقي. ويمكن أن تستخدم عملية التحقق طيفًا أوسع بكثير من مقاييس الأداء مقارنةً بتلك المناسبة لدوال الخسارة التي تقيس دقة النموذج أثناء التدريب.
وعادةً ما يشكل تقييم النموذج وتدريبه جزأين من دورة تكرارية واحدة:
أولًا، تُدرَّب النماذج إلى أن تبلغ الخسارة أو المكافأة عتبة مقبولة.
ثم يُتحقق من أداء النموذج على مجموعة جديدة من المهام، وغالبًا باستخدام مقاييس أداء مختلفة.
وإذا لم تكن نتائج تقييم النموذج مُرضية، يخضع النموذج لمزيد من التدريب، عادةً مع إدخال تعديلات استراتيجية تهدف إلى معالجة أي قصور جرى تحديده في مرحلة التحقق.
وبمجرد تدريب النموذج والتحقق من نجاحه، ينتقل إلى مرحلة النشر، حيث يُشغَّل في بيئة إنتاج فعلية ويُدمج مع الأنظمة وواجهات برمجة التطبيقات الموجودة. من الناحية المثالية، تكون مرحلة تقييم النموذج قد تحققت من أداء النموذج في المهام التي تستخدم مهام سير العمل هذه في العالم الحقيقي، أو على الأقل تقاربها.
وهناك العديد من التهيئات التي ينبغي مراعاتها عند نشر النموذج، لكن ربما يكون القرار الأهم هو نوع بيئة النشر التي سيعمل فيها.
النشر المحلي: يُشغَّل النموذج على أجهزة مادية - غالبًا ما تكون مُسرِّعات للذكاء الاصطناعي - تملكها أنت أو مؤسستك وتتولون صيانتها. ويوفر هذا أكبر قدر من التحكم، لكنه يتطلب أيضًا أكبر استثمار أولي.
النشر السحابي: يُشغَّل النموذج على أجهزة يملكها ويديرها مزودو خدمات سحابية من جهات خارجية، وتقع فعليًا في مكان آخر داخل مركز بيانات كبير. ويُعد النشر السحابي عمومًا أسرع طريق إلى قابلية التوسّع.
النشر على الحافة: يُنشر النموذج عبر شبكة محلية موزعة من "الأجهزة الطرفية"، مثل أجهزة الاستشعار أو أجهزة إنترنت الأشياء (IoT).
النشر على الجهاز: يُشغَّل النموذج مباشرة على جهاز المستخدم النهائي، مثل كمبيوتر محمول أو هاتف ذكي.
ونادرًا ما ينبغي النظر إلى النموذج المنشور بوصفه منتجًا "نهائيًا" ساكنًا لا يتغير. وتتطلب الحوكمة السليمة للذكاء الاصطناعي مراقبة مستمرة لمقاييس أداء النموذج وتعليقات المستخدمين.
ومن شبه المؤكد أنه ستظهر في التطبيقات العملية مشكلات غير متوقعة وحالات طرفية، مهما بلغت دقة التخطيط والاختبار وإجراء اختبارات الفرق الحمراء مسبقًا. وعلاوة على ذلك، قد يعاني حتى النموذج المُدرَّب على نحو أمثل، بمرور الوقت، من تراجع في الأداء بسبب مشكلات مثل انحراف النموذج.
ولذلك، تتطلب النماذج المنشورة عادةً إعادة تدريب دورية للحفاظ على مستوى أداء ملائم والتكيف مع الظروف المتغيرة. ومرة أخرى، تُعد آليات إدارة الإصدارات المدروسة بعناية مهمة لتصحيح الأخطاء، وتعزيز المساءلة، وإجراء تحديثات آمنة للأنظمة الحساسة.
تدريب الذكاء الاصطناعي التوليدي والتحقق من صحته وضبطه ونشره، وكذلك قدرات نماذج الأساس والتعلم الآلي باستخدام IBM watsonx.ai، وهو استوديو الجيل التالي من المؤسسات لمنشئي الذكاء الاصطناعي. أنشئ تطبيقات الذكاء الاصطناعي بسرعة أكبر وببيانات أقل.
استفد من الذكاء الاصطناعي في عملك بالاستعانة بخبرة IBM الرائدة في مجال الذكاء الاصطناعي ومحفظة حلولها المتوفرة لك.
أعدّ ابتكار عمليات ومهام سير العمل الحساسة بإضافة الذكاء الاصطناعي لتعزيز التجارب وصنع القرارات في الوقت الفعلي والقيمة التجارية.