ما هو AutoML؟

14 يناير 2025

المؤلفين

Ivan Belcic

Staff writer

Cole Stryker

Editorial Lead, AI Models

Gather

ما هو AutoML؟

التعلم الآلي المؤتمت (AutoML) هو ممارسة أتمتة التطوير الشامل لنماذج التعلم الآلي. يُمكّن التعلم الآلي المؤتمت غير الخبراء من إنشاء أنظمة الذكاء الاصطناعي وتنفيذها مع تبسيط مهام سير عمل الذكاء الاصطناعي لعلماء البيانات والمطورين.

تعمل أدوات التعلم الآلي المؤتمت على تبسيط عملية إنشاء نماذج التعلم الآلي. يستفيد المستخدمون من واجهة سهلة الاستخدام يمكنهم من خلالها إنشاء نماذج الذكاء الاصطناعي التوليدي وأنظمة التعلم العميق الأخرى وتدريبها والتحقق من صحتها ونشرها. يسهل التعلم الآلي المؤتمت تطبيق الذكاء الاصطناعي في الصناعات المنظمة من خلال نتائجه القابلة للتفسير والتكرار. 

من دون التعلم الآلي المؤتمت، يجب تنفيذ كل خطوة في سير عمل التعلم الآلي - إعداد البيانات والمعالجة المسبقة للبيانات وهندسة الميزات وتحسين المعلمات الفائقة - يدويًا. يجعل التعلم الآلي المؤتمت التعلم الآلي متاحًا للجميع من خلال جعله في متناول أي شخص مهتم باستكشاف إمكاناته. وفي الوقت نفسه، يمكن لفرق عمليات التعلم الآلي ذات الخبرة والمتخصصين في علوم البيانات أتمتة الجوانب الروتينية لمهام سير عمل التعلم الآلي مع التركيز على مهام التعلم الأكثر تحديًا. 

تصميم ثلاثي الأبعاد لكرات تتدحرج على مسار

أحدث الأخبار والرؤى حول الذكاء الاصطناعي 


تتوفر معارف وأخبار منسقة بمهارة حول الذكاء الاصطناعي والسحابة وغيرها في نشرة Think الإخبارية الأسبوعية. 

كيف يعمل التعلم الآلي المؤتمت؟

تعمل حلول التعلم الآلي المؤتمت من خلال إنشاء العديد من سلاسل عمليات التعلم الآلي للتعامل مع المهمة المقصودة، ثم تحديد الخيار الأمثل. يحدث تقييم النموذج واختيار النموذج تلقائيًا كجزء من العملية التكرارية لاختيار أفضل نموذج للمهمة. تزيد أدوات تصورات البيانات من سهولة الاستخدام في عملية التعلم الآلي المؤتمت. 

يتمثل الفرق بين التعلم الآلي المؤتمت والتعلم الآلي التقليدي في أن التعلم الآلي المؤتمت يؤتمت كل مرحلة من مراحل سلسلة عمليات التعلم الآلي تقريبًا. بينما تستغرق سلاسل العمليات التقليدية وقتًا طويلاً وتستهلك الكثير من الموارد وعرضة للخطأ البشري. وبالمقارنة، أدت التطورات في التعلم الآلي المؤتمت إلى زيادة الكفاءة وتحقيق نتائج أفضل. 

تتكون سلسلة عمليات التعلم الآلي النموذجية من الخطوات التالية: 

إعداد البيانات والمعالجة المسبقة 

إعداد البيانات هي عملية جمع البيانات الأولية ودمجها في مجموعة بيانات التدريب. ويساعد إعداد البيانات على ضمان خلو بيانات التدريب من التحيز وهو ما يهيئ النموذج للنجاح: البيانات الدقيقة تؤدي إلى تنبؤات ومعارف دقيقة. ونظرًا لأن الشركات تربط أنظمة الذكاء الاصطناعي بمخازن البيانات المملوكة لها، مثلاً من خلال التوليد المعزز للاسترجاع (RAG)، فإن إعداد البيانات أمر بالغ الأهمية لتطبيق الذكاء الاصطناعي بشكل موثوق. 

يربط المستخدمون منصة التعلم الآلي المؤتمت بمصدر بيانات التدريب - وهي في العادة مجموعة بيانات كبيرة تحتوي على بيانات جاهزة للاستخدام في التدريب. تحدث مرحلة إعداد البيانات قبل نشر حل التعلم الآلي المؤتمت. 

يتولى حل التعلم الآلي المؤتمت مهمة المعالجة المسبقة للبيانات وتنقيتها بشكل أكبر. تؤدي المعالجة المسبقة الأكثر شمولاً للبيانات إلى تحسين أداء نموذج الذكاء الاصطناعي

عند بناء النماذج يدويًا لمهام التعلم الخاضع للإشراف والتعلم شبه الخاضع للإشراف، يجب تصنيف بيانات التدريب يدويًا. يجب تحديد الميزات والمخرجات بناءً على حالة الاستخدام المقصود للنموذج. يمكن لحلول التعلم الآلي المؤتمت التعامل مع هندسة الميزات بالنيابة عن المستخدمين لتحديد ميزات البيانات التي من المرجح أن تحسن أداء النموذج. 

هندسة الميزات

ميزات البيانات أو متغيراتها هي سمات مجموعة البيانات التي تستخدمها نماذج التعلم الآلي لاتخاذ القرارات ووضع التنبؤات. على سبيل المثال، بالنسبة إلى نموذج رؤية حاسوبية مصمم لتحديد أنواع النباتات، قد تتضمن ميزات البيانات شكل الورقة ولونها. 

هندسة الميزات هي العملية التحويلية التي يستخلص من خلالها عالم البيانات معلومات جديدة من البيانات المدخلة وإعدادها للتعلم الآلي.يمكن للهندسة المناسبة واختيار الميزات أن تحدد الفرق بين أداء النموذج المقبول والعالي الجودة.

تعمل هندسة الميزات المؤتمتة على أتمتة عملية استكشاف مساحة الميزات وملء القيم المفقودة واختيار الميزات المراد استخدامها. يمكن أن يستغرق بناء ميزة واحدة يدويًا ساعات، ويمكن أن يصل عدد الميزات المطلوبة لتحقيق الحد الأدنى من الدقة إلى المئات - ناهيك عن خط أساس الدقة على مستوى الإنتاج. تقلص هندسة الميزات المؤتمتة هذه المرحلة من أيام إلى دقائق. 

بالإضافة إلى مزايا الكفاءة، تزيد كفاءة الميزات المؤتمتة أيضًا من قابلية شرح الذكاء الاصطناعي - وهو أمر مهم للصناعات الخاضعة لتنظيم صارم مثل قطاع الرعاية الصحية أو الشؤون المالية. إن زيادة وضوح الميزات تجعل النماذج أكثر إقناعًا وقابلية للتنفيذ من خلال اكتشاف مؤشرات أداء رئيسية تنظيمية جديدة.

اختيار النموذج وضبط المعلمة الفائقة وتدريب النموذج

ما نوع النموذج الأفضل لحالة الاستخدام المقصودة؟ مع التعلم الآلي التقليدي، يتطلب اختيار النموذج معرفة ممتازة بأنواع نماذج الذكاء الاصطناعي إلى جانب القدرات والقيود الخاصة بكل منها. 

تعمل أدوات التعلم الآلي المؤتمت على تحسين العمليات التقليدية من خلال بناء العديد من النماذج وتدريبها تلقائيًا في وقت واحد باستخدام مجموعة من الخوارزميات وتكوينات المعلمات الفائقة. تجمع العديد من حلول التعلم الآلي المؤتمت بين نماذج متعددة في عملية تُعرف باسم التعلم الجماعي

البحث في البنية العصبية (NAS) 

واحدة من أكثر المهام تعقيدًا وعرضة للأخطاء وتستغرق وقتًا طويلاً عند بناء الشبكات العصبية العميقة هي إنشاء البنية العصبية.تتطلب المهام المتقدمة شبكات متعددة الطبقات ذات تكوينات معقدة من المعلمات الفائقة. 

يعمل البحث في البنية العصبية (NAS) على أتمتة هذه العملية، ما يقلل من الوقت المستغرق واحتمالية الخطأ. باستخدام خوارزميات متقدمة، يحدد البحث في البنية العصبية البنية المثلى بناءً على السياق ومجموعة البيانات. تركز التطورات الحديثة في البحث في البنية العصبية على تطوير تقنيات أكثر كفاءة لتقليل التكاليف الحسابية المرتبطة بها. 

تحسين المعلمات الفائقة

المعلمات الفائقة هي القواعد التي تحكم عملية تعلم النموذج. خلافًا للمعلمات الداخلية التي يحدثها النموذج في أثناء التدريب، فإن المعلمات الفائقة خارج النموذج ويكونها علماء البيانات. تُحدد أيضًا المعلمات الفائقة بنية الشبكة العصبية

في سياقات وضع نماذج البيانات على نطاق صغير، يمكن تكوين المعلمات الفائقة يدويًا وتحسينها من خلال التجربة والخطأ. ولكن مع تطبيقات التعلم العميق، يزداد عدد المعاملات الفائقة بشكل كبير. يسمح التحسين التلقائي للمعاملات الفائقة للفرق بالتكرار والتجربة لاكتشاف أفضل المعاملات الفائقة عبر الميزات والنماذج. 

تُضبط المعلمات الفائقة تلقائيًا من خلال خوارزميات متقدمة مثل التحسين البايزي. يوفر الضبط المؤتمت للمعلمات الفائقة الوقت لعلماء البيانات للتركيز على سبب إنشاء النموذج بدلاً من الكيفية في أثناء عملية التعلم الآلي. يمكن لفرق التحليلات بدلاً من ذلك التركيز على تحسين النماذج لحالات استخدام معينة - على سبيل المثال، لتقليل السلبيات الزائفة في الاختبارات الطبية.

التحقق من الصحة والاختبار

يحتاج علماء البيانات إلى التحقق من صحة تقدم خوارزمية التعلم الآلي في أثناء التدريب. بعد التدريب، يُختبر النموذج ببيانات جديدة لتقييم أدائه قبل النشر في العالم الحقيقي. يُقيم أداء النموذج باستخدام مقاييس تتضمن مصفوفة التشويش ودرجة F1 ومنحنى ROC وغيرها. 

عند اكتمال التدريب، تختبر أداة التعلم الآلي المؤتمت كل نموذج لتحديد النموذج الأفضل أداءً على مجموعتي بيانات التدريب والاختبار، ثم تختار تلقائيًا النموذج الأفضل أداءً لنشره.

نشر النموذج

إنشاء النموذج هو مجرد الخطوة الأولى في الجدول الزمني للمنتج. يجب توفير النماذج المكتملة للمستخدمين ومراقبة أدائها وصيانتها بمرور الوقت للمساعدة على ضمان الموثوقية والدقة. من دون الأتمتة، يجب على فرق التطوير كتابة النصوص البرمجية وبناء الأنظمة لدمج النموذج في عملياتها وتقديمه إلى قاعدة مستخدميها. 

تشتمل العديد من حلول التعلم الآلي المؤتمت على أدوات نشر للتكامل السلس في العالم الحقيقي. يمكن نشر النماذج كخدمة يمكن الوصول إليها من خلال موقع إلكتروني أو تطبيق أو اتصال واجهة برمجة التطبيقات.  يمكن لمنصات التعلم الآلي المؤتمت أتمتة نشر النماذج في عروض المنتجات الموجودة مسبقًا، وإدارة التوسع والتحديثات والإصدارات وزيادة قابلية الشرح من خلال تصورات البيانات.

أكاديمية الذكاء الاصطناعي

كن خبيرًا في الذكاء الاصطناعي

اكتسب المعرفة لتحديد أولويات استثمارات الذكاء الاصطناعي التي تدفع نمو الأعمال. ابدأ مع أكاديمية الذكاء الاصطناعي المجانية اليوم وتولَّ زمام المبادرة لتعزيز مستقبل الذكاء الاصطناعي في مؤسستك.

حالات استخدام التعلم الآلي المؤتمت

تعني المجموعة المتنوعة من أدوات التعلم الآلي المؤتمت أنه يمكن تطبيق هذه التقنية على مجموعة كبيرة من مهام التعلم الآلي، بما في ذلك: 

  • التصنيف 

  • الانحدار

  • الرؤية الحاسوبية 

  • معالجة اللغة الطبيعية 

التصنيف

التصنيف هو مهمة التعلم الآلي لتعيين مدخلات البيانات في فئات محددة. تستخدم النماذج التنبئية ميزات البيانات المدخلة للتنبؤ بالتصنيفات أو المخرجات الصحيحة. يمكن لأنظمة التعلم الآلي المؤتمت بناء مجموعة من الخوارزميات واختبارها، مثل الغابات العشوائية وآلات ناقلات الدعم (SVM)، لمعالجة البيانات المجدولة. 

تكتشف أدوات التعلم الآلي المؤتمت تلقائيًا الأنماط في مجموعات البيانات المصنفة ويمكنها تصميم نماذج لمهام التصنيف الشائعة مثل الكشف عن الاحتيال وتصفية البريد الإلكتروني غير المرغوب فيه. 

الانحدار

الانحدار في التعلم الآلي هو التحدي المتمثل في استخدام البيانات القديمة للتنبؤ بالقيم المستقبلية. يتنبأ الانحدار الخطي بقيمة متغير تابع بناءً على متغير مستقل واحد أو أكثر - على سبيل المثال، مع تحليل المخاطر أو التنبؤ بالسوق. بينما يتنبأ الانحدار اللوجستي باحتمالية وقوع حدث مستقبلي، مثل احتمال إصابة المريض بمرض ما، بدلاً من القيمة المنفصلة. 

يعمل التعلم الآلي المؤتمت على تبسيط عملية إنشاء العلاقات بين متغيرات المدخلات والمتغيرات المستهدفة، لا سيما مع المهام المعقدة متعددة المتغيرات.

رؤية الكمبيوتر

الرؤية الحاسوبية هي استخدام الحواسيب لمعالجة البيانات المرئية، مثل الصور والفيديو. يمكن لأنظمة التعلم الآلي المؤتمت توليد نماذج موجهة لمهام التصنيف القائمة على الرؤية بما في ذلك الكشف عن الأشياء وتصنيف الصور والتعرف البصري الذكي على الأحرف. يمكن أن تشمل حالات الاستخدام الإشراف على المحتوى وتصفيته ووضع علامات على الصور وغيرها من المهام ذات الصلة. 

كما يمكن لأنظمة التعلم الآلي المؤتمت أيضًا ضبط النماذج لاستخدامها في سياقات الرؤية الحاسوبية الأكثر تقدمًا، كما هو الحال مع السيارات ذاتية القيادة.

معالجة اللغة الطبيعية (NLP)

تمكّن معالجة اللغة الطبيعية (NLP) أنظمة الذكاء الاصطناعي من تفسير المدخلات النصية، مثل مطالبات المستخدم والوثائق القانونية. يُعد إنشاء روبوتات المحادثة، وتصنيف النصوص متعددة الفئات والتسميات، وتحليل مشاعر العملاء، والتعرف على الكيانات المسماة، وترجمة اللغة، كلها أمثلة على مهام معالجة اللغات الطبيعية المعقدة التي يمكن التعامل معها بسهولة باستخدام التعلم الآلي المؤتمت. 

يمكن لعلماء البيانات إنشاء نماذج مخصصة باستخدام التعلم الآلي المؤتمت تُحسن تلقائيًا لتحقيق أداء فعال في حالات الاستخدام المقصودة. وبخلاف ذلك، عند إنشاء نماذج معالجة اللغات الطبيعية يدويًا، يجب على علماء البيانات إما أن يبدأوا من الصفر أو أن يبنوا نماذجهم على نماذج سابقة قد لا يكون أداؤها جيدًا مثل النموذج المخصص الذي يُنشأ تلقائيًا.

حدود التعلم الآلي المؤتمت

على الرغم من أن التعلم الآلي المؤتمت يوفر العديد من الفوائد لمطوري الذكاء الاصطناعي، فإنه ليس بديلاً كاملاً للمعرفة البشرية والخبرة والمهارات والإبداع البشري. تشمل حدود التعلم الآلي المؤتمت ما يأتي: 

  • ارتفاع التكاليف: كلما كانت المهمة أكثر تطلبًا، كان النموذج المقابل أكثر تقدمًا. يمكن أن تخرج تكاليف التعلم الآلي المؤتمت عن السيطرة بسرعة عندما تُطبق هذه التقنية لإنشاء نماذج كبيرة ومعقدة. 

  • خطر الإفراط في التخصيص: يمكن التخفيف من مخاطر الإفراط في التخصيص- حيث يلتزم النموذج المدرّب التزامًا وثيقًا ببيانات التدريب الخاصة به ويفشل في نقل ما تعلمه إلى بيانات العالم الحقيقي - من خلال التدخل البشري والمراقبة الدقيقة لعملية التعلم. 

  • التحكم المحدود: يضحي المطورون بالتحكم مقابل الكفاءة التي توفرها الأتمتة. في الحالات النادرة التي تتطلب نماذج مخصصة للغاية، قد تواجه حلول التعلم الآلي المؤتمت صعوبة في تقديم نموذج مناسب. 

  • الاعتماد على البيانات: يكون نموذج الذكاء الاصطناعي فعالاً بقدر فعالية بيانات التدريب الخاصة به. ومن ثَمَّ لا يمكن للنماذج التي يصنعها الإنسان والنماذج التي ينشئها التعلم الآلي المؤتمت أن تحقق أداءً جيدًا إذا لم تُزود ببيانات عالية الجودة.

أدوات التعلم الآلي المؤتمت

يمتلك منشئو نماذج الذكاء الاصطناعي مجموعة كبيرة من أدوات التعلم الآلي المؤتمت في متناول أيديهم. تتضمن الخيارات ما يأتي: 

  • Auto-PyTorch: أحد حلول التعلم الآلي المؤتمت مصمم لأتمتة مشاريع التعلم الآلي التي أُنشئت باستخدام PyTorch. 

  • Google Cloud AutoML: حل التعلم الآلي المؤتمت من Google المتاح على منصتها السحابية للتعلم الآلي. 

  • Lale1مكتبة Python شبه مؤتمتة مفتوحة المصدر تتكامل بسلاسة مع سلاسل عمليات scikit-learn. 

  • Microsoft Azure AutoML: يمكن للمطورين الذين يستخدمون Microsoft Azure الاستفادة من إمكانات التعلم الآلي المؤتمت الخاصة بها. 

  • Auto-Sklearn: إحدى منصات التعلم الآلي المؤتمت مفتوحة المصدر التي تعتمد على مكتبة scikit-learn. 

الحواشي

1. مكتبة علوم البيانات شبه الآلية، Hirzel وآخرون، IBM/lale، بتاريخ 28 أغسطس 2024