ما هو مسار التعلم الآلي؟

المؤلفون

Ivan Belcic

Staff writer

Cole Stryker

Staff Editor, AI Models

IBM Think

ما هو مسار التعلم الآلي؟

مسار التعلم الآلي هو عملية منهجية لتصميم نموذج التعلم الآلي وتطويره ونشره. تتبع مسارات التعلم الآلي أو عمليات سير عمل التعلم الآلي سلسلة من الخطوات التي توجه المطورين وقادة الأعمال نحو تطوير النموذج الأكثر كفاءة.

يحتوي مسار التعلم الآلي الشامل على ثلاث مراحل: 

  1. معالجة البيانات: يقوم علماء البيانات بتجميع وإعداد البيانات التي سيتم استخدامها للتدريب على نموذج التعلم الآلي. وضمن هذه المرحلة الرئيسية، توجد مراحل جزئية تشمل جمع البيانات والمعالجة المسبقة لها وتنظيفها واستكشافها. 

  2. تطوير النموذج: حيث يختار أو يُنشئ ممارسو البيانات خوارزمية التعلم الآلي التي تناسب احتياجات المشروع. فيتم تدريب الخوارزمية على البيانات من الخطوة السابقة، ويتم اختبار النموذج الناتج والتحقق من صحته حتى يصبح جاهزًا للاستخدام. 

  3. نشر النموذج: يقوم المطورون ومهندسو البرمجيات بنشر النموذج للاستخدام في العالم الحقيقي، ودمجه في بيئة الإنتاج ومراقبة أدائه. 

تعد عمليات سير عمل التعلم الآلي لبنة أساسية للتخصص الأكبر لعمليات التعلم الآلي (MLOps). يمكن أتمتة الكثير من العملية من خلال طرق وأساليب التعلم الآلي (AutoML) التي تدير التبعيات بين المراحل وبين نقاط النهاية. 

ما الفرق بين مسار البيانات ومسار التعلم الآلي؟

مسار البيانات هو بنية يتم تصميمها وإنشاؤها من قِبل عالم البيانات وتجمع البيانات من مصادر مختلفة، ثم يتم تخزينها وتنظيمها في مخزن بيانات، مثل مستودع البيانات. أما مسار التعلم الآلي فهو سير عمل معد لتصميم وبناء ونشر نظام الذكاء الاصطناعي. 

وكلتا العبارتين تستخدمان مصطلح " مسار"، لكن بينما نجد مسار البيانات يشير إلى نظام ملموس أكثر، نجد أن مسار التعلم الآلي يشير إلى سلسلة نظرية من الخطوات. يعد مسار ETL (الاستخراج والتحويل والتحميل) مثالًا على مسار البيانات الذي يستخرج البيانات من مصادر مختلفة ثم يحولها إلى تنسيق موحَّد ثم يحملِّها إلى نظام وجهة. في التعلم الآلي، يجمع مسار ETL البيانات وينسقها في مجموعة بيانات التدريب.

أحدث اتجاهات الذكاء الاصطناعي، يقدمها لك الخبراء

احصل على رؤى منسقة حول أهم أخبار الذكاء الاصطناعي وأكثرها إثارةً للاهتمام. اشترِك في خدمة رسائل Think الإخبارية الأسبوعية. راجع بيان الخصوصية لشركة IBM.

شكرًا لك! لقد اشتركت بنجاح.

سيتم تسليم اشتراكك باللغة الإنجليزية. ستجد رابط إلغاء الاشتراك في كل رسالة إخبارية. يمكنك إدارة اشتراكاتك أو إلغاء اشتراكك هنا. راجع بيان خصوصية IBM لمزيد من المعلومات.

المرحلة 0: بدء انطلاق المشروع رسميًا

قبل تهيئة سير العمل، يتفق قادة الأعمال والمطورون وغيرهم من الأطراف المعنية على أهداف مشروع التعلم الآلي. ولا شك أن فهم الداعي إلى اعتماد الذكاء الاصطناعي وما الذي يهدف إلى تحقيقه أمر مهم، لأنه سيجعل التوقعات واقعية كما يجعل الأطراف المعنية تتوافق معًا حول هدف واحد مشترك.

    ما هو الهدف؟

    عند اتخاذ قرار بشأن دمج الذكاء الاصطناعي في سير العمل أو المنتج، يجب على الأطراف المعنية أولًا تحديد هدف الأعمال الذي يهدف نموذج التعلم الآلي إلى حله، ثم توضيح كيف يمكن للذكاء الاصطناعي تحقيقه. لكن بعض الشركات تتعامل مع الذكاء الاصطناعي بمنطق آخر معكوس فتراهم فقط يقولون: "نريد بدء استخدام الذكاء الاصطناعي. لكن في أي شيء سيفيدنا؟ 

    لتحقيق أقصى عائد على الاستثمار من استثمارات الذكاء الاصطناعي، يجب أن يفهم القادة كل حالة استخدام، ليعملوا على إيجاد حل للتعلم الآلي مصمم خصيصًا لهذا الغرض.

    كيف يبدو النجاح؟

    لعل وجود مقاييس واضحة للنجاح، كالمؤشرات الرئيسية للأداء الموثقة، يساعد الأطراف المعنية على معرفة ما إذا كان مشروع التعلم الآلي سيحقق أهدافه لهم أم لا. وينبغي أن تعكس مؤشرات الأداء الرئيسية هذه الأهداف التي تم تحديدها في المرحلة السابقة. فمثلًا، قد يهدف نموذج التعلم الآلي الذي يتم نشره لزيادة الكفاءة إلى إعطاء الأولوية لعائد الاستثمار.

    ما الذي يعترض الطريق؟

    يساعد الإلمام بمشهد المخاطر والعوائق المحتملة فِرق العمل على إدارة المشروع بفاعلية. تتضمن هذه الخطوة تحديد متطلبات البيانات وتقييم اللوائح التنظيمية ذات الصلة، إن وجدت، لجمع البيانات وتخزينها. وينطبق الشيء نفسه على أي قيود تؤثر على تحديد النموذج، مثل متطلبات الحوسبة أو الذاكرة.

    Mixture of Experts | 28 أغسطس، الحلقة 70

    فك تشفير الذكاء الاصطناعي: تقرير إخباري أسبوعي

    انضمّ إلى نخبة من المهندسين والباحثين وقادة المنتجات وغيرهم من الخبراء وهم يقدّمون أحدث الأخبار والرؤى حول الذكاء الاصطناعي، بعيدًا عن الضجيج الإعلامي.

    المرحلة 1: معالجة البيانات

    بعد تحديد المشكلة التي يتعين على نموذج التعلم الآلي حلها، فإن الخطوة الأولى في سير عمل التعلم الآلي هي جمع البيانات وإعدادها وتحليلها. حيث يتعين على الممارسين تحديد مصادر البيانات ذات الصلة، وجمع البيانات منها ودمجها، وإعداد البيانات وتنظيفها، باستخدام طرق وأساليب علم البيانات بما في ذلك هندسة الميزات للوصول إلى مجموعة بيانات مُجهزة. 

    عادة ما تكون مرحلة معالجة البيانات هي الأكثر استهلاكًا للوقت. لكن أداء نموذج التعلم الآلي يعتمد على البيانات الجيدة. وأي أخطاء أو إغفالات في مرحلة هندسة البيانات ستؤثر سلبًا على أداء النموذج طوال دورة حياته. وتؤدي استراتيجيات أتمتة البيانات إلى تقليل الوقت والجهد البشري المطلوب لإنتاج مجموعات بيانات تدريبية قوية.

    تشمل معالجة البيانات ما يلي: 

    • استيعاب البيانات 

    • المعالجة المسبقة للبيانات

    • استكشاف البيانات 

    • هندسة السمات 

    • تقسيم البيانات 

      استيعاب البيانات

      يُقصد بعبارة "استيعاب البيانات" عملية جمع البيانات واستيرادها من مصادر بيانات مختلفة إلى مستودع بيانات مركزي من خلال مسار البيانات. حيث يتعين على علماء البيانات تحديد مصادر البيانات المناسبة، مثل بيانات المؤسسة الملكية المخزنة داخليًا، كتقارير المبيعات والخصائص الديموغرافية للعملاء والمعارف التنظيمية الأخرى الخاصة بالمؤسسة. 

      في بعض الأحيان تكون البيانات الخارجية مطلوبة أيضًا. يمكن أن تشمل مصادر البيانات الخارجية اتصالات API بمزودي البيانات، أو البيانات المستخرجة من الإنترنت أو البيانات الاصطناعية. ولأنه يتم إنشاء بيانات جديدة دائمًا، غالبًا ما يكون استيعاب البيانات عملية مستمرة.

      المعالجة المسبقة للبيانات

      في مرحلة معالجة البيانات مسبقًا، أو إعداد البيانات، يتم تحويل البيانات الخام غير المنسقة من الخطوة السابقة إلى بيانات نظيفة جاهزة للتحليل. ثم بعد الحصول على فهم لبيانات التدريب من خلال تحليل البيانات الاستكشافية (EDA)، يختار علماء البيانات استراتيجيات معالجة البيانات مسبقًا. تتضمن خطوات المعالجة المسبقة للبيانات ما يلي: 

      • تحديد القيم المفقودة والتعامل مع القيمة الخارجية

      • تطبيع البيانات: يعني توحيد مجموعة البيانات

      • تقليل التشويش: إزالة الأخطاء العشوائية وتداخل الإشارات 

      استكشاف البيانات

      استكشاف البيانات هو عملية تقييم البيانات لفهم المعلومات التي تحتويها. يهدف تحليل البيانات الاستكشافي (EDA) إلى تعلم خصائص البيانات واكتشاف الأنماط والعلاقات وتحديد الرؤى بمساعدة أدوات العرض المصور للبيانات

      تساعد نتائج تحليل البيانات الاستكشافي (EDA) في تحديد خيارات اختيار النموذج التي تحدث بعد ذلك.

      هندسة المزايا

      اختيار السمة هي خطوة حساسة للمعالجة المسبقة للبيانات تتضمن تحديد السمات أو الخصائص الأكثر صلة بنقاط البيانات. حيث يتم استخراج سمات البيانات واختيارها بحيث تمنح النموذج أفضل فرصة ممكنة لحل تحديات العالم الحقيقي. 

      قد يؤدي التركيز على الميزات الخاطئة إلى إنتاج نموذج لا يعمل كما هو منتظر منه. بعد تطبيق طرق وأساليب استخراج الميزات لتبسيط البيانات، يختار علماء البيانات الميزات التي ستؤدي إلى أقوى تنبؤات للنموذج.

      المرحلة 2: تطوير النموذج

      بعد إعداد بيانات التدريب، تأتي الخطوة التالية في سير عمل التعلم الآلي وهي بناء نموذج التعلم الآلي. حيث تتضمن عملية إنشاء نموذج تعلم عميق اختيار خوارزمية التعلم الآلي المناسبة وتعريضها لمجموعات البيانات التدريبية. وتكون نتيجة هذه العملية هي إنشاء نموذج ذكاء اصطناعي جاهز للاستخدام في العالم الحقيقي مع بيانات مستجدة مشابهة. 

      تتضمن عملية تطوير النموذج ما يلي: 

      • اختيار النموذج 

      • ضبط المعلمات الفائقة 

      • تدريب النموذج

      • تقييم النماذج

      اختيار النموذج

      اختيار النموذج هو عملية اختيار نوع النموذج الذي من المرجح أن يحقق أعلى أداء في حالة الاستخدام المقصودة. وقد أعطت مراحل التخطيط الأولية للمشروع بالفعل لجميع الأطراف المعنية والمشاركين فهمًا واضحًا لاحتياجات العمل والقيود وأهداف المشروع. يعتمد ممارسو التعلم الآلي في اختياراتهم على هذه العوامل، ويوازنون بين التحسين والجدوى. 

      تشمل الخيارات الانحدار والانحدار اللوجستي، والغابات العشوائية وشجرة القرار، والشبكات العصبية ونماذج اللغة الكبيرة (LLM)، آلات المتجهات الداعمة (SVM)، والنماذج التجميعية، والأنظمة الوكيلة وغيرها الكثير. 

      اعتمادًا على طبيعة تحدي التعلم الآلي، فإن أنواعًا معينة من الخوارزميات تُعدُّ مرشحة وملائمة بقوة عن غيرها. 

      على سبيل المثال، يمكن للشبكات العصبية التعامل مع تحديات الذكاء الاصطناعي التوليدي المعقدة ولكنها تأتي بتكاليف حوسبة عالية وتكون أكثر عرضة للإفراط في التجهيز. وتُعدُّ نماذج الانحدار فعالة في الحوسبة لكن لها حالات استخدام محدودة.

      ضبط المَعلمات الفائقة

      المعلمات الفائقة للنموذج هي متغيرات خارجية تتحكم في سلوك النموذج أثناء التدريب. حيث تتحكم المعلمات الفائقة في شكل النموذج الذي تبنيه الخوارزمية أيضًا، مثل عدد الخلايا العصبية والطبقات في الشبكة العصبية. 

      ضبط المعلمات الفائقة هي عملية تحسين المعلمات الفائقة بحيث تنتج عملية التدريب نموذجًا عالي الأداء. ويمكن لعلماء البيانات تعيين المعلمات الفائقة يدويًا لكنهم عادةً ما يقومون بأتمتة العملية من خلال خوارزميات مختلفة وأساليب وطرق أخرى.

      تدريب النماذج

      التدريب النموذجي هي عملية تحسين أداء النموذج باستخدام مجموعات بيانات تدريب مشابهة لبيانات الإدخال التي يعالجها النموذج بمجرد نشره. ويعد مسار تدريب التعلم الآلي نظامًا واسع النطاق يمكنه اتخاذ أي عدد من الأشكال اعتمادًا على الخوارزمية والمهمة التي يجري تطوير النموذج من أجلها. 

      تدور العديد من طرق التدريب حول تقليل دالة الخسارة التي تقيس خطأ النموذج: وهي الفجوة بين مخرجات النموذج وقيم البيانات الواقعية. وفي كل جولة من التدريب، يُحدِّث النموذج الجديد معلماته لتقترب أكثر من بيانات التدريب. فكل تحديث يكرر النتائج السابقة. 

      تشمل طرق التدريب النموذجية ما يلي: 

      • التعلم غير الخاضع للإشراف:حيث يتم تدريب النموذج على بيانات غير منظمة ويجب عليه تمييز الأنماط والعلاقات بين نقاط البيانات والميزات من تلقاء نفسه. 

      • التعلم الخاضع للإشراف الذاتي:يتم تدريب النموذج باستخدام بيانات غير مصنفة للمهام التي تتطلب عادةً التعلم الخاضع للإشراف.   

      • التعلم المعزز: يتم تدريب النموذج على اتخاذ الإجراءات التي تولد أكبر مكافأة ممكنة، بدلًا من تقليل الخطأ. 

      • التعلّم المستمر: يتم تدريب النموذج على تدفق بيانات الإدخال في الوقت الفعلي، على عكس مجموعة بيانات التدريب المجمَّعة مسبقًا.

      تقييم النماذج

      بعد أن يُعدُّ النموذج مدرَّبًا - مثل عندما يتم تقليل دالة الخسارة بشكل كافٍ - يتم تقييم أدائه قبل النشر. حيث تستخدم عملية تقييم النموذج اللغوي الكبير (LLM) مجموعات البيانات الخاصة بالاختبار، والتحقق من الصحة، التي تم إعدادها أثناء مرحلة تقسيم البيانات.

      التحقق من الصحة

      في عملية التحقق من الصحة يتم تقدير خطأ التنبؤ الخاص بالنموذج: ما مدى جودته في تقديم التنبؤات الصحيحة؟ وفي أثناء التدريب، غالبًا ما تقوم خوارزمية التعلم الآلي بإخراج نماذج متعددة بتكوينات مختلفة للمعلمات الفائقة. يحدد التحقق من الصحة النموذج الذي يحتوي على تكوين المعلمة الفائقة الأمثل.

      الاختبار

      يقوم الاختبار بمحاكاة القيم في العالم الحقيقي لتقييم خطأ التعميم للنموذج الأفضل أداءً: ما مدى قدرة النموذج على التكيف مع البيانات الجديدة غير المرئية؟ بيانات الاختبار مستقلة عن بيانات التدريب وتقيس أداء النموذج بعد اكتمال التدريب. وتكشف الاختبارات ما إذا كان النموذج سيعمل بعد نشره كما هو مقصود منه أم لا.

      المرحلة 3: نشر النموذج

      بعد تطوير النموذج المناسب قوي الأداء، يحين وقت وضع هذا النموذج موضع التنفيذ وتشغيله. ويعني نشر النموذج عرضه للمستخدمين في بيئة الإنتاج المقصودة، والتي قد تكون تطبيق جهاز محمول أو اتصال بواجهة API أو حتى تطبيق مختص باكتشاف أدوية جديدة أو منشأة معنية بأبحاث الروبوتات. 

      لا تبدأ النماذج في عملها إلا بعد نشرها بشكل نشط. ولتحقيق نتائج قوية من مشروع التعلم الآلي، يجب نشر النموذج بطريقة تجعله سهل الاستخدام، سواء من قِبل المستخدمين أو قادة الأعمال أو أنظمة الكمبيوتر الأخرى. 

      يتضمن نشر النموذج ما يلي: 

      • تسلسل النموذج 

      • التكامل 

      • البنية 

      • المراقبة 

      • التحديثات 

      • الامتثال

      تسلسل النماذج

      يعد التسلسل طريقة نشر شائعة تتضمن تحويل النموذج إلى تنسيق يمكن تخزينه ونقله، ثم إعادة تسلسله في بيئة الإنتاج. فهو مثل تعبئة غرفة مليئة بالأغراض في صندوق واحد، ثم نقل هذا الصندوق إلى منزل جديد، ثم تفريغ الصندوق لتجهيز وترتيب الغرفة الجديدة. 

      على سبيل المثال، توصي لغة البرمجة Python، وهي لغة برمجة شائعة في مجال تطوير التعلم الآلي، بإطار عمل Pickle لنشر النماذج.

      التكامل

      وفي خطوة التكامل يتم دمج النموذج في بيئة الإنتاج الخاصة به، مثل تطبيق الهاتف المحمول. حيث يمكن تقديم النماذج من خلال مقدمي خدمات الحوسبة السحابية مثل AWS أو Azure، أو يمكن استضافتها في الموقع. أو بدلًا من ذلك، قد يكون من الأنسب استخدام حل من حلول الحاويات مثل Kubernetes وDocker. 

      حسب كيفية تقديم النموذج، يحتاج المطورون إلى جعل النموذج متاحًا باستخدام مكتبات التعلم الآلي وأطر العمل المناسبة، مثل PyTorch أو TensorFlow Serving.

      البنية

      تعد قابلية النقل وقابلية التوسع من الأمور الأساسية التي ينبغي مراعاتها أثناء نشر التعلم الآلي. 

      • قابلية النقل هي السهولة التي يمكن بها نقل النموذج بين الأنظمة. 

      • قابلية التوسع هي قدرة النموذج على التعامل مع أعباء العمل المتزايدة، مثل تزايد حجم قاعدة المستخدمين، دون حاجة إلى إعادة تصميمه. 

      يجب أن تكون بيئة إنتاج النموذج قادرة على دعم النمو المتوقع لمشروع التعلم الآلي. وتساعد أدوات التوسع التلقائي والتنظيم في تلبية الطلب المتزايد مع مرور الوقت.

      المراقبة

      لا يعد سير عمل التعلم الآلي اكتمل وانتهى بمجرد نشر النموذج. بل يجب استمرار مراقبة أداء النموذج على مدار دورة حياة الذكاء الاصطناعي لتجنب حدوث انحراف النموذج: ونقصد به أن يعاني الأداء بسبب تغييرات في توزيع البيانات. وترتبط العديد من المقاييس الأخرى بقدرة النموذج على إنشاء ومعالجة الرموز المميزة: وحدة مفردة من المدخلات أو المخرجات. تتضمن بعض هذه المقاييس ما يلي: 

      • الوقت المستغرق لكل رمز مميز مخرجات (TPOT) / زمن الانتقال (ITL): مقدار الوقت الذي يستغرقه النموذج لتوليد رمز مميز. 

      • الوقت المستغرق لإنشاء أول رمز مميز (TTFT): مقدار الوقت الذي يستغرقه النموذج لبدء ظهور وتوليد أول رمز مميز في ناتج النموذج. 

      • الإنتاجية: مقياس لإجمالي قدرة توليد الرموز في النموذج، والتي يتم قياسها بالرموز في الثانية (TPS). 

      • زمن الانتقال: مقدار الوقت الذي يستغرقه النموذج لتوليد مخرجات كاملة بعد تلقي السؤال من المستخدم (الإدخال).

      التحديثات

      وما لم يتم تدريب النموذج باستخدام التعلم المستمر، فإن مجموعة بيانات التدريب الخاصة ستظل محدودة. ويشير حد المعرفة للنموذج إلى التاريخ الأخير الذي تم فيه تحديث قاعدة المعرفة الخاصة به ببيانات جديدة. وبمرور الوقت، يصبح النموذج أقل أهمية مع تقادُم المعلومات الموجودة في قاعدة المعرفة. 

      يجب تحديث النماذج بانتظام للتخفيف من انحراف النموذج وإبقاء معدلات الخطأ عند أدنى حد مقبول. ويمكن للبيانات الجديدة والميزات الجديدة والتحديثات الخوارزمية أن تعمل على تحسين أداء النموذج. ويساعد إعادة التدريب أيضًا النماذج على بقائها محدَّثة.

      الامتثال

      عندما يتعلق الأمر بجمع البيانات، يجب على مشغلي النماذج مراعاة جميع اللوائح والمتطلبات القانونية ذات الصلة بالخصوصية والملكية الفكرية وحقوق النشر وغيرها من المخاوف. على سبيل المثال، يحمي قانون نقل التأمين الصحي والمساءلة (HIPAA) البيانات الطبية في الولايات المتحدة، بينما توفر اللائحة العامة لحماية البيانات حماية محددة للبيانات للأشخاص في الاتحاد الأوروبي. 

      وقد تخضع النماذج المصممة للاستخدام في الصناعات المنظمة، مثل الصناعات الدوائية والتمويل، أيضًا لضوابط تشغيلية أكثر صرامة. ومن المحتمل أن تقوم أي نماذج مستخدمة في بيئة مؤسسية بمعالجة بيانات داخلية حساسة، ما يستلزم اتخاذ تدابير قوية للأمن الإلكتروني.

      يلتزم مشغلو النماذج بحماية بيانات المستخدمين ومنع استخدام نماذجهم في أغراض ضارة، كالاحتيال والمعلومات المضللة. ومن مزايا النماذج مفتوحة المصدر هي أن أي شخص يمكنه تقييم النموذج لمعرفة كيفية عمله وما إذا كان يتوافق مع جميع اللوائح التنظيمية ذات الصلة.

      فوائد سير العمل التعلم الآلي

      توفر مسارات التعلم الآلي العديد من الفوائد، مثل: 

      • النمذجة 

      • قابلية إعادة الإنتاج

      • الكفاءة 

      • قابلية التوسع

      • التجريب 

      • النشر 

      • التعاون 

      • التحكم في الإصدار والوثائق

      النمذجة

      تقسِّم المسارات عملية التعلم الآلي إلى خطوات معيارية معرَّفة جيدًا. حيث يمكن تطوير كل خطوة واختبارها وتحسينها بشكل مستقل، ما يجعل إدارة سير العمل وصيانته عملية سهلة.

      قابلية إعادة الإنتاج

      جعلت مسارات التعلم الآلي إعادة إنتاج التجارب أسهل من ذي قبل. حيث يساعد تحديد تسلسل الخطوات ومعامِلاتها في المسار على ضمان الحصول على نتائج متسقة. فإذا فشلت خطوة أو تدهور أداء النموذج، يمكن ضبط إعدادات المسار بحيث يرسل تنبيهًا ما أو يتخذ إجراءات تصحيحية.

      الفاعلية

      تعمل المسارات على أتمتة العديد من المهام الروتينية، كالمعالجة المسبقة للبيانات مثلًا وهندسة السمات وتقييم النموذج. وهذه الكفاءة توفر الوقت وتقلل من الأخطاء.

      قابلية التوسع

      يمكن توسيع نطاق المسارات للتعامل مع مجموعات البيانات الكبيرة أو حالات سير العمل المعقدة. مع تزايد تعقيد البيانات والنماذج، يمكنك تعديل المسار دون حاجة إلى إعادة تكوين وضبط كل شيء من البداية.

      التجربة

      يفتح تعديل الخطوات الفردية داخل المسار الباب أمام إجراء تجارب باستخدام تقنيات معالجة البيانات المسبقة المختلفة واختيار الميزات والنماذج. تتيح هذه المرونة التكرار السريع والتحسين.

      خيارات النشر

      تُسهِّل مسارات العمل نشر نماذج التعلم الآلي في بيئة الإنتاج. فوجود مسار معرَّف جيدًا لتدريب النموذج وتقييمه يجعل نشر النموذج في التطبيق أو النظام أسهل وأيسر.

      التعاون

      تتيح المسارات لفرق العمل، التي تضم علماء بيانات ومهندسين، التعاون فيما بينهم. ولأن سير العمل منظَّم وموثق، فمن السهل لأعضاء الفريق فهم المشروع جيدًا والمساهمة في نجاحه.

      التحكم في الإصدار والوثائق

      تعمل أنظمة التحكم في الإصدار على تتبع التغييرات في التعليمات البرمجية للمسار والتكوينات، ما يسمح بالرجوع إلى الإصدارات السابقة. ويشجع المسار المنظَّم جيدًا على توثيق كل خطوة بشكل أفضل.

      تاريخ مسارات التعلم الآلي

      يرتبط تاريخ مسارات التعلم الآلي ارتباطًا وثيقًا بتطور كل من مجال التعلم الآلي ومجال علوم البيانات. وبينما نجد أن مفهوم سير عمل معالجة البيانات يسبق التعلم الآلي، إلا إن إضفاء الطابع الرسمي والاستخدام الواسع النطاق لمسارات التعلم الآلي تطور مؤخرًا. 

      تتضمن التطورات التاريخية لمسارات التعلم الآلي التطورات التالية: 

      • سير عمل معالجة البيانات المبكرة (قبل العقد الأول من القرن الحادي والعشرين) 

      • ظهور التعلم الآلي (العقد الأول من القرن الحادي والعشرين) 

      • بدء صعود علم البيانات (من أواخر العقد الأول من القرن الحادي والعشرين إلى أوائل العقد الثاني من القرن الحادي والعشرين) 

      • تطوير مكتبات وأدوات التعلم الآلي (العقد الثاني من القرن الحادي والعشرين) 

      • بدء صعود AutoML (العقد الثاني من القرن الحادي والعشرين) 

      • التكامل مع عمليات التطوير (DevOps) (العقد الثاني من القرن الحادي والعشرين) 

      سير عمل معالجة البيانات المبكرة (قبل العقد الأول من القرن الحادي والعشرين)

      قبل الاعتماد الواسع النطاق للتعلم الآلي، كانت عمليات سير عمل معالجة البيانات تُستخدم لمهام مثل تنظيف البيانات وتحويلها وتحليلها. وكانت مهام سير العمل هذه تتم عادةً يدويًا وتتضمن نصوصًا برمجية (سكربتات) أو أدوات مثل برامج جداول البيانات. ومع ذلك، لم يكن التعلم الآلي جزءًا أساسيًا من هذه العمليات طوال هذه الفترة.

      ظهور التعلم الآلي (العقد الأول من القرن الحادي والعشرين)

      اكتسب التعلم الآلي أهمية كبيرة في أوائل العقد الأول من القرن الحادي والعشرين مع التقدم الحادث في الخوارزميات ونمو القوة الحاسوبية وتوافر مجموعات البيانات الضخمة. حيث بدأ الباحثون وعلماء البيانات في تطبيق التعلم الآلي في مجالات شتى، ما أدى إلى الحاجة المتزايدة إلى سير عمل ممنهج ومؤتمت.

      بدء صعود علم البيانات (من أواخر العقد الأول من القرن الحادي والعشرين إلى أوائل العقد الثاني من القرن الحادي والعشرين)

      أصبح مصطلح علم البيانات شائعًا كمجال متعدد التخصصات يجمع بين الإحصاء وتحليل البيانات والتعلم الآلي. وشهد هذا العصر إضفاء الطابع الرسمي على سير عمل علوم البيانات، بما في ذلك معالجة البيانات مسبقًا واختيار النموذج وتقييمه، والتي أصبحت الآن أجزاءً لا يتجزأ من مسارات التعلم الآلي.

      تطوير مكتبات وأدوات التعلم الآلي (العقد الثاني من القرن الحادي والعشرين)

      شهد العقد الثاني من القرن الحادي والعشرين تطوير مكتبات وأدوات التعلم الآلي التي سهلت إنشاء المسارات. ساعدت مكتبات مثل scikit-learn (في لغة Python) وCaret (في لغة R) في توفير واجهات API موحَّدة لبناء وتقييم نماذج التعلم الآلي، ما سهَّل إنشاء المسارات.

      بدء صعود AutoML (العقد الثاني من القرن الحادي والعشرين)

      ظهرت أدوات ومنصات التعلم الآلي (AutoML) لأتمتة عملية بناء مسارات التعلم الآلي. حيث تعمل هذه الأدوات عادةً على أتمتة مهام ضبط المعلمات الفائقة واختيار السمات واختيار النموذج، ما جعل التعلم الآلي أكثر سهولة للخبراء من خلال العروض المصورة للبيانات والبرامج التعليمية.

      التكامل مع DevOps (العقد الثاني من القرن الحادي والعشرين)

      بدأت ممارسات عمليات التطوير في دمج مسارات التعلم الآلي لتمكين التكامل والنشر (CI/CD) لنماذج التعلم الآلي. أكد هذا التكامل، المعروف باسم عمليات التعلم الآلي (MLOps)، على الحاجة إلى توفير قابلية إعادة الإنتاج والتحكم في الإصدارات والمراقبة في مسارات التعلم الآلي. 

      تساعد عمليات التعلم الآلي (MLOps) فرق عمل علم البيانات على استكشاف حلول للتحديات المعقدة المتعلقة بتنسيق الذكاء الاصطناعي بفاعلية. في النشر في الوقت الفعلي، يستجيب المسار للطلب خلال زمن لا يتعدى مللي ثانية.

      حلول ذات صلة
      IBM watsonx.ai

      تدريب الذكاء الاصطناعي التوليدي والتحقق من صحته وضبطه ونشره، وكذلك قدرات نماذج الأساس والتعلم الآلي باستخدام IBM watsonx.ai، وهو استوديو الجيل التالي من المؤسسات لمنشئي الذكاء الاصطناعي. أنشئ تطبيقات الذكاء الاصطناعي بسرعة أكبر وببيانات أقل.

      اكتشف watsonx.ai
      حلول الذكاء الاصطناعي

      استفد من الذكاء الاصطناعي في عملك بالاستعانة بخبرة IBM الرائدة في مجال الذكاء الاصطناعي ومحفظة حلولها المتوفرة لك.

      استكشف حلول الذكاء الاصطناعي
      الاستشارات والخدمات المتعلقة بالذكاء الاصطناعي

      أعدّ ابتكار عمليات ومهام سير العمل الحساسة بإضافة الذكاء الاصطناعي لتعزيز التجارب وصنع القرارات في الوقت الفعلي والقيمة التجارية.

      استكشف خدمات الذكاء الاصطناعي
      اتخِذ الخطوة التالية

      احصل على وصول شامل إلى القدرات التي تغطي دورة حياة تطوير الذكاء الاصطناعي. تمكَّن من إنتاج حلول ذكاء اصطناعي قوية بفضل الواجهات سهلة الاستخدام وعمليات سير العمل السلسة وإمكانية الوصول إلى واجهات برمجة التطبيقات ومجموعات تطوير البرامج القياسية في الصناعة.

      استكشف watsonx.ai احجز عرضًا توضيحيًا مباشرًا