التعلم الآلي

menu icon

التعلم الآلي

يركز التعلم الآلي على التطبيقات التي تتعلم من التجربة وتحسن عملية اتخاذ القرار أو الدقة التنبؤية لديها بمرور الوقت.

ما هو التعلم الآلي؟

التعلم الآلي هو فرع من فروع الذكاء الاصطناعي (AI) يركز على بناء التطبيقات التي تتعلم من البيانات وتحسن دقتها بمرور الوقت دون أن يتم برمجتها للقيام بذلك. 

في علم البيانات، تعد الخوارزمية هي سلسلة من خطوات التشغيل الإحصائية. وفي التعلم الآلي، يتم 'تدريب' الخوارزميات لإيجاد النماذج والخصائص في كميات هائلة من البيانات من أجل اتخاذ القرارات والتنبؤات بناء على البيانات الجديدة. كلما كانت الخوارزمية أفضل، كلما أصبحت القرارات والتنبؤات أكثر دقة كلما تقوم بتشغيل المزيد من البيانات.

اليوم، هناك أمثلة على التعلم الآلي في كل مكان حولنا. حيث يقوم المساعدون الرقميون ببحث شبكة الإنترنت وتشغيل الموسيقى استجابة لأوامرنا الصوتية. وتوصي مواقع الإنترنت بالمنتجات والأفلام والأغاني بناء على ما قمنا بشرائه أو مشاهدته أو الاستماع آليه من قبل. وتقوم الروبوتات بتنظيف أرضياتنا بينما نفعل... شيء أفضل مع وقتنا. وتعمل برامج الكشف عن البريد غير الهام على إيقاف رسائل البريد الإلكتروني غير المرغوب فيها من الوصول إلى صناديق البريد الوارد الخاصة بنا. وتساعد أنظمة تحليل الصور الطبية الأطباء على اكتشاف الأورام التي قد تكون غابت عنهم. وأول سيارة ذاتية القيادة تنطلق على الطريق.

يمكننا توقع المزيد. مع تزايد حجم البيانات الضخمة، كلما أصبحت الحوسبة أكثر قوة وبأسعار معقولة، ومع استمرار علماء البيانات في تطوير خوارزميات أكثر قدرة، فإن التعلم الآلي سيدفع قدرا أعظم وأعظم من الكفاءة في حياتنا الشخصية والعملية. 

كيف يعمل التعلم الآلي

توجد أربع خطوات أساسية لبناء تطبيق (أو نموذج) التعلم الآلي. يتم تنفيذ ذلك عادة من قبل علماء البيانات الذين يعملون بشكل وثيق مع المتخصصين في مجال الأعمال الذين يجري تطوير النموذج من أجلهم.

الخطوة 1:‏ اختيار وإعداد مجموعة بيانات التدريب

بيانات التدريب عبارة عن مجموعة بيانات تمثل البيانات التي سيقوم نموذج التعلم الآلي باستيعابها لحل المشكلة التي صمم لحلها. في بعض الحالات، تكون بيانات التدريب هي البيانات المصنفة — 'المعلمة' لاستدعاء الخصائص والتصنيفات التي سيحتاج النموذج إلى تحديدها. البيانات الأخرى هي غير المصنفة، وسيحتاج النموذج إلى استخراج هذه الخصائص وتخصيص تصنيفات خاصة به.

في كلتا الحالتين، يجب أن يتم إعداد بيانات التدريب بشكل صحيح — ترتيبها عشوائيا، وإزالة البيانات المكررة، والتحقق من الاختلالات أو التحيزات التي يمكن أن تؤثر على التدريب. يجب أيضا تقسيمها إلى مجموعتين فرعيتين: المجموعة الفرعية للتدريب، التي يتم استخدامها لتدريب التطبيق، والمجموعة الفرعية للتقييم، التي يتم استخدامها لاختباره وتنقيحه.

الخطوة 2:‏ اختيار خوارزمية للتشغيل على مجموعة بيانات التدريب

مرة أخرى، الخوارزمية هي مجموعة من خطوات التشغيل الإحصائية. يعتمد نوع الخوارزمية على النوع (المصنف أو غير المصنف) ومقدار البيانات في مجموعة بيانات التدريب وعلى نوع المشكلة المراد حلها.

تشمل الأنواع الشائعة من خوارزميات التعلم الآلي للاستخدام مع البيانات المصنفة ما يلي:

  • خوارزميات الانحدار: الانحدار الخطي واللوجستي هما أمثلة لخوارزميات الانحدار المستخدمة لفهم العلاقات في البيانات. يتم استخدام الانحدار الخطي للتنبؤ بقيمة المتغير التابع بناء على قيمة المتغير المستقل. ويمكن استخدام الانحدار اللوجستي عندما يكون المتغير التابع ثنائي بطبيعته: A أو B. على سبيل المثال، يمكن تدريب خوارزمية الانحدار الخطي للتنبؤ بالمبيعات السنوية لمندوب المبيعات (المتغير التابع) بناء على علاقتها بتعليم مندوب المبيعات أو سنوات الخبرة (المتغيرات المستقلة). نوع آخر من خوارزمية الانحدار يسمى آلة متجه الدعم وهو يكون مفيدا عندما يكون تصنيف المتغيرات التابعة أكثر صعوبة.
  • تسلسلات القرارات: تستخدم تسلسلات القرارات البيانات المصنفة لتقديم توصيات بناء على مجموعة من قواعد القرارات. على سبيل المثال، يمكن أن يقوم تسلسل القرار الذي يوصي بالرهان على حصان معين للفوز أو التصنيف أو العرض باستخدام بيانات عن الحصان (مثل العمر ونسبة الفوز والنسب) وتطبيق القواعد على تلك العوامل للتوصية باتخاذ تصرف أو قرار.
  • الخوارزميات القائمة على النسخة: يعد من الأمثلة الجيدة للخوارزمية القائمة على النسخة هي K-Nearest Neighbor أو k-nn. حيث يستخدم التصنيف لتقدير مدى احتمالية أن تكون نقطة البيانات عضوا في مجموعة أو أخرى بناء على قربها من نقاط البيانات الأخرى.

تتضمن خوارزميات الاستخدام مع البيانات غير المصنفة ما يلي:

  • خوارزميات التجميع: التفكير في أنظمة المجموعات كمجموعات. يركز التجميع على تحديد مجموعات السجلات المتشابهة وتصنيف السجلات وفقا للمجموعة التي تنتمي إليها. يتم ذلك دون معرفة مسبقة عن المجموعات وخصائصها. تتضمن أنواع خوارزميات التجميع أنظمة المجموعات K-means وTwoStep وKohonen.
  • خوارزميات الارتباط: تقوم خوارزميات الارتباط بايجاد النماذج والعلاقات في البيانات وتحدد علاقات 'if-then' المتكررة والتي تسمى قواعد الارتباط. وهي مماثلة للقواعد المستخدمة في استخراج البيانات.
  • الشبكات العصبية: تعد الشبكة العصبية خوارزمية تقوم بتعريف شبكة محددة الطبقات للعمليات الحسابية تتضمن طبقة المدخلات، حيث يتم استيعاب البيانات؛ وطبقة مخفية واحدة على الأقل، حيث يتم إجراء العمليات الحسابية والتوصل إلى استنتاجات مختلفة حول المدخلات؛ وطبقة المخرجات، حيث يتم تعيين احتمال لكل استنتاج. تقوم الشبكة العصبية العميقة بتعريف شبكة ذات طبقات مخفية متعددة، تعمل كل منها على تنقيح نتائج الطبقة السابقة على التوالي. (للحصول على مزيد من المعلومات، ارجع إلى قسم "التعلم العميق" أدناه.)

الخطوة 3:‏ تدريب الخوارزمية على تكوين النموذج

يعد تدريب الخوارزمية عملية تكرارية – تنطوي على تشغيل المتغيرات من خلال الخوارزمية، ومقارنة المخرجات بالنتائج التي كان يجب أن تنتجها، وضبط الأوزان والتحيزات داخل الخوارزمية التي قد تسفر عن نتيجة أكثر دقة، وتشغيل المتغيرات مرة أخرى حتى تقوم الخوارزمية بإرجاع النتيجة الصحيحة في معظم الأوقات. الخوارزمية الدقيقة المدربة الناتجة هي نموذج التعلم الآلي — وهو تمييز مهم يجب ملاحظته، لأنه يتم استخدام 'الخوارزمية' و'النموذج' بشكل غير صحيح بالتبادل، حتى من قبل خبراء التعلم الآلي.

الخطوة 4:‏ استخدام وتحسين النموذج 

تتمثل الخطوة الأخيرة في استخدام النموذج مع البيانات الجديدة، وفي أفضل الأحوال، من أجل تحسين دقتها وفعاليتها مع مرور الوقت. حيث سيعتمد مصدر البيانات الجديدة على المشكلة التي يتم حلها. على سبيل المثال، سيقوم نموذج التعلم الآلي المصمم للتعرف على البريد الغير هام باستيعاب رسائل البريد الإلكتروني، في حين أن نموذج التعلم الآلي الذي يقود مكنسة كهربائية روبوتية سيقوم باستيعاب البيانات الناتجة عن التفاعل في العالم الحقيقي مع الأثاث المنقول أو الأشياء الجديدة في الغرفة.

طرق التعلم الآلي

تنقسم طرق التعلم الآلي (تسمى أيضا أنماط التعلم الآلي) إلى ثلاث فئات أساسية.

للتعمق في الاختلافات بين هذه الأساليب، راجع "التعلم الخاضع للإشراف مقابل التعلم غير الخاضع للإشراف: ما هو الفرق؟"

التعلم الآلي الخاضع للإشراف            

يقوم التعلم الآلي الخاضع للإشراف بتدريب نفسه على مجموعة بيانات مصنفة. أي أنه يتم تعليم البيانات طبقا للمعلومات التي يتم بناء نموذج التعلم الآلي لتحديدها والتي يمكن تصنيفها حتى بالطرق التي يفترض أن يقوم النموذج بتصنيف البيانات بها. على سبيل المثال، قد يتم تدريب نموذج رؤية الحاسب المصمم للتعرف على كلاب شيبرد الألمانية الأصيلة على مجموعة بيانات من صور الكلاب المصنفة المختلفة.

يتطلب التعلم الآلي الخاضع للإشراف بيانات تدريب أقل من طرق التعلم الآلي الأخرى ويجعل التدريب أسهل لأن نتائج النموذج يمكن مقارنتها بالنتائج المصنفة الفعلية. لكن، يكون إعداد البيانات المصنفة بشكل صحيح أمر مكلف، وهناك خطر المبالغة في التجهيزات، أو تكوين نموذج مرتبط بشكل وثيق ومتحيز لبيانات التدريب بحيث لا يتعامل مع الاختلافات في البيانات الجديدة بدقة.

تعرف على المزيد حول التعلم الخاضع للإشراف.  

التعلم الآلي غير الخاضع للإشراف

يستوعب التعلم الآلي غير الخاضع للإشراف البيانات غير المصنفة — الكثير والكثير منها — ويستخدم الخوارزميات لاستخراج خصائص ذات معنى لتعليم البيانات وفرزها وتصنيفها في الوقت الفعلي، دون تدخل بشري. لا يتعلق التعلم غير الخاضع للإشراف بالتشغيل الآلي للقرارات والتنبؤات، بل يتعلق أكثر بتحديد النماذج والعلاقات في البيانات التي قد يفتقدها البشر. على سبيل المثال، اكتشاف البريد غير الهام — يقوم الأشخاص بإنشاء بريد إلكتروني أكثر مما يأمل فريق من علماء البيانات في تعليمه أو تصنيفه في حياتهم. يمكن لخوارزمية التعلم غير الخاضع للإشراف تحليل كميات ضخمة من رسائل البريد الإلكتروني والكشف عن الخصائص والنماذج التي تشير إلى البريد غير الهام (والحفاظ على التحسن باستمرار في الإبلاغ عن البريد غير الهام بمرور الوقت).

تعرف على المزيد حول التعلم غير الخاضع للإشراف.

التعلم شبه الخاضع للإشراف  

يوفر التعلم شبه الخاضع للإشراف وسيطا بين التعلم الخاضع للإشراف والتعلم غير الخاضع للإشراف. أثناء التدريب، يستخدم مجموعة بيانات مصنفة أصغر لتوجيه التصنيف واستخراج الخصائص من مجموعة بيانات أكبر غير مصنفة. يمكن للتعلم شبه الخاضع للإشراف أن يحل مشكلة عدم وجود بيانات مصنفة كافية (أو عدم القدرة على تحمل تصنيف بيانات كافية) لتدريب خوارزمية تعلم خاضعة للإشراف. 

التعلم الآلي المعزز

التعلم الآلي المعزز هو نموذج سلوكي للتعلم الآلي مشابه للتعلم الخاضع للإشراف، لكن الخوارزمية لم يتم تدريبها باستخدام البيانات النموذجية. يقوم هذا النموذج بالتعلم أثناء عمله من خلال التجربة والخطأ. وسيتم تعزيز سلسلة من النتائج الناجحة لوضع أفضل توصية أو سياسة لمشكلة معينة.

نظام IBM Watson®‎ الذي فاز في تحدي Jeopardy!‎ عام 2011 هو مثال جيد. استخدم النظام التعلم المعزز لتحديد ما إذا كان سيتم محاولة الرد (أو السؤال، كما هو)، وأي مربع سيتم تحديده على اللوحة، ومقدار الرهان — خاصة في الزوجي اليومي.

تعرف على المزيد حول التعلم المعزز.   

التعلم العميق

التعلم العميق هو مجموعة فرعية من التعلم الآلي (كل التعلم العميق هو التعلم الآلي، ولكن ليس كل التعلم الآلي هو التعلم العميق). تحدد خوارزميات التعلم العميق شبكة عصبية اصطناعية مصممة لتعلم الطريقة التي يتعلم بها العقل البشري. تتطلب نماذج التعلم العميق كميات كبيرة من البيانات التي تمر عبر طبقات متعددة من العمليات الحسابية، وتطبيق الأوزان والتحيزات في كل طبقة متتالية لتعديل النتائج وتحسينها باستمرار.

عادة ما تكون نماذج التعلم العميق غير خاضعة للإشراف أو شبه خاضعة للإشراف. يمكن أن تكون نماذج التعلم المعزز أيضا نماذج تعلم عميق. هناك أنواع معينة من نماذج التعلم العميق — بما في ذلك الشبكات العصبية التلافيفية (CNN) والشبكات العصبية المتكررة (RNN) — تقود التقدم في مجالات مثل رؤية الحاسب، ومعالجة اللغة الطبيعية (بما في ذلك التعرف على الكلام) والسيارات ذاتية القيادة. 

ارجع إلى المدونة "الذكاء الاصطناعي مقابل التعلم الآلي مقابل التعلم العميق مقابل الشبكات العصبية: ما الفرق؟" لإلقاء نظرة عن قرب على كيفية ارتباط المفاهيم المختلفة.

تعرف على المزيد عن التعلم العميق.                                                               

حالات استخدام التعلم الآلي في العالم الحقيقي

كما لوحظ في البداية، فإن التعلم الآلي موجود في كل مكان. فيما يلي بعض الأمثلة على التعلم الآلي التي قد تواجهها كل يوم:

  • المساعدون الرقميون: يتم تشغيل Apple Siri وAmazon Alexa وGoogle Assistant وغيرهم من المساعدين الرقميين الآخرين بواسطة معالجة اللغة الطبيعية (NLP)، وهي تطبيق للتعلم الآلي يمكن أجهزة الحاسب من معالجة البيانات النصية والصوتية و'فهم' اللغة البشرية بالطريقة التي يتعامل بها الأشخاص. تعمل معالجة اللغة الطبيعية أيضا على تشغيل التطبيقات التي تعتمد على الصوت مثل برامج GPS والتعرف على الكلام (تحويل الكلام إلى نص).
  • التوصيات: تقدم نماذج التعلم العميق توصيات 'أحب الأشخاص أيضا' و 'فقط لك' التي تقدمها Amazon وNetflix وSpotify وغيرها من خدمات البيع بالتجزئة والترفيه والسفر والبحث عن الوظائف والأخبار.
  • الإعلان السياقي عبر الإنترنت: يمكن لنماذج التعلم الآلي والتعلم العميق تقييم محتوى صفحة الإنترنت — ليس فقط الموضوع، ولكن الفروق الدقيقة مثل رأي المؤلف أو موقفه — وتقديم إعلانات مصممة وفقا لاهتمامات الزائر.
  • روبوتات المحادثة: روبوتات المحادثة يمكنها استخدام مجموعة من التعرف على النماذج ومعالجة اللغة الطبيعية والشبكات العصبية العميقة لتفسير نص المدخلات وتقديم استجابات مناسبة.
  • كشف الاحتيال:  قامت نماذج انحدار وتصنيف التعلم الآلي باستبدال أنظمة الكشف عن الاحتيال القائمة على القواعد، التي تضم عدد كبير من الإيجابيات الخاطئة عند الإبلاغ عن استخدام بطاقات الائتمان المسروقة والتي نادرا ما تنجح في الكشف عن الاستخدام الإجرامي للبيانات المالية المسروقة أو المخترقة.
  • الأمن الإلكتروني: يمكن أن يقوم التعلم الآلي باستخلاص المعلومات من تقارير الحوادث والتنبيهات ومنشورات المدونات والمزيد لتحديد التهديدات المحتملة وتقديم المشورة لمحللي الأمن وتسريع الاستجابة.
  • تحليل الصور الطبية: لقد انفجرت أنواع وأحجام بيانات التصوير الطبي الرقمي، مما أدى إلى مزيد من المعلومات المتاحة لدعم التشخيصات ولكن أيضا المزيد من الفرص للخطأ البشري في قراءة البيانات. وقد أثبتت الشبكات العصبية التلافيفية (CNN) والشبكات العصبية المتكررة (RNN) ونماذج التعلم العميق الأخرى نجاحا متزايدا في استخراج الخصائص والمعلومات من الصور الطبية للمساعدة في دعم التشخيص الدقيق.
  • السيارات ذاتية القيادة: تتطلب السيارات ذاتية القيادة القيام بجولة إجبارية للتعلم الآلي — يجب أن تقوم بشكل مستمر بتحديد الأشياء في البيئة المحيطة بالسيارة، والتنبؤ بكيفية تغييرها أو تحركها، وتوجيه السيارة حول الأشياء وكذلك نحو وجهة السائق. افتراضيا، يلعب كل شكل من أشكال خوارزميات التعلم الآلي والتعلم العميق المذكورة أعلاه دورا ما في تمكين السيارات ذاتية القيادة.

التعلم الآلي وIBM Cloud

IBM Watson Machine Learning يدعم دورة حياة التعلم الآلي من البداية إلى النهاية. وهو متاح في مجموعة من العروض التي تتيح لك ببناء نماذج التعلم الآلي أينما كانت بياناتك ونشرها في أي مكان في بيئتك متعددة الأوساط السحابية المختلطة. 

يساعد IBM Watson Machine Learning على IBM Cloud Pak for Data فرق علم بيانات المؤسسة والذكاء الاصطناعي على تسريع تطوير ونشر الذكاء الاصطناعي في أي مكان، على منصة البيانات والذكاء الاصطناعي السحابية الأصلية. يعد IBM Watson Machine Learning Cloud، وهو خدمة مدارة في بيئة تشغيل IBM Cloud، أسرع طريقة لنقل النماذج من التجربة على سطح المكتب إلى النشر لأحجام عمل الإنتاج. بالنسبة للفرق الأصغر التي تتطلع إلى توسيع نطاق عمليات نشر التعلم الآلي، يوفر IBM Watson Machine Learning Server عملية تركيب بسيطة على أي بيئة سحابية خاصة أو عامة.

للبدء، يجب التسجيل للحصول على IBMid ولانشاء حساب IBM Cloud الخاص بك.