خوارزمية آلة المتجهات الداعمة (SVM) هي خوارزمية تعلم آلي خاضعة للإشراف تصنِّف البيانات من خلال إيجاد خط مثالي أو مستوى فائق يوسع المسافة الفاصلة بين كل فئة في مساحة متعددة الأبعاد.
في التسعينيات، قام Vladimir N. Vapnik وزملاؤه بتطوير خوارزمية SVMs، ونشروا هذا العمل في ورقة بحثية بعنوان "Support Vector Method for Function Approximation, Regression Estimation, and Signal Processing"1 في عام 1995.
تُستخدم خوارزمية SVMs بشكل شائع في مشاكل التصنيف، إذ تميِّز تلك الآلات بين فئتين من خلال إيجاد المستوى الفائق الأمثل الذي يزيد من الهامش بين أقرب نقاط بيانات للفئات المتقابلة. ويحدِّد عدد الميزات في بيانات الإدخال ما إذا كان المستوى الفائق عبارة عن خط في مساحة ثنائية الأبعاد أو مستوٍ في مساحة متعددة الأبعاد. ونظرًا لأنه من الممكن العثور على مستويات فائقة متعددة للتمييز بين الفئات، فإن تعظيم الهامش بين النقاط يمكّن الخوارزمية من العثور على حدود أفضل قرار بين الفئات. وهذا بدوره يمكّنها من التعميم بشكل جيد على البيانات الجديدة وإجراء تنبؤات تصنيفية دقيقة. تُعرف الخطوط المجاورة للمستوى الفائق المثالي باسم متجهات الدعم حيث تمر هذه المتجهات عبر نقاط البيانات التي تحدد الحد الأقصى للهوامش.
تُستخدم خوارزمية SVM على نطاق واسع في التعلم الآلي؛ لأنها تستطيع التعامل مع مهام التصنيف الخطية وغير الخطية. ومع ذلك، عندما تكون البيانات غير قابلة للفصل خطيًا، تُستخدم دوال النواة لتحويل المساحة ذات الأبعاد الأعلى والمخصصة للبيانات من أجل تمكين الفصل الخطي. تُعرَف هذه الطريقة لتطبيق دوال النواة باسم "خدعة النواة"، وتتطلب اختيار دالة نواة، مثل النوى الخطية، أو النوى متعددة الحدود، أو نواة الأساس الشعاعي (RBF)، أو نوى sigmoid استنادًا إلى خصائص البيانات وحالات الاستخدام المعينة.
تُستخدَم خوارزمية SVMs الخطية مع البيانات القابلة للفصل خطيًا؛ ما يعني أن البيانات لا تحتاج إلى أي تحويلات لفصلها إلى فئات مختلفة. تشكِّل حدود القرار والنقاط الداعمة مظهر شارع، ويستخدم الأستاذ Professor Patrick من معهد ماساتشوستس للتكنولوجيا التشبيه "توسيع الشارع بأوسع شكل ممكن"2 لوصف هذه المشكلة في التحسين التربيعي. يمكن تمثيل المستوى الفائق الفاصل رياضيًا على النحو التالي:
wx + b = 0
حيث w هو متجه الوزن، وx هو متجه الإدخال، و b هو معامل التحيز.
هناك طريقتان لحساب الهامش، أو أقصى مسافة بين الفئات، وهما التصنيف بالهامش الصلب والتصنيف بالهامش اللين. إذا استخدمنا خوارزمية SVMs بهامش صلب، فسيتم فصل نقاط البيانات تمامًا خارج المتجهات الداعمة، أو "خارج الشارع" للاستمرار في تشبيه البروفيسور Hinton. يُمثل ذلك بالصيغة التالية:
(wxj + b) yj ≥ a،
ثم تتم زيادة الهامش إلى الحد الأقصى، الذي يتم تمثيله على النحو التالي: max ə= a/||w||، حيث a هو الهامش المُسقط على w.
تصنيف الهامش اللين أكثر مرونة، حيث يسمح ببعض الأخطاء في التصنيف من خلال استخدام متغيرات الركود ("ξ"). تضبط قيمة معامل C الهامش؛ فكلما كانت قيمة C أكبر، كان الهامش أضيق لتقليل الأخطاء، بينما إذا كانت قيمة C أصغر، زاد الهامش، مما يسمح بزيادة الأخطاء.3
الكثير من البيانات في السيناريوهات الواقعية ليست قابلة للفصل خطياً، وهنا يأتي دور خوارزمية SVMs غير الخطية. لجعل البيانات قابلة للفصل خطياً، يتم تطبيق طرق المعالجة المسبقة على بيانات التدريب لتحويلها إلى مساحة ميزات ذات أبعاد أعلى. ومع ذلك، يمكن أن تؤدي المساحات ذات الأبعاد الأعلى إلى مزيد من التعقيد من خلال زيادة خطر الإفراط في تخصيص البيانات وزيادة التكلفة الحاسوبية. تساعد "خدعة النواة" في تقليل بعض هذا التعقيد، مما يجعل الحساب أكثر كفاءة، ويتم ذلك عن طريق استبدال عمليات الضرب النقطي بدالة نواة مكافئة 4.
هناك عدة أنواع مختلفة من النواة يمكن تطبيقها لتصنيف البيانات. تتضمن بعض وظائف النواة الشائعة ما يلي:
نواة متعددة الحدود
نواة دالة الأساس الشعاعي (تُعرف أيضًا باسم نواة Gaussian أو RBF)
نواة سيجمويد
انحدار المتجه الدعم (SVR) هو امتداد لخوارزمية SVMs، والذي يتم تطبيقه على مشاكل الانحدار (أي أن النتيجة مستمرة). يشبه انحدار SVR خوارزمية SVMs الخطية، حيث يجد مستوى فاصل مع أكبر هامش بين نقاط البيانات، ويستخدم عادة للتنبؤ بالسلاسل الزمنية.
يختلف انحدار SVR عن الانحدار الخطي في أنك تحتاج إلى تحديد العلاقة التي تتطلع إلى فهمها بين المتغيرات المستقلة والتابعة. يكون فهم العلاقات بين المتغيرات وتوجهاتها مفيدًا عند استخدام الانحدار الخطي. وهذا غير ضروري في انحدار SVR حيث تحدد هذه العلاقات بشكل تلقائي.
في هذا القسم، سنناقش عملية بناء خوارزمية التصنيف SVM، وكيفية مقارنتها مع خوارزميات التعلم تحت الإشراف الأخرى وتطبيقاته في الصناعة اليوم.
كما هو الحال مع نماذج التعلم الآلي الأخرى، ابدأ بتقسيم بياناتك إلى مجموعة تدريب ومجموعة اختبار. كإضافة، يفترض هذا أنك قد أجريت بالفعل تحليلًا استكشافيًا على بياناتك. على الرغم من أن هذا ليس ضروريًا من الناحية الفنية لبناء خوارزمية تصنيف SVM، إلا أنه من الممارسات الجيدة قبل استخدام أي نموذج للتعلم الآلي، حيث يمنحك فهمًا لأي بيانات مفقودة أو قيم خارجية.
قم باستيراد وحدة خوارزمية SVM من المكتبة التي تختارها، مثل scikit-learn (يؤدي الرابط إلى صفحة خارج موقع ibm.com). درِّب عينات التدريب على المصنِّف وتنبأ بالرد. يمكنك تقييم الأداء من خلال مقارنة دقة مجموعة الاختبار بالقيم المتنبأ بها. قد ترغب في استخدام مقاييس تقييم أخرى، مثل f1-score أو الدقة أو الاستدعاء.
يمكن ضبط المعاملات الفائقة لتحسين أداء نموذج خوارزمية SVM. يمكن العثور على المعاملات الفائقة المثلى باستخدام طرق البحث الشبكي والتحقق المتقاطع، التي تقوم بالتنقل عبر قيم الأنوية، ومعاملات التنظيم (C) وقيم جاما المختلفة للعثور على أفضل تركيبة.
يمكن استخدام مصنفات مختلفة للتعلم الآلي لنفس حالة الاستخدام. من المهم اختبار النماذج المختلفة وتقييم أداءها لفهم النماذج التي تقدم أفضل أداء. ومع ذلك، قد يكون من المفيد فهم نقاط القوة والضعف لكل نموذج لتقييم تطبيقه على حالة الاستخدام الخاصة بك.
تُستخدَم كلٌّ من خوارزميات التصنيف Naive bayes وSVM بشكل شائع في مهام تصنيف النصوص. تميل خوارزمية SVM إلى تقديم أداء أفضل من خوارزمية Naive bayes عندما لا تكون البيانات قابلة للفصل خطيًا. ومع ذلك، يجب على SVMs ضبط معاملات فائقة متعددة وقد يكون ذلك أكثر تكلفة من الناحية الحاسوبية.
عادةً ما تقدم خوارزمية SVM أداءً أفضل مع مجموعات البيانات ذات الأبعاد العالية وغير المنظمة، مثل بيانات الصور والنصوص، مقارنة بالانحدار اللوجستي. كما أن خوارزمية SVM أقل عرضة للإفراط في التكيف وأسهل في التفسير. ومع ذلك، يمكن أن تكون خوارزمية SVM أكثر تكلفة من الناحية الحاسوبية.
تعمل خوارزمية SVMs بشكل أفضل مع البيانات عالية الأبعاد وتكون أقل عرضة للإفراط في التكيف مقارنة بأشجار القرار. ومع ذلك، عادةً ما تكون أشجار القرار أسرع في التدريب، خاصةً مع مجموعات البيانات الصغيرة، وعادة ما تكون أسهل في التفسير.
مثل المقارنات الأخرى بين النماذج، تكون خوارزمية SVM أكثر تكلفة من الناحية الحاسوبية وأقل عرضة للإفراط في التكيف، بينما تعتبر الشبكات العصبية أكثر مرونة وقابلة للتوسع.
على الرغم من أن SVM يمكن استخدامها في العديد من المهام، فإن هذه بعض من أكثر التطبيقات شهرة لها عبر القطاعات.
تُستخدم خوارزمية SVMs بشكل شائع في معالجة اللغة الطبيعية (NLP)، عادة في مهام مثل تحليل المشاعر، واكتشاف البريد العشوائي غير المرغوب فيه، ونمذجة الموضوعات. تعمل هذه الخوارزمية جيدًا مع البيانات عالية الأبعاد، مما يجعلها ملائمة لهذه المهام.
تُستخدم خوارزمية SVMs في مهام تصنيف الصور مثل اكتشاف الأجسام واسترجاع الصور. يمكن أن تكون مفيدة أيضًا في مجالات الأمان، مثل تصنيف الصور التي تم التلاعب بها.
كما تُستخدم خوارزمية SVMs في تصنيف البروتينات، وتحليل التعبير الجيني، وتشخيص الأمراض. ويشيع استخدام خوارزمية SVMs في أبحاث السرطان (يؤدي الرابط إلى صفحة خارج موقع ibm.com) لأنها تستطيع اكتشاف التغيرات الدقيقة في مجموعات البيانات المعقدة.
تُستخدم خوارزمية SVMs لتحليل الهياكل الجيوفيزيائية تحت الأرض، وتصفيها من "الضوضاء" في البيانات الكهرومغناطيسية. كما ساهمت في التنبؤ بإمكانية السيولة الزلزالية للتربة، وهو موضوع ذو صلة بمجال الهندسة المدنية.
IBM Granite هي مجموعة من نماذج الذكاء الاصطناعي المفتوحة والموثوق بها وذات الأداء العالي والتي صُمِمَت خصيصًا للأعمال وجرى الارتقاء بها على النحو الأمثل لتوسيع نطاق تطبيقات الذكاء الاصطناعي لديك. استكشف خيارات اللغة والتعليمات البرمجية والسلاسل الزمنية والدرابزين.
لقد قمنا باستطلاع آراء 2000 مؤسسة حول مبادرات الذكاء الاصطناعي لديها لمعرفة ما ينجح وما لا ينجح وكيف يمكنك المضي قدمًا.
استكشف أساليب التعلم الخاضعة للإشراف مثل مصنفات آلات المتجهات الداعمة والمصنفات الاحتمالية.
تعلّم المفاهيم الأساسية وطوّر مهاراتك من خلال المختبرات العملية والدورات التدريبية والمشاريع الموجهة والتجارب وغيرها.
تعرّف على كيفية اختيار نموذج أساس الذكاء الاصطناعي الأكثر ملاءمة لحالة الاستخدام الخاصة بك.
تدريب الذكاء الاصطناعي التوليدي والتحقق من صحته وضبطه ونشره، وكذلك قدرات نماذج الأساس والتعلم الآلي باستخدام IBM watsonx.ai، وهو استوديو الجيل التالي من المؤسسات لمنشئي الذكاء الاصطناعي. أنشئ تطبيقات الذكاء الاصطناعي بسرعة أكبر وببيانات أقل.
استفد من الذكاء الاصطناعي في عملك بالاستعانة بخبرة IBM الرائدة في مجال الذكاء الاصطناعي ومحفظة حلولها المتوفرة لك.
أعدّ ابتكار عمليات ومهام سير العمل الحساسة بإضافة الذكاء الاصطناعي لتعزيز التجارب وصنع القرارات في الوقت الفعلي والقيمة التجارية.
كل الروابط تنقلك خارج موقع ibm.com
1 طريقة متجه الدعم لتقريب الوظيفة وتقدير الانحدار ومعالجة الإشارات
2 Lecture 16 notes on Support Vector Machines, Patrick Winston, MIT, 2010
3 Introduction to Support Vector Machines, Boswell, Dustin, Caltech, 2002
4 Support vector machines, Sontag, David, New York University