Les SVM ont été développées dans les années 1990 par Frédéric N. Vapnik et ses collègues, qui ont publié leurs travaux dans un article intitulé « Support Vector Method for Function approximation, Regression Estimation, and Signal Processing » (Méthode de vecteurs de support pour l’approximation de fonctions, l’estimation de régression et le traitement du signal) 1 en 1995.
Les SVM sont couramment utilisées dans les problèmes de classification. Elles distinguent deux classes en trouvant l’hyperplan optimal qui maximise la marge entre les points de données les plus proches des classes opposées. Le nombre de fonctionnalités dans les données d’entrée détermine si l’hyperplan est une ligne dans un espace à 2 dimensions ou un plan dans un espace à n dimensions.
Étant donné que plusieurs hyperplans peuvent être trouvés pour différencier les classes, l’optimisation de la marge entre les points permet à l’algorithme de trouver la meilleure limite de décision entre les classes. Ceci lui permet de bien généraliser à de nouvelles données et de faire des prédictions de classification précises. Les lignes adjacentes à l’hyperplan optimal sont appelées vecteurs de support, car ces vecteurs passent par les points de données qui déterminent la marge maximale.
L’algorithme SVM est largement utilisé dans le machine learning, car il peut gérer des tâches de classification linéaires et non linéaires. Toutefois, lorsque les données ne sont pas linéairement séparables, des fonctions de noyau sont utilisées pour transformer les données dans un espace à plus haute dimension afin de permettre une séparation linéaire.
Cette application des fonctions du noyau est connue sous le nom de « astuce du noyau », et le choix de la fonction du noyau, telle que les noyaux linéaires, les noyaux polynomiaux, les noyaux à fonction de base radiale (RBF) ou les noyaux sigmoïdes, dépend des caractéristiques des données et du cas d’utilisation spécifique.