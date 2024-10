Le SVM sono state sviluppate negli anni '90 da Vladimir N. Vapnik e dai suoi colleghi, che hanno pubblicato questo lavoro in un articolo intitolato "Support Vector Method for Function Approximation, Regression Estimation, and Signal Processing"1 nel 1995.

Le SVM sono comunemente utilizzate nei problemi di classificazione. Operano una distinzione tra due classi trovando l'iperpiano ottimale che massimizza il margine tra i punti dati più vicini delle classi opposte. Il numero di caratteristiche nei dati di input determina se l'iperpiano è una linea in uno spazio bidimensionale o un piano in uno spazio n-dimensionale. Poiché è possibile trovare più iperpiani per differenziare le classi, massimizzare il margine tra i punti consente all'algoritmo di individuare il miglior confine decisionale tra le classi. Ciò, a sua volta, consente di generalizzare bene i nuovi dati e di fare previsioni di classificazione accurate. Le linee adiacenti all'iperpiano ottimale sono note come vettori di supporto poiché questi vettori attraversano i punti dati che determinano il margine massimo.

L'algoritmo SVM è ampiamente utilizzato nel machine learning per la sua capacità di gestire attività di classificazione sia lineari che non lineari. Tuttavia, quando i dati non sono linearmente separabili, vengono utilizzate funzioni kernel per trasformare i dati in uno spazio multidimensionale, consentendo la separazione lineare. Questa applicazione delle funzioni kernel è nota come "kernel trick", e la scelta della funzione kernel, come kernel lineari, kernel polinomiali, kernel RBF (Radial Basis Function) o kernel sigmoide, dipende dalle caratteristiche dei dati e dal caso d'uso specifico.