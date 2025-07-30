La similarità del coseno è una metrica di somiglianza ampiamente utilizzata che determina la somiglianza di due punti dati in base alla direzione in cui puntano anziché alla loro lunghezza o dimensione. È particolarmente efficace in spazi ad alta dimensionalità in cui le metriche tradizionali basate sulla distanza possono non funzionare bene.

Il calcolo della similarità del coseno richiede la misurazione del coseno dell'angolo (teta) tra due vettori diversi da zero in uno spazio di prodotto interno. Questa misurazione produce un punteggio di somiglianza del coseno. I valori di similarità del coseno variano da -1 a 1:

Un punteggio di similarità del coseno pari a 1 indica che i vettori puntano esattamente nella stessa direzione.

Un punteggio di similarità del coseno pari a 0 indica che i vettori sono ortogonali, ossia non hanno alcuna somiglianza direzionale.

Un punteggio di similarità del coseno di -1 indica che i vettori puntano in direzioni esattamente opposte.

Pensalo come a un confronto fra frecce: se puntano nella stessa direzione, sono molto simili. Quelle perpendicolari non sono correlate, mentre due frecce che puntano in direzioni opposte sono diverse.

Questo approccio angolare è fondamentale per molti sistemi di machine learning (ML), elaborazione del linguaggio naturale (NLP) e intelligenza artificiale (AI). Queste tecnologie si basano su rappresentazioni vettoriali dei dati, il che significa che i dati vengono convertiti in forma numerica per acquisirne il significato e la similarità con altri.

Ad esempio, un chatbot può utilizzare tecniche di embedding di parole per convertire il testo in forma vettoriale, modelli di deep learning per comprendere algoritmi di ricerca di intenti e somiglianze per recuperare la risposta più pertinente da un database. La similarità del coseno abilita ciascuno di questi passaggi.