Un sistema di filtraggio collaborativo filtra i suggerimenti in base alla somiglianza di un particolare utente con gli altri. I sistemi di raccomandazione collaborativi si basano su dati espliciti e impliciti e presumono che gli utenti con preferenze comparabili saranno probabilmente interessati agli stessi elementi e, potenzialmente, interagiranno con essi in modi simili in futuro.

Ad esempio, Amazon (link esterno a ibm.com) utilizza il filtraggio collaborativo per i suoi consigli sui prodotti, come Spotify (link esterno a ibm.com) fa per i suoi contenuti audio.



I raccomandatori di filtraggio collaborativo possono offrire suggerimenti efficaci e di solito non richiedono descrizioni dettagliate degli articoli. Tuttavia, il filtro collaborativo è anche soggetto al problema dell'avvio a freddo, che si verifica quando il sistema ha dati storici limitati da cui attingere, soprattutto per i nuovi utenti.

Esistono 2 tipi principali di sistemi di filtraggio collaborativo: quelli basati sulla memoria e quelli basati sui modelli.

Basati sulla memoria

I sistemi basati sulla memoria rappresentano utenti ed elementi come una matrice. Sono un'estensione dell'algoritmo k-nearest neighbors (KNN) perché mirano a trovare i "vicini più prossimi", che possono essere utenti o oggetti simili. I sistemi basati sulla memoria sono ulteriormente suddivisi in 2 tipi:

I filtri basati sugli utenti calcolano le somiglianze tra un determinato utente e tutti gli altri utenti nella matrice. Le funzioni di somiglianza basate sull'utente vengono calcolate tra le righe della matrice utente-elemento.

Il filtro basato sugli articoli calcola la somiglianza degli articoli in base al comportamento degli utenti (cioè a come gli utenti interagiscono con gli elementi e non con le caratteristiche degli articoli). Le funzioni di similarità basate sugli elementi vengono calcolate tra le colonne nella matrice utente-elemento.

Basati su modelli

In alternativa, i sistemi basati sui modelli creano un modello predittivo di machine learning dei dati. La matrice utente-elemento funge da set di dati di addestramento per il modello, che quindi fornisce previsioni per i valori mancanti, ovvero gli elementi che un utente non ha ancora trovato e che saranno quindi consigliati.

Uno degli algoritmi di filtraggio collaborativo basati su modelli più comuni è la fattorizzazione della matrice. Questo metodo di riduzione della dimensionalità scompone la matrice degli elementi utente, spesso di grandi dimensioni, in due matrici più piccole, una per gli utenti e l'altra per gli elementi, con poche dimensioni selezionate. Le 2 matrici vengono quindi moltiplicate insieme per prevedere i valori mancanti (o le raccomandazioni) nella matrice più grande.

Un'implementazione più avanzata della fattorizzazione della matrice sfrutta le reti neurali di deep learning. Altri sistemi basati sui modelli impiegano algoritmi di machine learning come classificatori Bayesiani, il clustering e gli alberi decisionali.