LDA e PCA sono tipi di algoritmi di riduzione della dimensionalità lineare. L'incorporamento del vicino stocastico distribuito a T (t-SNE), tuttavia, è una forma di riduzione della dimensionalità non lineare (o apprendimento multiplo). Con l'obiettivo di preservare principalmente la varianza del modello, LDA e PCA si concentrano sul mantenimento della distanza tra punti dati dissimili nelle loro rappresentazioni dimensionali inferiori. Al contrario, t-SNE mira a preservare la struttura dei dati locali riducendo le dimensioni del modello. t-SNE differisce inoltre da LDA e PCA in quanto questi ultimi due possono produrre modelli con più di tre dimensioni, purché il modello generato abbia dimensioni inferiori rispetto ai dati originali. t-SNE, tuttavia, visualizza tutti i set di dati in tre o due dimensioni.

Come metodo di trasformazione non lineare, t-SNE rinuncia alle matrici di dati. Invece, t-SNE usa un kernel gaussiano per calcolare la somiglianza a coppie dei punti dati. I punti vicini l'uno all'altro nel set di dati originale hanno una maggiore probabilità di essere vicini rispetto a quelli più lontani. t-SNE mappa quindi tutti i punti dati su uno spazio tridimensionale o bidimensionale, tentando di preservare le coppie di dati.9

Esistono numerosi metodi aggiuntivi di riduzione della dimensionalità, come la PCA del kernel, l'analisi fattoriale, le foreste casuali e la scomposizione dei valori singolari (SVD). PCA, LDA e t-SNE sono tra i più utilizzati e discussi. Si noti che diversi pacchetti e librerie, come scikit-learn, sono precaricati con funzioni per l'implementazione di queste tecniche.