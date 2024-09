La maggior parte degli algoritmi di machine learning accetta come input solo dati numerici di basse dimensioni. Pertanto, è necessario convertire i dati in un formato numerico. Ciò può comportare cose come la creazione di una rappresentazione a "sacchetto di parole" per dati di testo, la conversione di immagini in valori di pixel o la trasformazione di dati grafici in una matrice numerica.

Gli oggetti che entrano in un modello di incorporamento vengono emessi come incorporamenti, rappresentati come vettori. Un vettore è una serie di numeri (ad es. 1489, 22… 3, 777), in cui ciascun numero indica dove si trova un oggetto lungo una dimensione specificata. Il numero di dimensioni può raggiungere un migliaio o più, a seconda della complessità dei dati di input. Più un incorporamento è vicino ad altri incorporamenti in questo spazio n-dimensionale, più saranno simili. La somiglianza di distribuzione è determinata dalla lunghezza dei punti vettoriali da un oggetto all'altro (misurata per euclideo, coseno o altro).

Word2Vec (da parola a vettore), un modello sviluppato da Google nel 2013, è un metodo per creare in modo efficiente incorporamenti di parole utilizzando una rete neurale a due livelli. Prende come input una parola e fa uscire una coordinata n-dimensionale (il vettore di incorporamento), in modo che quando questi vettori di parole vengono tracciati in uno spazio tridimensionale, i sinonimi vengano raggruppate.

Ecco come due parole, "papà" e "mamma" sarebbero rappresentate come vettori:

"papà" = [0,1548, 0,4848, …, 1,864]

"mamma" = [0,8785, 0,8974, …, 2,794]

Sebbene ci sia qualche somiglianza tra queste due parole, ci aspetteremmo che "padre" si trovi molto più vicino a "papà" nello spazio vettoriale, risultando in un prodotto scalare più alto (una misura della direzione relativa di due vettori e di quanto strettamente sono allineati nella direzione in cui puntano).

Un esempio più complesso è l'incorporamento delle raccomandazioni, che funziona rappresentando utenti ed elementi (ad esempio film, prodotti, articoli) come vettori ad alte dimensioni in uno spazio vettoriale continuo. Questi incorporamenti catturano funzionalità latenti che riflettono le preferenze degli utenti e le caratteristiche degli articoli. L'idea è di imparare una rappresentazione per ogni utente e elemento, in modo tale che il prodotto scalare dei loro incorporamenti sia correlato alla preferenza dell'utente per quell'elemento specifico.

Ogni utente ed elemento è associato a un vettore di incorporamento generalmente appreso tramite un modello di raccomandazione in un processo di formazione. Gli incorporamenti di utenti e gli incorporamenti di elementi sono organizzati in matrici. Le righe della matrice utente rappresentano gli utenti, mentre e le righe della matrice elementi rappresentano gli elementi.

Il punteggio di raccomandazione per una coppia utente-elemento può essere calcolato prendendo il prodotto punto del vettore di incorporamento dell'utente e il vettore di incorporamento dell'elemento. Più alto è il prodotto scalare, maggiore è la probabilità che l'utente sia interessato all'elemento.

Punteggio di raccomandazione = Incorporamento utente ⋅ Incorporamento elemento

Le matrici di incorporamento vengono apprese attraverso un processo di addestramento utilizzando le interazioni storiche utente-elemento. Il modello mira a minimizzare la differenza tra i punteggi previsti e le preferenze effettive dell'utente (ad esempio valutazioni, clic, acquisti).

Una volta addestrato, il modello può essere utilizzato per generare raccomandazioni top-N per gli utenti. Vengono consigliati gli articoli con i punteggi previsti più alti per un utente.