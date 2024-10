Più due nuovi vettori sono vicini nello spazio vettoriale, più il nostro sistema li considera simili in base alle caratteristiche fornite.5 Peter Pan e L'isola del tesoro condividono esattamente le stesse caratteristiche e appaiono nello stesso punto vettoriale (1,1,0). Secondo il nostro sistema, quindi, sono identici. In effetti, condividono molti elementi della trama (ad esempio, isole sperdute e pirati) e temi (ad esempio, la crescita o la resistenza ad essa). Al contrario, sebbene Piccole donne sia un romanzo per bambini, non è un'avventura ma un romanzo di formazione. Sebbene Piccole donne sia un romanzo per bambini come Peter Pan e L'isola del tesoro, manca dei loro valori caratteristici di romanzo di avventura e possiede un valore di caratteristica 1 per il romanzo di formazione, cosa che manca agli altri due. Questo avvicina Piccole donne a L'abbazia di Northanger nello spazio vettoriale, poiché condividono gli stessi valori di attributi per le caratteristiche di romanzo di avventura e di formazione.

A causa della loro similarità in questo spazio, se un utente ha precedentemente acquistato Peter Pan, il sistema suggerirà quei romanzi più vicini a Peter Pan, come L'isola del tesoro, a quell'utente come potenziale acquisto futuro. Se si dovessero aggiungere più romanzi e caratteristiche basate sul genere (ad esempio, fantasy, gotico, ecc.), le posizioni dei romanzi nello spazio vettoriale si sposterebbero. Ad esempio, se si aggiunge una dimensione di genere fantasy, Peter Pan e L'isola del tesoro potrebbero discostarsi leggermente l'uno dall'altro, dato che il primo è spesso considerato fantasy, mentre il secondo no.

È opportuno notare che i vettori degli oggetti possono anche essere creati utilizzando le caratteristiche interne degli oggetti come attributi. Ad esempio, possiamo convertire elementi di testo non elaborati (ad esempio articoli di notizie) in un formato strutturato e mapparli su uno spazio vettoriale, come un modello bag of words. In questo approccio, ogni parola utilizzata in tutto il corpus diventa una dimensione diversa dello spazio vettoriale e gli oggetti che utilizzano parole chiave simili appaiono più vicini l'uno all'altro nello spazio vettoriale. TF-IDF, un'estensione dell'approccio bag of words, può aiutare ulteriormente a misurare la frequenza dei termini per ogni articolo rispetto all'intero repository di articoli di notizie.6 Metodi simili possono essere applicati agli oggetti immagine attraverso l'incorporamento di immagini.