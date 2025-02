Quanto mais próximos dois vetores de romances estiverem no espaço vetorial, mais similares o nosso sistema os considerará de acordo com as características fornecidas.5 "Peter Pan" e "Ilha do Tesouro" compartilham exatamente as mesmas características, aparecendo no mesmo ponto vetorial (1,1,0). De acordo com o nosso sistema, então, eles são idênticos. De fato, eles compartilham muitos elementos de enredo (por exemplo, ilhas isoladas e piratas) e temas (por exemplo, amadurecimento ou resistência a ele). Por outro lado, embora Mulherzinhas também seja um romance infantil, não se trata de uma aventura, mas de um romance de formação (amadurecimento). Embora Mulherzinhas seja um romance infantil como Peter Pan e Ilha do Tesouro, ele não possui seus valores de características para aventura e possui um valor de característica de 1 para romance de formação, que os dois últimos não possuem. Isso posiciona Mulherzinhas mais perto de A Abadia de Northanger no espaço vetorial, pois compartilham os mesmos valores de características para as características de aventura e romance de formação.

Devido à semelhança nesse espaço, se um usuário já comprou Peter Pan, o sistema recomendará os romances mais próximos de Peter Pan como A Ilha do Tesouro a esse usuário como uma possível compra futura. Observe que, se adicionarmos mais romances e características baseadas em gênero (por exemplo, fantasia, gótico, etc.), as posições dos romances no espaço vetorial irão se mover. Por exemplo, se adicionarmos uma dimensão de gênero de fantasia, Peter Pan e A Ilha do Tesouro podem se mover marginalmente, já que o primeiro é frequentemente considerado fantasia enquanto o último não.

Observe que vetores de itens também podem ser criados usando características internas dos itens como funcionalidades. Por exemplo, podemos converter itens de texto bruto (por exemplo, artigos de notícias) em um formato estruturado e mapeá-los em um espaço vetorial, como um modelo de "bag of words". Nessa abordagem, cada palavra usada no corpus se torna uma dimensão diferente do espaço vetorial, e artigos que utilizam palavras-chave semelhantes aparecem mais próximos uns dos outros nesse espaço.