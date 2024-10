Semakin dekat dua vektor baru dalam ruang vektor, semakin mirip sistem kami menganggapnya sesuai dengan fitur yang disediakan.5 Peter Pan dan Treasure Island memiliki fitur yang sama persis, muncul di titik vektor yang sama (1,1,0). Menurut sistem kami, maka, keduanya identik. Keduanya memang memiliki banyak perangkat plot yang sama (misalnya, pulau-pulau terpencil dan bajak laut) dan tema (misalnya, bertumbuh dewasa atau perlawanan terhadapnya). Sebaliknya, meskipun Little Women juga merupakan novel anak-anak, novel ini bukanlah sebuah petualangan, tapi sebuah bildungsroman (novel bertumbuh dewasa). Meskipun Little Women adalah novel anak-anak seperti Peter Pan dan Treasure Island, novel ini tidak memiliki nilai fitur petualangan dan memiliki nilai fitur 1 untuk bildungsroman, yang tidak dimiliki oleh kedua novel lainnya. Hal ini memposisikan Little Women lebih dekat dengan Northanger Abbey dalam ruang vektor, karena mereka memiliki nilai fitur yang sama untuk fitur petualangan dan bildungsroman.

Karena kemiripannya dalam bidang ini, jika pengguna sebelumnya pernah membeli Peter Pan, sistem akan merekomendasikan novel-novel yang paling mirip dengan Peter Pan, seperti Treasure Island, kepada pengguna tersebut sebagai potensi pembelian di masa mendatang. Perhatikan bahwa jika kita menambahkan lebih banyak novel dan fitur berbasis genre (misalnya, fantasi, gothic, dll.) posisi novel dalam ruang vektor akan bergerak. Misalnya, jika menambahkan dimensi genre fantasi, Peter Pan dan Treasure Island dapat bergerak sedikit dari yang lain mengingat yang pertama sering dianggap fantasi sementara yang terakhir tidak.

Perhatikan bahwa vektor item juga dapat dibuat menggunakan karakteristik internal item sebagai fitur. Sebagai contoh, kita dapat mengonversi item teks mentah (misalnya, artikel berita) ke dalam format terstruktur dan memetakannya ke dalam ruang vektor, seperti bag of words. Dalam pendekatan ini, setiap kata yang digunakan di seluruh korpus menjadi dimensi ruang vektor yang berbeda, dan artikel yang menggunakan kata kunci yang sama muncul lebih dekat satu sama lain dalam ruang vektor. TF-IDF, perluasan dari bag of words, dapat membantu mengukur frekuensi istilah untuk setiap artikel dibandingkan dengan seluruh repositori artikel berita.6 Metode serupa dapat diterapkan pada item gambar melalui penyematan gambar.