Model penyematan yang terpisah mungkin merupakan penawaran yang telah dilatih sebelumnya atau dilatih dari awal pada tugas atau data pelatihan tertentu . Setiap bentuk data biasanya mendapat manfaat dari arsitektur neural network tertentu, tetapi penggunaan algoritma khusus untuk tugas tertentu sering kali merupakan praktik terbaik, bukan aturan eksplisit.
Dalam beberapa skenario, proses menanamkan adalah bagian terintegrasi dari Neural Networks yang lebih besar. Misalnya, dalam convolutional neural network (CNN) encoder-decoder yang digunakan untuk tugas seperti segmentasi gambar, optimasi seluruh jaringan untuk membuat prediksi yang tepat melibatkan pelatihan lapisan encoder untuk menghasilkan penyematan vektor yang efektif dari gambar input.
Model terlatih
Untuk banyak contoh penggunaan dan bidang studi, model terlatih dapat memberikan penyematan yang berguna yang dapat berfungsi sebagai input untuk model khusus atau basis data vektor. Model sumber terbuka umumnya dilatih pada kumpulan data pelatihan yang besar dan luas untuk mempelajari penyematan yang berguna untuk banyak tugas hilir, seperti few-shot learning atau zero-shot learning.
Untuk data teks, model penyematan kata sumber terbuka dasar seperti Word2Vec Google atau Global Vectors (GLove) Universitas Stanford dapat dilatih dari awal, tetapi juga ditawarkan dalam varian yang terlatih dengan data teks publik seperti Wikipedia dan Common Crawl. Demikian pula, model bahasa besar (LLM) encoder-decoder yang sering digunakan untuk penyematan, seperti BERT dan berbagai variannya, telah dilatih pada jumlah teks yang cukup besar.
Untuk tugas-tugas visi komputer, model klasifikasi gambar yang sudah terlatih seperti ImageNet, ResNet atau VGG dapat diadaptasi untuk penyematan hasil dengan hanya menghapus lapisan prediksi akhir yang terhubung sepenuhnya.
Model penyematan khusus
Beberapa contoh penggunaan, terutama yang melibatkan konsep esoterik atau kelas data baru, mendapat manfaat dari fine tuning model terlatih atau pelatihan model penyematan yang sepenuhnya disesuaikan.
Domain hukum dan medis adalah contoh menonjol dari bidang yang sering mengandalkan kosakata, basis pengetahuan, atau citra esoteris dan sangat khusus, yang tidak mungkin dimasukkan dalam data pelatihan model yang lebih umum. Melengkapi pengetahuan dasar tentang model yang telah dilatih sebelumnya melalui pelatihan lebih lanjut tentang contoh khusus domain dapat membantu model menghasilkan penyematan yang lebih efektif.
Meskipun hal ini juga dapat dicapai melalui perancangan arsitektur jaringan neural yang dibuat khusus atau melatih arsitektur yang dikenal dari awal, hal itu memerlukan sumber daya dan pengetahuan kelembagaan yang mungkin berada di luar jangkauan sebagian besar organisasi atau penghobi.