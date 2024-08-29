Model bahasa disamarkan (MLM) adalah jenis model bahasa besar (LLM) yang digunakan untuk membantu memprediksi kata-kata yang hilang dari teks dalam tugas pemrosesan bahasa alami (NLP). Dengan demikian, pemodelan bahasa disamarkan adalah salah satu bentuk pelatihan model transformator—terutama representasi encoder dua arah dari transformator (BERT) dan turunannya, pendekatan prapelatihan BERT yang dioptimalkan dengan kuat (RobertA)—untuk tugas NLP, dengan melatih model untuk mengisi kata-kata disamarkan dalam teks, dan dengan demikian memprediksi kata-kata yang paling mungkin dan koheren untuk melengkapi teks.1

Pemodelan bahasa terselubung membantu banyak tugas—dari analisis sentimen hingga pembuatan teks—dengan melatih model untuk memahami hubungan kontekstual antara kata-kata. Faktanya, para pengembang penelitian sering menggunakan pemodelan bahasa terselubung untuk membuat model yang sudah terlatih yang menjalani penyempurnaan lebih lanjut yang diawasi untuk tugas-tugas hilir, seperti klasifikasi teks atau terjemahan mesin. Model bahasa bertopeng dengan demikian mendukung banyak algoritma pemodelan bahasa mutakhir saat ini. Meskipun pemodelan bahasa bertopeng adalah metode untuk model bahasa pra-pelatihan, sumber online terkadang menyebutnya sebagai metode pembelajaran transfer. Hal ini mungkin tidak dapat dibenarkan karena beberapa kelompok penelitian telah mulai menerapkan pemodelan bahasa terselubung sebagai tugas akhir.

Transformator HuggingFace dan pustaka teks Tensorflow berisi fungsi yang dirancang untuk melatih dan menguji model bahasa disamarkan di Python, baik sebagai tugas akhir maupun untuk tugas hilir.