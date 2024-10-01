Dalam pembelajaran mendalam, arsitektur encoder-decoder adalah jenis neural network yang paling banyak dikaitkan dengan arsitektur transformator dan digunakan dalam pembelajaran urutan-ke-urutan. Karenanya, banyak referensi terkadang mengacu pada encoder-decoder sebagai bentuk model urutan-ke-urutan ( modelseq2seq). Banyak riset machine learning berfokus pada model encoder-decoder untuk tugas pemrosesan bahasa alami yang melibatkan model bahasa besar (LLM).

Model encoder-decoder digunakan untuk menangani data sekuensial, khususnya memetakan urutan input ke urutan output dengan panjang yang berbeda, seperti terjemahan mesin neural, peringkasan teks, teks gambar, dan pengenalan suara. Dalam tugas-tugas seperti itu, pemetaan token dalam input ke satu di output sering kali tidak langsung. Sebagai contoh, ambil terjemahan mesin: dalam beberapa bahasa, kata kerja muncul di dekat awal kalimat (seperti dalam bahasa Inggris), dalam bahasa lain di akhir (seperti bahasa Jerman) dan dalam beberapa bahasa, lokasi kata kerja mungkin lebih bervariasi (misalnya, bahasa Latin). Jaringan encoder-decoder menghasilkan output yang panjangnya bervariasi, tetapi sesuai dengan konteksnya agar berkaitan dengan urutan input yang diberikan.1