Penyetelan instruksi adalah bagian dari kategori yang lebih luas dari teknik penyetelan yang digunakan untuk mengadaptasi model dasar yang sudah dilatih sebelumnya untuk tugas-tugas hilir. Model dasar dapat disetel untuk berbagai tujuan, mulai dari penyesuaian gaya hingga melengkapi pengetahuan inti dan kosa kata dari model yang telah dilatih sebelumnya hingga mengoptimalkan kinerja untuk contoh penggunaan tertentu. Meskipun tidak eksklusif untuk domain atau arsitektur model kecerdasan buatan tertentu, penyetelan telah menjadi bagian integral dari siklus hidup LLM. Sebagai contoh, rangkaian model Llama 2 dari Meta ditawarkan (dalam berbagai ukuran) sebagai model dasar, sebagai varian yang disetel untuk dialog (Llama-2-chat) dan sebagai varian yang disetel untuk pengkodean (Code Llama).

Penyetelan instruksi tidak saling eksklusif dengan teknik penyetelan lainnya. Sebagai contoh, model obrolan sering kali menjalani penyetelan instruksi dan pembelajaran penguatan dari masukan manusia (RLHF), sebuah teknik penyetelan yang bertujuan untuk meningkatkan kualitas abstrak seperti sifat suka menolong dan kejujuran; model yang disetel untuk pengkodean sering kali menjalani penyetelan instruksi (untuk mengoptimalkan respons secara luas untuk mengikuti instruksi) dan penyetelan tambahan pada data khusus pemrograman (untuk menambah pengetahuan model tentang sintaksis pengkodean dan kosakata).

Meskipun asal usul LLM dapat ditelusuri kembali ke makalah “Attention is All You Need” tahun 2017 yang memperkenalkan model transformer skala besar ke tugas pemrosesan bahasa alami (NLP) , penggabungan penyetelan instruksi dan RLHF—didorong oleh makalah berpengaruh dari Google (pada tahun 2021)1 dan OpenAI (pada tahun 2022),2 masing-masing—menghasilkan LLM modern yang memulai era AI generatif saat ini dengan peluncuran ChatGPT.