LLM menghasilkan teks dengan memprediksi kata berikutnya (atau lebih tepatnya, token berikutnya) sesuai dengan distribusi probabilitas. Setiap token diberi logit (nilai numerik) dari LLM dan total set token dinormalisasi menjadi "distribusi probabilitas softmax." Setiap token diberi "fungsi softmax" yang berada di antara nol dan satu, dan jumlah dari semua probabilitas softmax token adalah satu.

Parameter temperatur LLM memodifikasi distribusi ini. Temperatur yang lebih rendah pada dasarnya membuat token dengan probabilitas tertinggi lebih mungkin untuk dipilih; temperatur yang lebih tinggi meningkatkan kemungkinan model untuk memilih token yang lebih kecil kemungkinannya. Ini terjadi karena nilai temperatur yang lebih tinggi memberikan lebih banyak variabilitas dalam pemilihan token LLM. Pengaturan temperatur yang berbeda pada dasarnya memberikan tingkat keacakan yang berbeda ketika model AI generatif menghasilkan output berupa teks.

Parameter adalah fitur penting untuk mengontrol keacakan dalam kinerja model. Parameter memungkinkan pengguna untuk menyesuaikan output LLM agar lebih sesuai dengan aplikasi pembuatan teks yang berbeda di dunia nyata. Lebih khusus lagi, pengaturan LLM ini memungkinkan pengguna untuk menyeimbangkan koherensi dan kreativitas ketika menghasilkan output untuk contoh penggunaan tertentu. Misalnya, parameter rendah mungkin lebih disukai untuk tugas yang membutuhkan ketelitian dan keakuratan faktual, seperti dokumentasi teknik atau balasan percakapan dengan chatbot. Nilai parameter yang lebih rendah membantu LLM menghasilkan teks yang lebih koheren dan konsisten, serta menghindari respons yang tidak relevan. Sebaliknya, parameter tinggi lebih disukai untuk output kreatif atau tugas kreatif seperti penulisan kreatif atau curah pendapat mengenai konsep. Pengaturan parameter secara efektif memungkinkan pengguna untuk menyempurnakan LLM dan menyesuaikan output model ke hasil yang mereka inginkan.

Temperatur sering berkaitan dengan 'kreativitas', tetapi ini tidak selalu terjadi. Lebih mudahnya, temperatur adalah seberapa luas model menggunakan teks dari data pelatihannya. Max Peeperkorn et al1 melakukan analisis empiris terhadap output LLM untuk nilai temperatur yang berbeda dan menulis:

"Kami menemukan bahwa temperatur berkorelasi lemah dengan kebaruan, dan tentu saja, berkorelasi sedang dengan inkoherensi, tetapi tidak ada hubungan dengan kohesi atau tipikalitas. Namun, pengaruh temperatur pada kreativitas jauh lebih bernuansa dan lemah daripada yang ditunjukkan oleh klaim "parameter kreativitas"; hasil keseluruhan menunjukkan bahwa LLM menghasilkan output yang sedikit lebih baru saat temperatur makin tinggi.”

Nilai temperatur tinggi dapat membuat output model tampak lebih kreatif, tetapi lebih akurat jika temperatur dianggap kurang ditentukan oleh data pelatihan.