Sebagai bentuk pelatihan dominan untuk neural networks yang terdiri dari model pembelajaran mendalam, pembelajaran yang diawasi mendukung sebagian besar model AI canggih saat ini. Pembelajaran yang diawasi adalah paradigma pelatihan utama untuk tugas-tugas yang membutuhkan akurasi, seperti klasifikasi atau regresi.
Melatih model untuk akurasi membutuhkan perbandingan prediksi output untuk input tertentu dengan prediksi yang “benar” untuk input tersebut—biasanya disebut dengan kebenaran dasar. Dalam pembelajaran terawasi konvensional, kebenaran dasar tersebut disediakan oleh pasangan data berlabel. Misalnya, data pelatihan untuk model deteksi objek memasangkan gambar mentah (input) dengan versi gambar beranotasi yang menunjukkan lokasi dan klasifikasi setiap objek di dalamnya (output).
Karena metode pelatihan ini membutuhkan manusia dalam prosesnya untuk memberikan kebenaran dasar, metode ini disebut sebagai pembelajaran “terawasi”. Namun, karakteristik definitif dari pembelajaran terawasi bukanlah keterlibatan manusia, melainkan penggunaan beberapa kebenaran dasar dan minimalisasi fungsi kerugian yang mengukur divergensi darinya. Perbedaan ini menjadi penting karena teknik pembelajaran baru yang inovatif menemukan cara untuk secara implisit menyimpulkan "pseudolabel" dari data yang tidak berlabel.
Untuk mengakomodasi gagasan yang lebih fleksibel tentang pembelajaran yang diawasi, terminologi ML modern menggunakan "pengawasan" atau "sinyal pengawasan" untuk merujuk pada sumber kebenaran dasar apa pun. Dalam pembelajaran mandiri, yang secara nominal “tidak diawasi” karena menggunakan data tanpa label, sinyal pengawasan diturunkan dari struktur data yang tidak berlabel itu sendiri. Sebagai contoh, LLM dilatih sebelumnya melalui SSL dengan memprediksi kata-kata yang disamarkan dalam sampel teks, dengan teks asli yang berfungsi sebagai kebenaran dasar.