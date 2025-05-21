Mari kita selami dasar-dasar matematika dari kompromi bias-varians. Ingat dari contoh sebelumnya bahwa kita bertujuan untuk mengurangi kesalahan total nilai prediksi dan nilai aktual. Kesalahan ini terdiri dari tiga komponen: bias, varians, dan kesalahan yang tidak dapat direduksi. Kita dapat menganalisis kesalahan prediksi kuadrat yang diharapkan dari sebuah model:
f^(x)
dibandingkan dengan fungsi sebenarnya: f(x),
di mana f^(x) dipelajari dari kumpulan data pelatihan D , dan x adalah fungsi yang sebenarnya (tidak diketahui).
Asumsikan:
y=f(x)+ε,ε∼N(0,σ2)
ini berarti untuk fungsi y=f(x)+ε , kesalahan (dilambangkan dengan ε ) terdistribusi normal dengan mean 0 dan varians σ2 , σ menunjukkan standar deviasi dari distribusi
f^(x) adalah nilai prediksi model pada input x
Ekspektasi (atau rata-rata) diambil atas kumpulan data pelatihan yang berbeda D dan ketidakakuratan ε . Simbol E digunakan untuk menyatakan "ekspektasi" atau "nilai yang diharapkan," yang merupakan nilai sejati dari rata-rata distribusi
Kita tertarik pada kesalahan prediksi yang diharapkan pada satu titik x :
ED,ε[(y-f^(x))2]
Pengganti:
y=f(x)+ε
Jadi ekspresinya menjadi:
=ED,ε[(f(x)+ε-f^(x))2]
Memperluas kuadrat:
$=ED,ε[(f(x)-f^(x))2+2(f(x)-f^(x))ε+ε2]$
Pisahkan ekspektasi dengan menggunakan linearitas (linearitas adalah konsep aljabar sederhana, misalnya, E[A+B]=E[A]+E[B]):
=ED[(f(x)-f^(x))2]+2ED,ε[(f(x)-f^(x))ε]+Eε[ε2]
Sekarang, karena:
E[ε]=0⇒E[(f(x)-f^(x))ε]=0
E[ε2]=σ2
Kita mendapatkan:
ED[(f(x)-f^(x))2]+σ2