Berikut ini adalah perincian langkah demi langkah tentang cara kerja proses gradient boosting.
Inisialisasi: Dimulai dengan menggunakan kumpulan pelatihan untuk membangun fondasi dengan model pembelajar dasar, sering kali struktur keputusan, yang prediksi awalnya dihasilkan secara acak. Biasanya struktur keputusan hanya akan berisi beberapa node daun atau node terminal. Sering dipilih karena kemampuan interpretasinya, pembelajar yang lemah atau dasar ini berfungsi sebagai titik awal yang optimal. Pengaturan awal ini membuka jalan untuk membangun iterasi berikutnya.
Menghitung residual: Untuk setiap contoh pelatihan, hitung kesalahan residual dengan mengurangkan nilai prediksi dari nilai aktual. Langkah ini mengidentifikasi area di mana prediksi model perlu ditingkatkan.
Penyempurnaan dengan regularisasi: Proses regularisasi dilakukan setelah perhitungan residual dan sebelum pelatihan model baru. Tahap ini melibatkan penurunan pengaruh setiap pembelajar lemah baru yang terintegrasi ke dalam ensambel. Dengan mengalibrasi peningkatan ini secara cermat, kita dapat mengatur seberapa cepat progres algoritma boosting, sehingga membantu dalam pencegahan overfitting dan optimalisasi kinerja secara keseluruhan.
Melatih model berikutnya: Gunakan kesalahan residual yang dihitung pada langkah sebelumnya sebagai target dan latih model baru atau pembelajar lemah untuk memprediksi kesalahan tersebut secara akurat. Fokus langkah ini adalah memperbaiki kesalahan yang dibuat oleh model sebelumnya, sehingga menyempurnakan prediksi keseluruhan.
Pembaruan ensambel: Pada tahap ini, kinerja ensambel yang diperbarui (termasuk model yang baru dilatih) biasanya dievaluasi dengan menggunakan kumpulan pengujian terpisah. Jika kinerja pada kumpulan data yang dikesampingkan ini memuaskan, ensambel dapat diperbarui dengan memasukkan pembelajar lemah baru; jika tidak, hiperparameter mungkin perlu disesuaikan.
Pengulangan: Ulangi langkah-langkah yang disajikan sebelumnya seperlunya. Setiap iterasi membangun dan menyempurnakan model dasar melalui pelatihan pohon baru, yang selanjutnya meningkatkan akurasi model. Jika pembaruan ansambel dan model akhir memuaskan dibandingkan dengan model dasar dalam hal akurasi, lanjutkan ke langkah selanjutnya.
Kriteria penghentian: Menghentikan proses boosting ketika kriteria penghentian yang telah ditentukan sebelumnya terpenuhi, seperti jumlah iterasi maksimum, akurasi target, atau hasil yang berkurang. Langkah ini membantu memastikan bahwa prediksi akhir model mencapai keseimbangan yang diharapkan antara kompleksitas dan kinerja.