Machine learning (ML) merupakan tulang punggung dari berbagai jenis pembelajaran agen AI. Hal ini memungkinkan agen untuk mengidentifikasi pola, membuat prediksi, dan meningkatkan kinerja berdasarkan data.
Tiga teknik machine learning utama yang digunakan dalam agen AI adalah pembelajaran yang diawasi, pembelajaran tanpa pengawasan, dan pembelajaran penguatan. Lebih khusus lagi, ini adalah teknik pembelajaran mendalam yang menggunakan neural networks kompleks dengan banyak lapisan untuk memproses data dalam jumlah besar dan mempelajari pola yang rumit.
Pembelajaran dengan pengawasan
Pembelajaran dengan pengawasan melibatkan pelatihan algoritma machine learning pada kumpulan data yang dilabeli, di mana setiap input berkaitan dengan output tertentu. Agen menggunakan informasi ini untuk membangun model prediktif.
Misalnya, chatbot AI dapat dilatih menggunakan percakapan layanan pelanggan dan solusi yang sesuai untuk memberikan respons yang diprediksi. Pendekatan ini banyak diterapkan dalam pengenalan gambar, pemrosesan Speech-to-Text dan diagnosis medis.
Pembelajaran transfer memungkinkan agen AI untuk menggunakan pengetahuan yang diperoleh dari satu tugas dan menerapkannya ke tugas lain. Misalnya, model bahasa besar (LLM) yang dilatih pada kumpulan data umum dapat disempurnakan untuk domain tertentu, seperti pemrosesan teks hukum atau medis.
Pembelajaran tanpa pengawasan
Sebaliknya, pembelajaran tanpa pengawasan memungkinkan agen AI melakukan analisis data pada data yang tidak berlabel untuk menemukan pola dan struktur tanpa pengawasan manusia.
Metode ini berguna dalam tugas-tugas seperti klaster perilaku pelanggan untuk meningkatkan strategi pemasaran, deteksi anomali dalam keamanan siber, dan sistem rekomendasi seperti yang digunakan oleh layanan streaming.
Pembelajaran dengan pengawasan mandiri menggunakan pembelajaran tanpa pengawasan untuk tugas-tugas yang secara konvensional memerlukan pembelajaran dengan pengawasan. Alih-alih mengandalkan kumpulan data untuk sinyal pengawasan,model AI yang dilatih secara mandiri (self-supervised) menghasilkan label implisit dari data yang tidak terstruktur.
Pembelajaran dengan pengawasan mandiri berguna dalam bidang-bidang seperti visi komputer dan pemrosesan bahasa alami (NLP), yang membutuhkan data pelatihan berlabel dalam jumlah besar.
Pembelajaran penguatan
Pembelajaran penguatan adalah proses machine learning yang berfokus pada alur kerja pengambilan keputusan pada agen otonom. Ini membahas proses pengambilan keputusan berurutan dalam lingkungan yang tidak pasti.
Berbeda dengan pembelajaran yang diawasi, pembelajaran penguatan tidak menggunakan contoh perilaku yang benar atau salah yang diberi label. Namun, pembelajaran penguatan juga berbeda dari pembelajaran tanpa pengawasan karena pembelajaran penguatan belajar melalui metode coba-coba dan fungsi penghargaan, bukan dengan mengambil informasi dari pola tersembunyi.
Pembelajaran penguatan juga berbeda dari pembelajaran yang diawasi sendiri karena tidak menghasilkan label palsu atau diukur terhadap kebenaran dasar—ini bukan metode klasifikasi, melainkan pembelajar tindakan.
Agen AI yang menggunakan reinforced learning beroperasi melalui proses uji coba (trial and error), di mana mereka mengambil tindakan dalam lingkungan, mengamati hasil, dan menyesuaikan strategi mereka sesuai kebutuhan. Proses pembelajaran melibatkan penetapan kebijakan yang menghubungkan keadaan dengan tindakan, dengan fokus pada pengoptimalan untuk imbalan kumulatif jangka panjang daripada keuntungan instan.
Seiring waktu, agen menyempurnakan kemampuan pengambilan keputusan melalui interaksi berulang, secara bertahap meningkatkan kemampuannya untuk melakukan tugas-tugas kompleks secara efektif. Pendekatan ini bermanfaat dalam lingkungan dinamis di mana aturan yang telah ditentukan sebelumnya mungkin tidak cukup untuk menghasilkan kinerja yang optimal.
Kendaraan otonom menggunakan reinforced learning untuk mempelajari perilaku mengemudi yang optimal. Melalui uji coba, kecerdasan buatan (AI) terus meningkatkan kemampuannya dalam menavigasi jalan, menghindari rintangan, dan mengambil keputusan berkendara secara real-time. Chatbot yang didukung AI meningkatkan kemampuan percakapan mereka dengan belajar dari interaksi pengguna dan mengoptimalkan respons untuk menyempurnakan interaksi.
Pembelajaran berkelanjutan
Pembelajaran berkelanjutan dalam agen AI mengacu pada kemampuan sistem kecerdasan buatan untuk belajar dan beradaptasi dari waktu ke waktu, menggabungkan data dan pengalaman baru tanpa melupakan pengetahuan sebelumnya.
Tidak seperti machine learning tradisional, yang biasanya melibatkan pelatihan menggunakan kumpulan data tetap, pembelajaran berkelanjutan memungkinkan AI untuk memperbarui modelnya secara terus menerus saat menemukan informasi baru atau perubahan di lingkungannya. Hal ini memungkinkan agen untuk meningkatkan kinerjanya secara waktu nyata, beradaptasi dengan pola baru, situasi yang berkembang, dan kondisi dinamis.
Pembelajaran berkelanjutan penting dalam aplikasi dunia nyata di mana data terus berubah dan AI harus tetap terus diperbarui dengan input baru agar tetap efektif. Hal ini membantu mencegah "catastrophic forgetting", di mana model melupakan pengetahuan lama saat belajar informasi baru, dan memastikan sistem dapat menangani kumpulan tugas dan tantangan yang terus berkembang.
Pembelajaran dan kolaborasi multiagen
Salah satu manfaat agen AI adalah mereka dapat bekerja sama. Dalam arsitektur multiagen, agen AI belajar melalui kolaborasi dan persaingan. Dalam pembelajaran kooperatif, agen-agen berbagi pengetahuan untuk mencapai tujuan bersama, seperti yang terlihat dalam swarm robotics.
Namun, pembelajaran kompetitif terjadi ketika agen memperbaiki strategi mereka dengan bersaing dalam lingkungan yang saling berlawanan, seperti AI perdagangan keuangan.
Bayangkan sebuah jaringan agen AI yang bekerja untuk meningkatkan kualitas perawatan pasien, memperlancar alur kerja, mendorong kepatuhan terhadap pertimbangan etika, dan mengoptimalkan alokasi sumber daya dalam jaringan rumah sakit.
Dalam kerangka kerja multiagen ini, terkadang agen pembelajaran yang lebih canggih yang dilengkapi dengan AI generatif (gen AI) mengawasi agen refleksif atau yang berbasis tujuan lebih sederhana. Dalam contoh penggunaan ini, setiap agen dapat mewakili peran atau tugas yang berbeda dalam sistem kesehatan, dan mereka akan berkolaborasi serta berbagi informasi untuk meningkatkan hasil perawatan pasien dan efisiensi operasional.