Kemajuan dalam model bahasa besar (LLM) seperti GPT OpenAI dan teknik terkait yang melibatkan algoritma machine learning menghasilkan ledakan AI generatif dalam beberapa tahun terakhir, dan kemajuan lebih lanjut telah mengarah pada bidang agen otonom yang baru
Dengan mengintegrasikan alat, API, antarmuka perangkat keras, dan sumber daya eksternal lainnya, sistem AI agen semakin otonom, mampu mengambil keputusan secara real-time, dan mahir memecahkan masalah di berbagai contoh penggunaan.
Agen kompleks tidak dapat bertindak tanpa mengambil keputusan, dan pengambilan keputusan yang baik harus diawali dengan pembuatan rencana. Perencanaan agen terdiri dari beberapa komponen kunci yang bekerja sama untuk mendorong pengambilan keputusan yang optimal.
Definisi tujuan
Langkah pertama dan paling penting dalam perencanaan AI adalah mendefinisikan tujuan yang jelas. Tujuan berfungsi sebagai prinsip panduan dalam proses pengambilan keputusan agen, menentukan keadaan akhir yang ingin dicapai. Tujuan dapat bersifat statis, yang tidak berubah sepanjang proses perencanaan, atau dinamis, yang menyesuaikan diri berdasarkan kondisi lingkungan atau interaksi pengguna.
Misalnya, mobil otonom mungkin memiliki tujuan untuk mencapai destinasi tertentu secara efisien, sekaligus mematuhi peraturan keselamatan. Tanpa tujuan yang jelas, agen akan kehilangan arah, sehingga menunjukkan perilaku yang tidak menentu atau tidak efisien.
Jika tujuannya kompleks, model AI agen akan memecahnya menjadi subtujuan yang lebih kecil dan mudah dikelola dalam proses yang disebut dekomposisi tugas. Hal ini memungkinkan sistem untuk berfokus pada tugas-tugas kompleks secara hierarkis.
LLM berperan penting dalam penguraian tugas dengan memecah satu tujuan umum menjadi beberapa subtugas yang lebih kecil, lalu mengeksekusi subtugas tersebut melalui berbagai langkah. Misalnya, pengguna mungkin menggunakan prompt bahasa alami untuk meminta chatbot merencanakan perjalanan.
Agen terlebih dahulu akan menguraikan tugas menjadi beberapa komponen, misalnya memesan penerbangan, mencari hotel, dan membuat rencana perjalanan. Setelah digunakan, agen dapat menggunakan antarmuka pemrograman aplikasi (API) untuk mengambil data real-time, memeriksa harga, dan bahkan menyarankan destinasi.
Representasi keadaan
Untuk merencanakan secara efektif, agen harus memiliki pemahaman terstruktur tentang lingkungannya. Pemahaman ini dicapai melalui representasi negara, yang memodelkan kondisi, batasan, dan faktor kontekstual saat ini yang memengaruhi pengambilan keputusan.
Agen memiliki beberapa pengetahuan bawaan dari data pelatihan atau kumpulan data dari interaksi sebelumnya. Namun, persepsi diperlukan agar agen memiliki pemahaman real-time tentang lingkungannya. Agen mengumpulkan data melalui input sensoris, yang memungkinkannya memodelkan lingkungannya, bersama dengan input pengguna dan data yang menggambarkan keadaan internalnya.
Kompleksitas representasi negara bervariasi bergantung pada tugasnya. Misalnya, dalam permainan catur, keadaan mencakup posisi semua bidak di papan catur, sedangkan dalam sistem navigasi robotik, keadaan mungkin melibatkan koordinat spasial, hambatan, dan kondisi medan.
Keakuratan representasi keadaan langsung mempengaruhi kemampuan agen dalam mengambil keputusan yang didasarkan pada informasi, sebab hal tersebut menentukan seberapa baik agen dapat memprediksi dampak tindakannya.
Pengurutan tindakan
Setelah menetapkan tujuannya dan menilai lingkungannya, agen harus menentukan urutan tindakan yang akan mengalihkan agen dari keadaan saat ini ke keadaan tujuan yang diinginkan. Proses ini yang dikenal sebagai urutan tindakan, melibatkan penyusunan serangkaian langkah logis dan efisien yang harus diikuti oleh agen.
Agen perlu mengidentifikasi potensi tindakan, memperpendek daftar tindakan tersebut guna mengoptimalkan tindakan, memprioritaskannya, dan mengidentifikasi ketergantungan antara tindakan dan langkah bersyarat berdasarkan potensi perubahan di lingkungan. Agen dapat mengalokasikan sumber daya pada setiap langkah dalam urutan, atau menjadwalkan tindakan berdasarkan kendala lingkungan.
Misalnya, penyedot debu robotik perlu memutuskan jalur yang paling efektif untuk membersihkan ruangan, demi memastikan semua area penting tercakup tanpa pengulangan yang tidak perlu. Jika urutan tindakan tidak terencana dengan baik, agen AI mungkin mengambil langkah yang tidak efisien atau berlebihan, sehingga memboroskan sumber daya dan memperpanjang waktu eksekusi.
Kerangka kerja ReAct adalah metodologi yang digunakan dalam AI untuk menangani pengambilan keputusan dinamis. Dalam kerangka kerja ReAct, penalaran mengacu pada proses kognitif di mana agen menentukan tindakan atau strategi apa yang diperlukan untuk mencapai tujuan tertentu.
Fase ini mirip dengan fase perencanaan dalam AI agen. Di sini, agen membuat urutan langkah untuk memecahkan masalah atau menyelesaikan tugas. Kerangka kerja lain yang bermunculan termasuk ReWOO, RAISE, dan Reflexion, yang masing-masing memiliki kekuatan dan kelemahannya sendiri.
Pengoptimalan dan evaluasi
Perencanaan AI sering kali melibatkan pemilihan jalur yang paling optimal untuk mencapai tujuan, terutama ketika terdapat beberapa opsi yang tersedia. Pengoptimalan membantu memastikan bahwa urutan tindakan yang dipilih oleh agen adalah yang paling efisien, hemat biaya, atau bermanfaat dalam kondisi tertentu. Proses ini seringkali memerlukan evaluasi berbagai faktor seperti waktu, penggunaan sumber daya, risiko, dan potensi manfaat.
Misalnya, robot di gudang yang ditugaskan untuk mengambil barang harus menentukan rute terpendek dan teraman untuk menghindari tabrakan dan mengurangi waktu operasional. Tanpa optimasi yang tepat, agen AI dapat menjalankan rencana yang fungsional, tetapi tidak optimal, sehingga menyebabkan inefisiensi. Beberapa metode dapat digunakan untuk mengoptimalkan pengambilan keputusan, termasuk:
Pencarian heuristik
Algoritma pencarian heuristik membantu agen menemukan solusi optimal dengan memperkirakan jalur terbaik menuju tujuan. Algoritma-algoritma ini bergantung pada fungsi heuristik—perkiraan matematis seberapa dekat suatu keadaan dengan tujuan yang diinginkan. Pencarian heuristik sangat efektif dalam lingkungan terstruktur di mana agen perlu menemukan jalur optimal dengan cepat.
Pembelajaran penguatan
Reinforced learning membantu agen mengoptimalkan perencanaan melalui proses uji coba (trial and error) untuk mempelajari urutan tindakan mana yang memberikan hasil terbaik seiring waktu berjalan. Agen berinteraksi dengan lingkungan, menerima masukan dalam bentuk imbalan atau penalti, dan menyempurnakan strategi.
Perencanaan probabilistik
Dalam skenario dunia nyata, agen AI sering beroperasi di lingkungan yang tidak pasti, dengan hasil yang tidak deterministik. Metode perencanaan probabilistik memperhitungkan ketidakpastian dengan mengevaluasi beberapa kemungkinan hasil dan memilih tindakan dengan utilitas tertinggi yang diharapkan.
Kolaborasi
Satu agen perencanaan adalah sesuatu, tetapi dalam sistem multiagen, agen AI harus bekerja secara otonom sekaligus berinteraksi satu sama lain untuk mencapai tujuan individu atau kolektif.
Proses perencanaan untuk agen AI dalam sistem multiagen lebih rumit daripada untuk agen tunggal karena dalam hal ini, agen tidak hanya harus merencanakan tindakannya sendiri, tetapi juga mengambil tindakan lain dan bagaimana keputusannya berkaitan dengan keputusan agen lain.
Tergantung pada arsitektur agen, setiap agen dalam sistem biasanya memiliki tujuan masing-masing, yang mungkin melibatkan menyelesaikan tugas tertentu atau memaksimalkan fungsi imbalan. Dalam banyak sistem multiagen, agen perlu bekerja sama untuk mencapai tujuan bersama.
Tujuan ini dapat ditentukan oleh sistem menyeluruh atau muncul dari interaksi agen. Para agen membutuhkan mekanisme untuk berkomunikasi dan menyelaraskan tujuan mereka, terutama dalam skenario kerja sama. Hal ini dapat dilakukan melalui pesan eksplisit, penetapan tugas bersama, atau koordinasi tersirat.
Perencanaan dalam sistem multiagen dapat dilakukan secara terpusat. Dalam skema ini, satu entitas atau pengendali—yang mungkin merupakan agen LLM—membuat rencana untuk seluruh sistem.
Setiap agen menerima instruksi atau rencana dari otoritas pusat ini. Perencanaan juga dapat dilakukan secara terdesentralisasi. Dalam sistem ini, tiap agen membuat rencana secara terpisah, tetapi bekerja sama untuk membantu memastikan bahwa mereka selaras satu sama lain dan berkontribusi pada tujuan global. Sering kali, diperlukan komunikasi dan negosiasi antara agen.
Proses pengambilan keputusan kolaboratif ini meningkatkan efisiensi, mengurangi bias dalam pelaksanaan tugas, membantu menghindari halusinasi melalui validasi silang dan pembangunan konsensus, serta mendorong para agen untuk bekerja sama mencapai tujuan bersama.