Berita teknologi terbaru, didukung oleh insight dari pakar
Tetap terinformasi tentang tren industri yang paling penting—dan menarik—tentang AI, otomatisasi, data, dan di luarnya dengan buletin Think. Lihat Pernyataan Privasi IBM®.
Penalaran agen adalah komponen agen AI yang menangani pengambilan keputusan. Agen penalaran memungkinkan kecerdasan buatan melakukan tugas secara otonom dengan menerapkan logika kondisional atau heuristik, dengan mengandalkan persepsi dan memori. Ini memungkinkan agen mencapai tujuan dan mengoptimalkan hasil terbaik.
Model machine learning lama mengikuti serangkaian aturan terprogram agar dapat mengambil keputusan. Kemajuan dalam AI berhasil menciptakan model AI dengan kemampuan penalaran yang lebih berkembang, tetapi tetap membutuhkan campur tangan manusia untuk mengubah informasi menjadi pengetahuan. Penalaran agen telah selangkah lebih maju, karena memungkinkan agen AI mengubah pengetahuan menjadi tindakan.
"Mesin penalaran" mendukung fase perencanaan dan pemanggilan alat dari alur kerja agen. Perencanaan menguraikan tugas menjadi penalaran yang lebih mudah dikelola, sementara pemanggilan alat membantu menyediakan informasi untuk pengambilan keputusan oleh agen AI melalui alat yang tersedia. Alat-alat ini dapat mencakup antarmuka pemrograman aplikasi (API), kumpulan data eksternal, dan sumber data seperti grafik pengetahuan.
Bagi bisnis, AI agen dapat lebih memperkuat proses penalaran berbasis bukti melalui generasi dengan dukungan pengambilan data (retrieval-augmented generation, RAG). Sistem RAG dapat mengambil data perusahaan dan informasi relevan lainnya yang dapat ditambahkan ke konteks agen AI untuk penalaran.
Tetap terinformasi tentang tren industri yang paling penting—dan menarik—tentang AI, otomatisasi, data, dan di luarnya dengan buletin Think. Lihat Pernyataan Privasi IBM®.
Penalaran agen memiliki beberapa pendekatan berdasarkan arsitektur dan jenis agen. Berikut adalah beberapa teknik umum untuk penalaran agen AI, termasuk kelebihan dan kekurangan dari setiap teknik:
● Logika kondisional
● Heuristik
● ReAct (Reason + Act atau Nalar + Tindakan)
● ReWOO (Reasoning WithOut Observation atau Penalaran Tanpa Pengamatan)
● Refleksi diri
● Penalaran multiagen
Agen AI sederhana mengikuti serangkaian aturan kondisi-tindakan yang telah diprogram sebelumnya. Aturan ini biasanya berbentuk pernyataan “jika-maka”, dengan bagian “jika” menentukan kondisi dan bagian “maka” menunjukkan tindakan. Ketika suatu kondisi terpenuhi, agen akan melakukan tindakan yang sesuai.
Metodologi penalaran ini sangat cocok untuk contoh penggunaan di domain tertentu. Di bidang keuangan, misalnya, agen deteksi penipuan menandai transaksi sebagai penipuan sesuai dengan serangkaian kriteria yang ditentukan oleh bank.
Dengan logika bersyarat, AI agen tidak dapat bertindak sesuai jika menemukan skenario yang tidak dikenalinya. Untuk mengurangi infleksibilitas ini, agen berbasis model menggunakan memori dan persepsi mereka untuk menyimpan model atau keadaan lingkungan saat ini. Status ini diperbarui saat agen menerima informasi baru. Namun, agen berbasis model tetap terikat oleh aturan kondisi-tindakan.
Sebagai contoh, sebuah robot menavigasi gudang untuk menyimpan produk di rak. Robot akan berkonsultasi dengan model gudang untuk menemukan rute yang akan dilaluinya. Namun, jika robot merasakan adanya rintangan, robot dapat mengubah jalur untuk menghindari rintangan tersebut dan melanjutkan perjalanannya.
Sistem agen AI juga dapat menggunakan heuristik untuk penalaran. Agen berbasis tujuan, misalnya, memiliki tujuan yang telah ditetapkan sebelumnya. Dengan menggunakan algoritma pencarian, agen menemukan serangkaian tindakan yang dapat membantu mencapai tujuan, kemudian merencanakan tindakan ini sebelum melakukannya.
Sebagai contoh, kendaraan swakemudi dapat memiliki agen navigasi yang bertujuan untuk menyarankan jalur tercepat ke suatu destinasi secara real-time. Agen ini dapat mencari dari beberapa opsi rute dan merekomendasikan rute tercepat.
Seperti agen berbasis tujuan, agen berbasis utilitas mencari serangkaian tindakan yang dapat mencapai suatu tujuan, tetapi juga memperhitungkan utilitas. Agen ini menggunakan fungsi utilitas untuk menentukan hasil yang paling optimal. Dalam contoh agen navigasi, agen dapat ditugaskan untuk menemukan bukan hanya rute tercepat, tetapi juga rute yang paling sedikit mengonsumsi bahan bakar.
Paradigma penalaran ini mencakup siklus berpikir-bertindak-mengamati untuk memecahkan masalah langkah demi langkah dan peningkatan respons secara berulang. Agen diinstruksikan untuk menghasilkan jejak proses penalarannya,1 seperti yang terjadi dengan penalaran rantai pemikiran dalam model AI generatif (gen AI) dan model bahasa besar (LLM). Kemudian, agen bertindak berdasarkan penalaran tersebut dan mengamati outputnya,2 kemudian memperbarui konteksnya dengan penalaran baru berdasarkan pengamatannya. Agen akan mengulangi siklus ini hingga menemukan jawaban atau solusi.2
ReAct bekerja dengan baik pada tugas-tugas khusus bahasa alami, dan ketertelusurannya meningkatkan transparansi. Namun, ReAct juga dapat menghasilkan penalaran dan tindakan yang sama berulang kali, yang dapat menyebabkan siklus tak terhingga.2
Tidak seperti ReAct, ReWoO menghapus langkah pengamatan dan merencanakan ke depan sebagai gantinya. Pola desain penalaran agen ini terdiri dari 3 modul: perencana, pekerja, dan pemecah masalah.3
Modul perencana memecah tugas menjadi subtugas dan mengalokasikan masing-masing ke modul pekerja. Pekerja menggabungkan alat yang digunakan untuk memperkuat setiap subtugas dengan bukti dan fakta. Akhirnya, modul pemecah masalah menggabungkan semua subtugas dan bukti yang sesuai untuk menarik kesimpulan.3
ReWOO mengungguli ReAct dalam hal pemrosesan bahasa alami(natural language processing, NLP) pada tolok ukur tertentu . Namun, menambahkan alat ekstra akan menurunkan kinerja ReWOO, dan tidak sesuai untuk situasi dengan konteks terbatas terkait lingkungannya.3
AI agen juga dapat menyertakan refleksi diri sebagai bagian dari penilaian dan penyempurnaan kemampuan penalarannya. Contohnya adalah Language Agent Tree Search (LATS), yang memiliki kemiripan dengan penalaran tree-of-thought di LLM.
LATS terinspirasi oleh metode pembelajaran penguatan Monte Carlo, di mana peneliti mengadaptasi Monte Carlo Tree Search untuk agen berbasis LLM.4 LATS membangun decision tree yang mewakili keadaan sebagai node dan edge sebagai tindakan, menelusuri pohon tersebut untuk mencari opsi potensi tindakan, dan menggunakan evaluator keadaan untuk memilih tindakan tertentu.2 Kerangka kerja ini juga menerapkan langkah penalaran reflektif, yang menggabungkan hasil pengamatan internal serta masukan dari model bahasa untuk mengidentifikasi kesalahan dalam penalaran dan menyarankan alternatif.2 Kesalahan dan refleksi penalaran tersimpan dalam memori, yang dapat memberikan konteks tambahan sebagai referensi di masa depan.4
LATS unggul dalam tugas-tugas yang lebih kompleks seperti pengodean dan menjawab pertanyaan otomatisasi alur kerja, termasuk pencarian dan navigasi web.4 Namun, pendekatan yang lebih mendalam dan langkah refleksi diri tambahan menjadikan LATS lebih menyita sumber daya dan waktu dibandingkan dengan metode seperti ReAct.2
Sistem multiagen terdiri dari beberapa agen AI yang bekerja sama untuk memecahkan masalah yang kompleks. Setiap agen khusus menangani domain tertentu dan dapat menerapkan strategi penalaran agennya sendiri.
Namun, proses pengambilan keputusan dapat bervariasi berdasarkan arsitektur sistem AI. Dalam ekosistem hierarkis atau vertikal, satu agen bertindak sebagai pemimpin orkestrasi AI dan memutuskan tindakan mana yang harus diambil. Sementara itu, dalam arsitektur horizontal, beberapa agen mengambil keputusan secara kolektif.
Penalaran merupakan inti dari agen AI dan dapat menghasilkan kemampuan AI yang lebih canggih. Namun, penalaran juga memiliki keterbatasan. Berikut adalah beberapa tantangan dalam penalaran agen:
● Kompleksitas komputasi
● Interpretabilitas
● Skalabilitas
Penalaran agen bisa jadi sulit diterapkan. Proses ini juga memerlukan waktu yang cukup lama dan daya komputasi yang besar, terutama saat menyelesaikan masalah dunia nyata yang lebih kompleks. Perusahaan harus menemukan cara untuk mengoptimalkan strategi penalaran agen mereka dan siap untuk berinvestasi dalam platform dan sumber daya AI yang diperlukan untuk pengembangan.
Penalaran agen mungkin kurang dapat dijelaskan dan kurang transparan terkait cara pengambilan keputusan. Berbagai metode dapat membantu membangun interpretabilitas. Selain itu, dan mengintegrasikan etika AI dan pengawasan manusia dalam pengembangan algoritmik sangat penting untuk memastikan mesin penalaran agen mengambil keputusan secara adil, etis, dan akurat.
Teknik penalaran agen bukanlah solusi yang cocok untuk semua kasus, sehingga sulit untuk diskalakan di berbagai aplikasi AI. Bisnis mungkin perlu menyesuaikan pola desain penalaran ini untuk setiap contoh penggunaan, sehingga memerlukan waktu dan upaya.
Semua tautan berada di luar ibm.com
1 ReAct: Synergizing Reasoning and Acting in Language Models, arXiv, 10 Maret 2023
2 The Landscape of Emerging AI Agent Architectures for Reasoning, Planning, and Tool Calling: A Survey, arXiv, 17 April 2024
3 Language Agent Tree Search Unifies Reasoning Acting and Planning in Language Models, arXiv, 6 Juni 2024
4 Language Agent Tree Search Unifies Reasoning Acting and Planning in Language Models, arXiv, 6 Juni 2024
Bangun, terapkan, dan kelola asisten dan agen AI yang kuat yang mengotomatiskan alur kerja dan proses dengan AI generatif.
Bangun masa depan bisnis Anda dengan solusi AI yang dapat Anda percaya.
Layanan IBM Consulting AI membantu merancang ulang cara kerja bisnis dengan AI untuk transformasi.