Apa itu kolaborasi multi-agen?

Penulis

Shalini Harkar

Lead AI Advocate

Perkembangan dari model bahasa besar (LLM) ke integrasi agen kecerdasan buatan (agen AI) mengubah lingkungan kecerdasan buatan (AI). Saat ini, sistem multiagen (MAS) membangkitkan gelombang baru layanan pengembangan produk dan perangkat lunak di mana AI terintegrasi sepenuhnya.  

Aplikasi LLM tradisional yang didukung oleh AI generatif (gen AI) sebagian besar difokuskan pada peningkatan produktivitas, menjawab pertanyaan, atau meringkas informasi. Namun, dengan diperkenalkannya agen dan kemampuan untuk komunikasi agen AI, kita memiliki kemampuan untuk menciptakan alur kerja otonom yang secara signifikan memangkas pekerjaan manual yang terlibat dalam penelitian, dukungan, analisis, dan operasi. Sekarang, sistem multiagen menangani berbagai tugas di dunia nyata yang kompleks seperti triase layanan pelanggan, analisis keuangan, pemecahan masalah teknis, serta pemantauan kepatuhan dan menjadi sistem yang dapat diskalakan, otonom, dan dapat terus ditingkatkan.

Apa itu kolaborasi multiagen?

Tindakan terkoordinasi antara beberapa agen independen dalam sistem terdistribusi, masing-masing memiliki pengetahuan lokal dan kemampuan pengambilan keputusan, disebut sebagai kolaborasi multiagen.

Dalam kolaborasi multiagen, semua agen ini bekerja sama menggunakan protokol komunikasi yang telah ditetapkan untuk bertukar informasi tentang kondisi, menetapkan tanggung jawab, dan mengoordinasikan tindakan. Kerja sama biasanya mencakup metode untuk memerinci tugas, penyebaran sumber daya, penyelesaian konflik, dan perencanaan kerja sama. Ini bisa ditunjukkan secara eksplisit melalui pengiriman pesan atau secara tersirat melalui modifikasi pada lingkungan bersama. Semua sistem ini mengutamakan skalabilitas, ketahanan terhadap kegagalan, dan perilaku kerja sama yang muncul dalam desainnya untuk beroperasi tanpa kendali terpusat. Mari kita pertimbangkan suatu analogi: Anggap sebuah armada drone sedang mencari lokasi bencana untuk penyintas atau informasi. Setiap drone mengikuti jalurnya sendiri, menghindari drone lain, melaporkan apa yang ditemukannya, dan mengubah arah jika terjadi peristiwa tak terduga. Bayangkan skenario ini seperti kolaborasi multiagen: Setiap drone beroperasi secara mandiri maupun kolektif, dalam arti seperti seorang asisten. Tanpa pengelolaan seorang pemimpin, mereka bekerja bersama, berkoordinasi satu sama lain, dan berbagi apa yang mereka lihat. Pendekatan ini adalah cara kerja armada agen otonom yang bekerja sama untuk menyelesaikan masalah kompleks dengan cerdas dan cepat.

Arsitektur kolaborasi ini merombak arsitektur produk, mengawali berbagai contoh penggunaan yang berjalan hampir sepanjang waktu, beradaptasi terhadap permintaan yang berkembang, dan terus-menerus belajar serta mengoptimalkan kemampuan tanpa intervensi manual. Proses otomatisasi agen dimungkinkan oleh agen khusus dengan kemampuan adaptif yang dirancang untuk menangani berbagai tugas tertentu dengan presisi dan otonomi. Agen AI khusus bekerja sama secara real-time untuk memberikan layanan cerdas, disesuaikan, dan menyeluruh dalam chatbot (menggunakan kerangka kerja RAG), sebuah jenis aplikasi multiagen baru.1

Mengapa agen perlu berkolaborasi?

Kerja sama di antara banyak agen merupakan persyaratan penting ketika merancang dan menerapkan sistem cerdas, terutama di lingkungan yang sangat kompleks, terdistribusi, dan memiliki kendala privasi. Kolaborasi multiagen memberikan banyak manfaat arsitektur, komputasi, dan operasional yang berbeda dengan jenis arsitektur agen lainnya, khususnya sistem agen tunggal. Hal ini terutama berlaku pada sistem yang kompleks, terdistribusi, dan real-time, di mana terdapat banyak tingkat privasi yang berbeda-beda secara inheren. Sistem multiagen (MAS) memungkinkan agen otonom yang terdesentralisasi untuk bekerja sama dalam mencapai tujuan kolektif atau yang saling bergantung, membantu mengatasi beberapa keterbatasan struktural dari sistem agen tunggal yang terbatas. Misalnya, sistem agen tunggal monolitik yang hanya dapat diskalakan hingga batas tertentu atau memiliki batasan pada latensi dan keumuman fungsi. Setiap agen mempertahankan tingkat otonomi, menyelesaikan perhitungan lokal, bekerja sama dengan agen lain menggunakan protokol komunikasi untuk berbagi sebagian pengetahuan tentang lingkungan mereka, berkolaborasi dalam pengambilan keputusan, dan mengoordinasikan strategi kontrol terdistribusi.  Kemampuan untuk mempertahankan skalabilitas modular memungkinkan integrasi agen atau subsistem baru yang mulus sekaligus memberikan perilaku adaptif di lingkungan dinamis secara real-time.  Misalnya, dalam sistem kesehatan cerdas, satu subset atau seluruh agen mungkin memiliki tugas spesifik domain; seperti memantau sinyal fisiologis, mengidentifikasi anomali, merekomendasikan terapi, dan mengelola data pasien yang dapat diidentifikasi sesuai dengan kebijakan.  Kerja sama mereka juga memungkinkan kontinuitas, akurasi, dan toleransi kesalahan di seluruh proses.  Kemampuan untuk menormalkan perhitungan di seluruh agen meningkatkan efisiensi komputasi dengan membagikan parameterisasi di seluruh agen dan menghilangkan ketergantungan pada perhitungan terpusat.2

Bagaimana multiagen berkolaborasi?

Untuk memahami bagaimana sistem multiagen bekerja, mari kita uraikan proses kerja sama menjadi serangkaian langkah yang terkoordinasi dengan baik, di mana setiap langkah menekankan bagaimana individu yang independen berinteraksi, menetapkan tugas, dan bekerja sama untuk menyelesaikan tugas-tugas yang menantang.

Agen berkolaborasi dan berkoordinasi melalui saluran terstruktur di mana setiap agen merupakan komponen cerdas yang memiliki lima elemen utama.

a.  Model dasar (𝑚): Elemen ini merupakan mesin penalaran utama agen, yang memungkinkan pembuatan dan pemahaman bahasa alami.

b. Tujuan (o): Tujuan atau tugas yang menjadi fokus agen dalam melaksanakannya didefinisikan oleh tujuan (𝑜).

c. Lingkungan (𝑒): Elemen ini menunjukkan situasi di mana agen beroperasi. Ini bisa melibatkan agen lain, alat, memori bersama atau antarmuka pemrograman aplikasi (API).

d. Informasi yang diterima oleh agen dari lingkungannya atau dari agen lain dikenal sebagai persepsi input (𝑥).

e. Output atau Tindakan (𝑦): Perilaku atau respons agen berdasarkan tujuan saat ini dan alur pemikirannya.

Kolaborasi terjadi ketika beberapa agen AI bekerja sama sebagai tim untuk menyelesaikan tugas. Selama fase kolaborasi, sistem menerima tugas dari pengguna atau lingkungan. Sistem memutuskan agen mana yang dibutuhkan dan peran apa yang akan mereka mainkan.

Sistem ini membagi masalah kompleks menjadi bagian-bagian yang dapat dikelola. Ini dicapai oleh model perencana atau bahasa dengan kemampuan penalaran. Komunikasi terjadi baik melalui memori bersama atau output perantara. Tugas yang ditugaskan dilakukan oleh agen secara bersamaan, berurutan, atau dinamis.

Hasil dari berbagai agen disusun untuk menghasilkan respons yang signifikan. Agen orkestrasi atau agen terakhir memulai tindakan atau memberikan respons lengkap kepada pengguna.3

Diagram alur untuk memahami cara kolaborasi multiagen beroperasi Gambar 1 menggambarkan kerangka kerja komprehensif untuk memahami cara kolaborasi multiagen beroperasi. Kerangka kerja ini menggambarkan dimensi utama yang mencirikan mekanisme kolaborasi di antara agen.

Berbagai strategi kolaborasi

Agen bekerja sama dengan agen lain dengan menggunakan berbagai strategi yang menentukan cara mereka berinteraksi, berkoordinasi, dan berkontribusi terhadap tujuan bersama. Berbagai strategi kolaborasi meliputi:

- Kolaborasi berbasis aturan:

Dalam jenis kolaborasi ini, interaksi antara berbagai agen dikendalikan secara ketat oleh seperangkat aturan atau pedoman tertentu. Semua aturan ini menentukan bagaimana agen bertindak, berkomunikasi, dan membuat pilihan dengan cara yang dapat diprediksi. Ruang lingkup pembelajaran atau adaptasi terbatas karena agen berpegang teguh pada kebijakan yang ditetapkan berdasarkan kondisi atau input tertentu. Metode ini sering dilakukan menggunakan pernyataan jika-maka, mesin kondisi, atau kerangka kerja berbasis logika. Kerja sama ini paling efektif untuk tugas yang sangat terstruktur atau dapat diprediksi, di mana menjaga konsistensi merupakan kuncinya.

Pro and kontra: Pendekatan ini memberikan efisiensi dan keadilan yang sangat baik, tetapi memiliki kesulitan dalam hal kemampuan beradaptasi dan skalabilitas, terutama dalam situasi yang cepat berubah atau kompleks.

- Kolaborasi berbasis peran:

Dalam pendekatan ini, agen diberikan peran atau tanggung jawab khusus yang selaras dengan kerangka kerja organisasi atau komunikasi yang jelas. Setiap peran dilengkapi dengan serangkaian fungsi, izin, dan tujuan tersendiri yang sering kali terkait dengan berbagai bagian dari tujuan sistem secara keseluruhan. Meskipun agen bekerja secara semimandiri dalam peran yang telah ditetapkan, mereka juga berperan dalam skema besar dengan berkoordinasi dan berbagi informasi satu sama lain. Konsep ini terinspirasi oleh dinamika tim manusia, di mana berbagai individu mengambil peran yang berbeda-beda seperti pemimpin, pengamat, atau pelaksana. Hal ini sangat bermanfaat untuk memerinci tugas, merancang sistem modular, dan memungkinkan agen dengan keahlian yang beragam untuk berkolaborasi secara efektif.

Pro dan kontra: Pendekatan ini memungkinkan kolaborasi modular berbasis pakar, tetapi mungkin menghadapi tantangan dengan fleksibilitas dan ketergantungannya pada integrasi agen.

- Kolaborasi berbasis model:

Dalam jenis kolaborasi ini, agen menciptakan model internal untuk memahami kondisi mereka sendiri, lingkungan di sekitar mereka, agen lain, dan tujuan bersama yang sedang mereka kejar. Model ini umumnya bersifat probabilistik atau didasarkan pada pembelajaran, yang membantu agen merencanakan tindakan mereka bahkan ketika situasi tidak pasti. Interaksi mereka bergantung pada memperbaiki tingkat keyakinan, membuat kesimpulan, dan memprediksi hasil, sehingga strategi mereka fleksibel dan sadar akan konteks. Beberapa metode umum yang mereka gunakan termasuk penalaran Bayes, proses keputusan Markov (MDP), dan berbagai model machine learning. Pendekatan ini sangat berguna dalam situasi di mana agen perlu memikirkan berbagai faktor yang tidak diketahui, beradaptasi dengan perubahan, atau bekerja sama tanpa memiliki visibilitas utuh.

Pro dan kontra: Pendekatan ini menawarkan fleksibilitas yang besar dan kemampuan pengambilan keputusan yang solid, tetapi juga disertai dengan tingkat kompleksitas yang signifikan dan biaya komputasi sangat besar.4

Kerangka kerja

Beberapa kerangka kerja yang populer sedang dikembangkan, masing-masing menggunakan metodenya sendiri yang berbeda untuk membantu agen bekerja sama secara efektif dalam aplikasi dunia nyata. Mari kita jelajahi kerangka kerja yang umum digunakan:

1. Kerangka kerja agen IBM Bee: Ini adalah aplikasi sumber terbuka yang memudahkan pengembangan dan pengelolaan proses multiagen yang dapat diskalakan. Kerangka kerja ini membangun fondasi untuk aplikasi di mana banyak agen AI berkolaborasi untuk menyelesaikan berbagai tugas yang menantang menggunakan LLM besar seperti IBM Granite, gpt-4, dan Llama 3. Dengan komponen siap pakai untuk agen, alat, manajemen memori, dan pemantauan, kerangka kerja ini memiliki desain modular. Serialisasi kondisi agen adalah salah satu karakteristiknya yang paling menonjol. Kemampuan ini memungkinkan penghentian prosedur kompleks dan dilanjutkan tanpa menghapus data apa pun. Penekanannya terletak pada kontrol tingkat produksi, ekstensibilitas, dan modularitas memungkinkan pengembangan sistem multiagen canggih untuk beragam aplikasi, dengan rencana untuk pengembangan lebih lanjut dalam orkestrasi multiagen. 

2. Agen LangChain: LangChain adalah kerangka kerja yang tangguh untuk membangun aplikasi berbasis model bahasa yang menekankan arsitektur berbasis agen yang kuat. Dalam opsi ini berarti agen dapat mengenali lingkungannya dan menggunakan berbagai alat yang tersedia untuk mengumpulkan informasi, menafsirkan, dan bertindak. Dalam LangChain sendiri, pengembang memiliki akses ke banyak alat dan integrasi untuk mempermudah rekayasa pada agen untuk melakukan penalaran yang kompleks, pengambilan keputusan dinamis, dan penyelesaian tugas. LangChain memungkinkan pengembang untuk memanfaatkan kemampuan tertinggi model bahasa besar (LLM) dalam mengembangkan sistem cerdas untuk menyelesaikan berbagai tugas canggih seperti menjawab pertanyaan kontekstual, alur kerja dengan banyak langkah, dan pembuatan bahasa alami.

3. Kerangka kerja OpenAI Swarm: Struktur ini menyajikan cara baru dalam mengoordinasikan banyak agen dalam hal rutinitas dan serah terima tugas. Alih-alih satu agen bertindak secara mandiri, setiap agen dapat dianggap sebagai unit khusus yang bekerja dengan alat khusus dan petunjuk yang disesuaikan. Penerusan tugas atau percakapan yang sudah ada dari satu agen ke agen lain memungkinkan pengalaman pengguna yang lancar, di mana setiap agen memiliki spesialisasi untuk peran tertentu. Pendekatan ini pada akhirnya akan meningkatkan efisiensi, modularitas, dan responsivitas sistem secara keseluruhan. Istilah Swarm menekankan koordinasi ringan dan pelaksanaan tugas yang efektif, yang memungkinkan kerangka kerja ini diterapkan pada skala yang lebih besar dalam berbagai tugas di dunia nyata.5

Solusi untuk perusahaan

Watsonx Orchestrate

Watsonx Orchestrate memudahkan Anda untuk memfasilitasi kolaborasi multiagen menggunakan kumpulan komponen yang saling terhubung dan bekerja sama untuk mengatur alur kerja yang mendukung AI. Keterampilan adalah agen independen yang menjalankan berbagai tugas tertentu, seperti mengirim email atau menanyakan data; mereka dijelaskan dan terdaftar dalam Daftar Keterampilan yang menguraikan kemampuan dan metadata mereka. Ketika pengguna mengajukan permintaan, Pengurai Maksud menggunakan pemrosesan bahasa alami (NLP) untuk membaca input pengguna dan menghubungkannya dengan keterampilan.

Pengatur Alur menyediakan logika dan alur eksekusi, termasuk urutan tugas, percabangan, kesalahan, dan upaya coba lagi, untuk membantu memastikan bahwa agen dieksekusi dalam urutan yang diperlukan dan langkah yang gagal dapat dicoba lagi. Pengatur alur memungkinkan agen dieksekusi secara bersamaan bila diperlukan. Konteks yang Dibagikan dan Penyimpanan Memori menyediakan ruang bersama untuk menyimpan data, output, dan keputusan dalam satu ruang, sehingga agen dapat mengetahui kondisi satu sama lain dan menjaga kontinuitas selama alur kerja mereka. Asisten LLM menggunakan model bahasa besar untuk membantu penalaran, mengatasi perubahan konteks, dan mengisi celah pengetahuan saat berkolaborasi. 

Antarmuka Manusia memungkinkan pengguna untuk melihat alur dan mengelola alur kerja agen jika mereka ingin terlibat. Semua komponen ini dapat mendukung kolaborasi multiagen untuk membantu memastikan bahwa watsonx Orchestrate dapat mengelola alur kerja multiagen yang kompleks secara mandiri, namun tetap memungkinkan keterlibatan manusia dalam siklus ini.6

Prediksi masa depan

Munculnya kecerdasan bersama: Saat berbagai agen otonom bekerja sama melalui kerangka kerja kolaborasi yang ditetapkan dengan baik dan dilengkapi dengan batasan untuk membantu memastikan keselarasan, keamanan, dan relevansi tugas, perilaku cerdas mulai muncul—melampaui kemampuan individual dari setiap agen tunggal. Akurasi, relevansi, efisiensi, dapat dijelaskan, dan koherensi sistem secara keseluruhan merupakan beberapa metrik dengan banyak aspek yang dapat digunakan untuk mengevaluasi dan meningkatkan keampuhan semua sistem ini secara berkelanjutan.

Kecerdasan bersama memberikan sistem ini kemampuan untuk memecahkan masalah kompleks dan multidimensi menggunakan penalaran terdistribusi dan pembagian tugas, yang menghasilkan otomatisasi, pengambilan keputusan, dan orkestrasi dengan alur kerja yang terdiri dari banyak langkah.

Solusi terkait
Pengembangan agen AI IBM 

Bantu pengembang untuk membangun, menerapkan, dan memantau agen AI dengan studio IBM watsonx.ai.

Jelajahi watsonx.ai
Agen AI dan asisten IBM

Ciptakan produktivitas inovatif dengan salah satu rangkaian kemampuan paling komprehensif di industri untuk membantu bisnis membangun, menyesuaikan, dan mengelola agen dan asisten AI. 

Jelajahi agen AI
IBM Granite

Raih penghematan biaya lebih dari 90% dengan model Granite yang lebih kecil dan terbuka, yang dirancang untuk efisiensi pengembang. Model yang sesuai dengan kebutuhan perusahaan ini memberikan kinerja luar biasa terhadap tolok ukur keamanan dan di berbagai tugas perusahaan, mulai dari keamanan siber hingga RAG.

Jelajahi Granite
Ambil langkah selanjutnya

Otomatisasi alur kerja yang kompleks dan ciptakan produktivitas inovatif dengan salah satu rangkaian kemampuan paling komprehensif di industri untuk membantu bisnis membangun, menyesuaikan, dan mengelola agen dan asisten AI. 

Jelajahi pengembangan agen watsonx.ai Temukan watsonx Orchestrate
Catatan kaki

1 Tran, K.-T., Dao, D., Nguyen, M.-D et.al (10 Januari 2025). Multi-Agent Collaboration Mechanisms: A Survey of LLMs. arXiv. https://arxiv.org/abs/2501.06322

2 Han, S., Zhang, Q., Yao, Y., Jin, W., & Xu, Z. (2024). LLM Multi-Agent Systems: Challenges and Open Problems. arXiv. https://arxiv.org/abs/2402.03578

3 Jennings, N. R., & Wooldridge, M. (1996). Intelligent agents: Theory and practice. The Knowledge Engineering Review, 10(2), 115–152. https://www.cambridge.org/core/journals/knowledge-engineering-review/article/abs/intelligent-agents-theory-and-practice/CF2A6AAEEA1DBD486EF019F6217F1597

4  Wang, Jialin, and Zhihua Duan, “Agent AI with LangGraph: A Modular Framework for Enhancing Machine Translation Using Large Language Models.” CoRR, abs/2412.03801, 5 Desember 2024. arXiv:2412.03801 

5 Kerangka kerja untuk mengevaluasi agen berbasis LLM, https://github.com/vladfeigin/llm-agents-evaluation

6 Gomez-Sanz, J. J., & Pavón, J. (2004). Methodologies for developing multi-agent systems. Journal of Universal Computer Science, 10(4), 404–426.