Apa itu arsitektur agen?

Penyusun

Vanna Winland

AI Advocate & Technology Writer

Jess Bozorg

Lead, AI Advocacy

IBM

Cole Stryker

Staff Editor, AI Models

IBM Think

Apa itu arsitektur agen?

Arsitektur agen mengacu pada struktur dan desain kerangka kerja kecerdasan buatan (AI) agen. Arsitektur agen adalah arsitektur yang membentuk ruang virtual dan struktur alur kerja untuk mengotomatiskan model AI dalam sistem AI agen.

AI agen adalah sistem atau program yang menggunakan agen AI untuk melakukan tugas secara mandiri atas nama pengguna atau sistem lain. Arsitektur agen bekerja untuk mendukung dan mengatur perilaku agen didukung AI yang bekerja dalam sistem AI generatif (gen AI). Sistem AI agen memerlukan agen-agennya untuk bersifat adaptif dan mampu menavigasi lingkungan dinamis guna mencapai hasil yang diinginkan.

Model ini tidak jauh berbeda dengan psikologi manusia—agensi merujuk pada kemampuan untuk secara sengaja membuat sesuatu terjadi berdasarkan tindakan seseorang.1 Untuk mencapai hasil yang diinginkan, seseorang harus menggunakan perencanaan, tindakan, ingatan, dan refleksi. Ciri-ciri ini sesuai dengan ciri-ciri agen AI modern yang digunakan dalam kerangka kerja tunggal maupun multiagen.
 
Kemajuan dalam algoritma machine learning (ML) dan model bahasa besar (LLM) seperti GPT OpenAI telah mendorong pengembangan agen AI. Tujuan dari arsitektur agen adalah untuk menyediakan struktur bagi LLM agar dapat mengotomatiskan agen dalam menyelesaikan tugas-tugas kompleks.

Perilaku otonom atau pengambilan keputusan agen AI tergantung pada infrastruktur yang mendukungnya. Arsitektur agen dirancang untuk beradaptasi dengan lingkungan dinamis, meningkatkan interoperabilitas.

Misalnya, agen dapat berinteraksi dengan berbagai sumber data dan format, antarmuka pemrograman aplikasi (API), atau sistem. Perilaku yang mudah beradaptasi ini memungkinkan agen untuk membuat keputusan berdasarkan informasi.

Tren AI terbaru, dipersembahkan oleh para pakar

Dapatkan kurasi insight tentang berita AI yang paling penting dan menarik. Berlangganan buletin Think mingguan. Lihat Pernyataan Privasi IBM.

Terima kasih! Anda telah berlangganan.

Langganan Anda akan dikirimkan dalam bahasa Inggris. Anda akan menemukan tautan berhenti berlangganan di setiap buletin. Anda dapat mengelola langganan atau berhenti berlangganan di sini. Lihat Pernyataan Privasi IBM kami untuk informasi lebih lanjut.

Bagaimana arsitektur agen bekerja

Arsitektur AI agen harus terdiri dari komponen yang alamat faktor-faktor inti dari sebuah agen: Maksud (perencanaan), pemikiran ke depan, responsivitas diri, dan refleksi diri.2 Faktor-faktor ini memberikan otonomi kepada agen AI sehingga mereka dapat menetapkan tujuan, merencanakan, memantau kinerja mereka, dan merefleksikan untuk mencapai tujuan spesifik mereka.
 
Teknologi agen menggunakan pemanggilan alat backend untuk mengumpulkan informasi terkini, melakukan pengoptimalan alur kerja yang kompleks, dan secara otomatis menghasilkan tugas untuk mencapai tujuan yang kompleks.

Saat beroperasi, agen otonom menyesuaikan diri dengan preferensi pengguna seiring waktu, menawarkan pengalaman yang lebih personal dan memberikan respons yang lebih detail. Proses pemanggilan alat ini dapat berjalan tanpa input manusia, membuka kemungkinan yang lebih luas untuk aplikasi AI dunia nyata.

Agen AI

5 Jenis Agen AI: Fungsi Otonom & Aplikasi Dunia Nyata

Pelajari bagaimana AI berbasis tujuan dan berbasis utilitas beradaptasi dengan alur kerja dan lingkungan yang kompleks.

Agen vs. non-agen

Arsitektur agen mendukung perilaku agen dalam agen AI. Agen AI adalah sistem yang dapat beradaptasi dan didorong oleh model machine learning yang dapat berinteraksi dengan lingkungan eksternal dan menggunakan alat untuk mencapai tujuan tertentu. Tidak semua agen AI bersifat agen. Itu tergantung pada kompleksitas dan kemampuan kerangka kerja orkestrasi atau sistem.

Arsitektur agen memungkinkan agen AI untuk bertindak dengan tingkat otonomi tertentu dan mengambil keputusan berdasarkan tujuan tanpa memerlukan input manusia secara terus-menerus.3 Agen AI otonom membutuhkan sedikit atau nol intervensi manusia untuk menyelesaikan tugas spesifik mereka.

Dalam arsitektur non-agen, LLM mampu melakukan tugas tunggal atau linier.4 Fungsi model AI dalam arsitektur non-agen adalah memberikan output berdasarkan input dan konteks.

Tanpa orkestrasi eksplisit, LLM tidak dapat menyimpan informasi baru secara real-time dan sering kali kesulitan dalam menangani masalah kompleks akibat keterbatasan konteksnya. Misalnya, beberapa aplikasi AI umum yang tidak memerlukan alur kerja agen kompleks termasuk analisis semantik, chatbot, dan generasi teks.

Arsitektur agen yang ideal tergantung pada persyaratan aplikasi dan contoh penggunaan. Sistem tunggal sangat efektif dalam menangani masalah yang spesifik dan terfokus—pada dasarnya berfungsi sebagai pemecah masalah individu.

Namun, beberapa tantangan mungkin memerlukan keahlian unik dari agen khusus, sementara yang lain mungkin mendapat manfaat pendekatan kolaboratif yang melibatkan beberapa agen yang bekerja bersama sebagai tim.

Jenis arsitektur agen

Tabel ini memberikan perbandingan yang jelas antara berbagai jenis arsitektur sistem agen AI: vertikal, horizontal, dan hybrid. Ini menyoroti struktur mereka, fitur utama, kekuatan, kelemahan dan contoh penggunaan terbaik untuk membantu menentukan pendekatan yang paling cocok untuk berbagai tugas. 

Arsitektur agen tunggal

Arsitektur agen tunggal memiliki entitas otonom tunggal yang membuat keputusan terpusat dalam lingkungan.

  • Struktur

    • Arsitektur agen tunggal adalah sistem di mana agen AI tunggal beroperasi secara independen untuk memahami lingkungannya, membuat keputusan, dan mengambil tindakan untuk mencapai tujuan.

  • Fitur utama

    • Otonomi: Agen beroperasi secara independen tanpa memerlukan interaksi dengan agen lain.
       
  • Kekuatan

    • Kesederhanaan: Lebih mudah untuk merancang, mengembangkan, dan menerapkan dibandingkan dengan sistem multiagen. Membutuhkan lebih sedikit sumber daya karena tidak perlu mengelola beberapa agen atau protokol komunikasi.
    • Prediktabilitas: Debug lebih mudah dilakukan dan dipantau karena agen beroperasi secara independen.
    • Kecepatan: Tidak perlu negosiasi atau pembentukan konsensus di antara beberapa agen.
    • Biaya: Lebih murah untuk dikelola dan diperbarui dibandingkan dengan arsitektur multiagen yang kompleks. Lebih sedikit tantangan integrasi saat diterapkan dalam aplikasi perusahaan.
       
  • Kelemahan

    • Skalabilitas terbatas: Seorang agen tunggal dapat menjadi bottleneck saat menangani tugas-tugas dengan volume tinggi atau kompleks.
    • Kekakuan: Kesulitan dalam menyelesaikan tugas yang memerlukan alur kerja bertahap atau koordinasi antar bidang yang berbeda.
    • Sempit: Biasanya dirancang untuk fungsi atau domain tertentu.
       
  • Contoh penggunaan terbaik

    • Chatbot sederhana: Chatbot dapat beroperasi secara mandiri, tidak memerlukan koordinasi dengan agen lain, dan berfungsi dengan baik dalam interaksi pengguna yang terstruktur dan mandiri.
    • Sistem rekomendasi: Rekomendasi konten yang dipersonalisasi, seperti yang ditemukan di layanan streaming, cukup sederhana untuk diterapkan dalam arsitektur agen tunggal.

Arsitektur multiagen

Arsitektur multiagen melampaui kemampuan AI dari pengaturan agen tunggal tradisional, menghadirkan beberapa manfaat unik. Setiap agen mengkhususkan diri dalam domain tertentu—seperti analisis kinerja, pencegahan cedera atau riset pasar—sambil berkolaborasi dengan lancar untuk memecahkan masalah yang kompleks.

Agen menyesuaikan peran mereka sesuai dengan tugas yang terus berkembang, membantu memastikan fleksibilitas dan responsivitas dalam situasi dinamis.

Sistem multiagen lebih fleksibel. Satu agen mungkin menggunakan pemrosesan bahasa alami (NLP), agen lainnya mungkin mengkhususkan diri dalam visi komputer. Agen mungkin menggunakan pembuatan respons dengan pengambilan data yang ditingkatkan (RAG) untuk menarik dari kumpulan data eksternal.

Ada banyak penyedia kerangka kerja multiagen seperti CrewAI, kerangka kerja multiagen berbasis Python yang beroperasi di atas LangChain. Solusi AI lainnya adalah DeepWisdom, yang menawarkan MetaGPT, kerangka kerja yang menggunakan alur kerja terstruktur yang dipandu oleh prosedur operasi standar.

Arsitektur AI vertikal

  • Struktur

    • Dalam arsitektur vertikal, agen pemimpin mengawasi subtugas dan keputusan, sedangkan agen melaporkan untuk pengendalian terpusat.5 Agen AI hierarkis mengetahui peran mereka dan melapor kepada atau mengawasi agen lain sesuai dengan peran mereka.
       
  • Fitur utama

    • Hierarki: Peran telah ditetapkan dengan jelas.
    • Komunikasi terpusat: Agen melapor kepada pemimpin.
       
  • Kekuatan

    • Efisiensi tugas: Ideal untuk alur kerja berurutan.
    • Akuntabilitas yang jelas: Pemimpin menyelaraskan tujuan.
  • Kelemahan

    • Hambatan: Ketergantungan pada pemimpin dapat menghambat kemajuan.

    • Titik kegagalan tunggal: Rentan terhadap masalah pemimpin.

  • Contoh penggunaan terbaik

    • Otomatisasi alur kerja: Persetujuan multilangkah.

    • Pembuatan dokumen: Bagian yang diawasi oleh seorang pemimpin.

Arsitektur AI horizontal

  • Struktur

    • Model kolaborasi antar sesama: Agen bekerja sebagai mitra setara dalam sistem terdesentralisasi, berkolaborasi secara bebas untuk menyelesaikan tugas.6

  • Fitur utama

    • Kolaborasi terdistribusi: Semua agen berbagi sumber daya dan ide.

    • Keputusan terdesentralisasi: Pengambilan keputusan yang digerakkan oleh kelompok untuk otonomi kolaboratif.

  • Kekuatan

    • Pemecahan masalah yang dinamis: Menumbuhkan inovasi.

    • Pemrosesan paralel: Agen bekerja pada tugas-tugas secara bersamaan.

  • Kelemahan

    • Tantangan koordinasi: Ketidakmampuan manajemen dapat menyebabkan ketidak efisienan.

    • Keputusan yang lebih lambat: Terlalu banyak pertimbangan.

  • Contoh penggunaan terbaik

    • Sumbang saran: Menghasilkan ide-ide yang beragam.

    • Pemecahan masalah kompleks: Menghadapi tantangan interdisipliner.

Arsitektur AI hybrid

  • Struktur

    • Menggabungkan kepemimpinan terstruktur dengan fleksibilitas kolaboratif; kepemimpinan bergeser berdasarkan persyaratan tugas.

  • Fitur utama

    • Kepemimpinan dinamis: Kepemimpinan menyesuaikan diri dengan fase tugas.

    • Kepemimpinan kolaboratif: Pemimpin berinteraksi secara terbuka dengan rekan-rekan mereka.

  • Kekuatan

    • Kemampuan serbaguna: Menggabungkan keunggulan kedua model.

    • Kemampuan beradaptasi: Mampu menangani berbagai tugas yang memerlukan struktur dan kreativitas.

  • Kelemahan

    • Kompleksitas: Menyeimbangkan peran kepemimpinan dan kolaborasi memerlukan mekanisme yang kuat.

    • Manajemen sumber daya: Lebih menuntut.

  • Contoh penggunaan terbaik

    • Tugas yang beragam: Perencanaan strategis atau proyek tim.

    • Proses dinamis: Menyeimbangkan tuntutan terstruktur dan kreatif.

Diagram arsitektur agen tunggal dan multiagen

Kerangka kerja agen

Kerangka kerja agen merujuk pada arsitektur desain atau model yang menetapkan cara agen (buatan maupun alami) dapat melaksanakan tugas, mengambil keputusan, dan berinteraksi dengan lingkungannya secara otonom dan cerdas. Kerangka kerja ini memberikan struktur dan pedoman tentang bagaimana agen beroperasi, menggunakan nalar, dan beradaptasi dalam berbagai kondisi.

Arsitektur reaktif

Arsitektur reaktif memetakan situasi langsung ke tindakan. Mereka bersifat refleksif, mengambil keputusan berdasarkan stimulus langsung dari lingkungan sekitar alih-alih mengandalkan memori atau kemampuan prediktif. Mereka tidak bisa belajar dari masa lalu atau merencanakan masa depan. 

Arsitektur deliberatif

Arsitektur deliberatif adalah sistem kecerdasan buatan (AI) yang mengambil keputusan berdasarkan penalaran, perencanaan, dan model internal tentang dunia. Berbeda dengan agen reaktif, agen deliberatif menganalisis lingkungannya, memprediksi hasil di masa depan, dan membuat keputusan yang terinformasi sebelum bertindak.

Arsitektur kognitif

Arsitektur agen kognitif adalah sistem AI canggih yang meniru pemikiran, penalaran, pembelajaran, dan pengambilan keputusan seperti manusia.

Semua agen ini menggabungkan unsur persepsi, memori, penalaran, dan adaptasi, masing-masing diwakili oleh tiap modul, sehingga mereka dapat beroperasi di lingkungan yang kompleks dan tidak pasti sekaligus terus meningkatkan kinerjanya seiring waktu. Ini adalah jenis arsitektur agen yang paling canggih.

Arsitektur BDI (lebih umum disebut sebagai model atau kerangka kerja) dirancang untuk memodelkan pengambilan keputusan rasional pada agen cerdas, dan didasarkan pada kerangka kerja belief-desire-intention (BDI).

Arsitektur ini meniru penalaran serupa manusia dalam agen BDI, dengan:

  • Keyakinan (B): Pengetahuan agen tentang dunia, yang dapat mencakup pemahaman agen tentang lingkungan, situasi saat ini, dan data sensorik apa pun.

Contoh: "Pintu ditutup."

  • Keinginan (D): Tujuan atau sasaran agen, yang mewakili apa yang ingin dicapainya. Keinginan tidak harus berupa tindakan, tetapi tujuan tingkat tinggi.

Contoh: "Saya ingin memasuki ruangan."

  • Maksud (I): Tindakan yang akan dilakukan oleh agen untuk mencapai keinginannya. Maksud mewakili tindakan terencana yang diburu agen secara aktif, dengan mempertimbangkan keyakinan dan keinginannya.

Contoh: "Saya akan membuka pintu untuk memasuki ruangan."

Catatan kaki

1 Bandura A. “Social cognitive theory: an agentic perspective.” Annu Rev Psychol. 2001;52:1-26. doi: 10.1146/annurev.psych.52.1.1. https://pubmed.ncbi.nlm.nih.gov/11148297/.

2 Bandura A. “Social cognitive theory: an agentic perspective.”

3 T. Masterman, S. Besen, M. Sawtell, and A. Chao, "The Landscape of Emerging AI Agent Architectures for Reasoning, Planning, and Tool Calling: A Survey," arXiv preprint arXiv:2404.11584, Apr. Tahun 2024. [Online]. Tersedia: https://arxiv.org/abs/2404.11584.

4 E. H. Durfee and V. Lesser, "Negotiating Task Decomposition and Allocation Using Partial Global Planning," in Distributed Artificial Intelligence Volume II, ed. L. Gasser dan M. Huhns (London: Pitman Publishing; San Mateo, CA: Morgan Kaufmann, 1989), 229–244.

5 Masterman, et al, “, "The Landscape of Emerging AI Agent Architectures for Reasoning, Planning, and Tool Calling: A Survey."

6 Masterman, et al, “, "The Landscape of Emerging AI Agent Architectures for Reasoning, Planning, and Tool Calling: A Survey."

Solusi terkait
Pengembangan agen AI IBM 

Bantu pengembang untuk membangun, menerapkan, dan memantau agen AI dengan studio IBM watsonx.ai.

Jelajahi watsonx.ai
Agen AI dan asisten IBM

Ciptakan produktivitas inovatif dengan salah satu rangkaian kemampuan paling komprehensif di industri untuk membantu bisnis membangun, menyesuaikan, dan mengelola agen dan asisten AI. 

Jelajahi agen AI
IBM Granite

Raih penghematan biaya lebih dari 90% dengan model Granite yang lebih kecil dan terbuka, yang dirancang untuk efisiensi pengembang. Model yang sesuai dengan kebutuhan perusahaan ini memberikan kinerja luar biasa terhadap tolok ukur keamanan dan di berbagai tugas perusahaan, mulai dari keamanan siber hingga RAG.

Jelajahi Granite
Ambil langkah selanjutnya

Otomatisasi alur kerja yang kompleks dan ciptakan produktivitas inovatif dengan salah satu rangkaian kemampuan paling komprehensif di industri untuk membantu bisnis membangun, menyesuaikan, dan mengelola agen dan asisten AI. 

Jelajahi pengembangan agen watsonx.ai Temukan watsonx Orchestrate