Apa itu RAG agen?

Penyusun

Staff writer

Staff Editor, AI Models

IBM Think

RAG Agen adalah penggunaan agen AI untuk memfasilitasi generasi dengan dukungan pengambilan data (RAG). Sistem RAG agen menambahkan agen AI ke jalur RAG untuk meningkatkan kemampuan beradaptasi dan akurasi. Dibandingkan dengan sistem RAG tradisional, RAG agen memungkinkan model bahasa besar (LLM) untuk melakukan pengambilan informasi dari berbagai sumber dan menangani alur kerja yang lebih kompleks.

Apa itu RAG?

Generasi dengan dukungan pengambilan data adalah aplikasi kecerdasan buatan (AI) yang menghubungkan model AI generatif dengan basis pengetahuan eksternal. Data dalam basis pengetahuan menambahkan lebih banyak konteks pada kueri pengguna sehingga LLM dapat menghasilkan respons yang lebih akurat. RAG memungkinkan LLM menjadi lebih akurat dalam konteks khusus domain tanpa perlu penyempurnaan.

Model AI yang diaktifkan RAG tidak hanya mengandalkan data pelatihan dan dapat mengakses data saat ini secara real-time melalui API dan koneksi lain ke sumber data. Jalur RAG standar terdiri dari dua model AI:

Komponen pengambilan informasi, biasanya berupa model penanaman yang dipasangkan dengan basis data vektor yang berisi data yang akan diambil.

Komponen AI generatif biasanya merupakan LLM.

Sebagai respons terhadap pertanyaan pengguna bahasa alami, model penanaman mengubah pertanyaan menjadi penanaman vektor, lalu mengambil data serupa dari basis pengetahuan. Sistem AI menggabungkan data yang diambil dengan pertanyaan pengguna untuk menghasilkan respons yang mempertimbangkan konteks.

Apa itu AI agen?

AI agen adalah jenis AI yang dapat menentukan dan melakukan tindakan dengan sendirinya. Sebagian besar agen yang tersedia pada saat penerbitan adalah LLM dengan kemampuan pemanggilan fungsi, yang berarti mereka dapat memanggil alat untuk melakukan tugas. Secara teori, agen AI adalah LLM dengan tiga karakteristik signifikan:

Agen AI memiliki ingatan, baik jangka pendek maupun jangka panjang, yang memungkinkan mereka untuk merencanakan dan melaksanakan tugas-tugas yang kompleks. Memori juga memungkinkan agen untuk merujuk ke tugas sebelumnya dan menggunakan data tersebut untuk menginformasikan alur kerja pada masa mendatang. Sistem RAG agen menggunakan caching semantik untuk menyimpan dan merujuk pada kumpulan kueri, konteks, dan hasil sebelumnya.

Mereka mampu melakukan perutean kueri, perencanaan langkah demi langkah, dan pengambilan keputusan. Agen menggunakan kemampuan memori mereka untuk menyimpan informasi dan merencanakan tindakan yang tepat sebagai respons terhadap kueri dan prompt yang kompleks.

Agen dapat melakukan pemanggilan alat melalui API. Agen yang lebih cakap dapat memilih alat bantu mana yang akan digunakan untuk alur kerja yang mereka hasilkan sebagai respons terhadap interaksi pengguna.

Alur kerja agen dapat terdiri dari satu agen AI atau sistem multiagen yang menggabungkan beberapa agen bersama-sama.

Buletin industri

Tren AI terbaru, dipersembahkan oleh para pakar

Dapatkan kurasi insight tentang berita AI yang paling penting dan menarik. Berlangganan buletin Think mingguan. Lihat Pernyataan Privasi IBM.

Sistem RAG agen vs. sistem RAG tradisional

RAG Agen menghasilkan beberapa peningkatan yang signifikan dibandingkan implementasi RAG tradisional:

Fleksibilitas: Aplikasi RAG Agen menarik data dari beberapa basis pengetahuan eksternal dan memungkinkan penggunaan alat eksternal. Jalur RAG standar menghubungkan LLM ke kumpulan data eksternal tunggal. Misalnya, banyak sistem RAG perusahaan memasangkan chatbot dengan basis pengetahuan yang berisi data organisasi eksklusif.
Kemampuan beradaptasi: Sistem RAG tradisional adalah alat pengambilan data reaktif yang menemukan informasi yang relevan untuk menanggapi pertanyaan tertentu. Sistem RAG tidak memiliki kemampuan untuk beradaptasi dengan perubahan konteks atau mengakses data lain. Hasil yang optimal sering kali membutuhkan rekayasa prompt yang luas.

Sementara itu, RAG agen adalah transisi dari kueri berbasis aturan statis ke pemecahan masalah yang adaptif dan cerdas. Sistem multiagen mendorong beberapa model AI untuk berkolaborasi dan memeriksa hasil kerja satu sama lain.
Akurasi: Sistem RAG tradisional tidak memvalidasi atau mengoptimalkan hasil mereka sendiri. Orang harus menentukan apakah sistem bekerja pada standar yang dapat diterima. Sistem itu sendiri tidak memiliki cara untuk mengetahui apakah data yang tepat telah ditemukan atau berhasil digabungkan untuk memfasilitasi pembuatan yang mempertimbangkan konteks. Namun, agen AI dapat mengulangi proses sebelumnya untuk mengoptimalkan hasil dari waktu ke waktu.
Skalabilitas: Dengan jaringan agen RAG yang bekerja beriringan, yang memanfaatkan beberapa sumber data eksternal dan menggunakan kemampuan pemanggilan alat dan perencanaan, agen RAG memiliki skalabilitas yang lebih besar. Pengembang dapat membangun sistem RAG yang fleksibel dan dapat diskalakan yang dapat menangani berbagai pertanyaan pengguna.
Multimodalitas: Sistem RAG Agen mendapat manfaat dari kemajuan terbaru dalam LLM multimodal untuk bekerja dengan lebih banyak jenis data, seperti file gambar dan audio. Model multimodal memproses berbagai jenis data terstruktur, semiterstruktur, dan tidak terstruktur. Misalnya, beberapa model GPT terbaru dapat menghasilkan konten visual dan audio selain pembuatan teks standar.

Bayangkan beberapa karyawan yang bekerja di kantor. Sistem RAG tradisional adalah karyawan yang berkinerja baik ketika diberi tugas tertentu dan diberi tahu cara menyelesaikannya. Mereka enggan mengambil inisiatif dan merasa tidak nyaman jika menyimpang dari instruksi yang jelas.

Sebagai perbandingan, sistem RAG agen adalah tim yang proaktif dan kreatif. Sistem ini juga pandai mengikuti arahan tetapi suka mengambil inisiatif dan memecahkan tantangan sendiri. Mereka tidak takut untuk menemukan solusi sendiri atas tugas-tugas rumit yang mungkin membingungkan atau mengancam rekan kerja mereka.

Apakah RAG agen lebih baik dari RAG tradisional?

Meskipun RAG agen mengoptimalkan hasil dengan pemanggilan fungsi, penalaran dengan banyak langkah, dan sistem multiagen, sistem ini tidak selalu menjadi pilihan yang lebih baik. Lebih banyak agen di tempat kerja berarti biaya yang lebih besar dan sistem RAG agen biasanya memerlukan pembayaran untuk lebih banyak token. Meskipun RAG agen dapat meningkatkan kecepatan dibandingkan RAG tradisional, LLM juga menyebabkan latensi karena model ini memerlukan waktu lebih lama untuk menghasilkan outputnya.

Terakhir, agen tidak selalu dapat diandalkan. Mereka mungkin kesulitan dan bahkan gagal menyelesaikan tugas, tergantung pada kompleksitas dan agen yang digunakan. Agen tidak selalu berkolaborasi dengan lancar dan dapat bersaing memperebutkan sumber daya. Semakin banyak agen dalam suatu sistem, semakin rumit kolaborasinya, dengan peluang komplikasi yang lebih tinggi. Selain itu, bahkan sistem RAG yang paling ketat sekalipun tidak dapat menghilangkan potensi halusinasi sepenuhnya.

Akademi AI

Menjadi pakar AI

Raih pengetahuan demi memprioritaskan investasi AI yang mendorong pertumbuhan bisnis. Mulai dengan Akademi AI gratis kami hari ini dan pimpin masa depan AI di organisasi Anda.

Tonton serialnya

Bagaimana cara kerja RAG agen?

RAG agen bekerja dengan menggabungkan satu atau lebih jenis agen AI ke dalam sistem RAG. Sebagai contoh, sistem RAG agen dapat menggabungkan beberapa agen pengambilan informasi, masing-masing mengkhususkan diri pada domain atau jenis sumber data tertentu. Satu agen akan meminta informasi dari basis data eksternal, sementara agen lain dapat menelusurinya melalui email dan hasil pencarian di web.

Kerangka kerja AI agen, seperti LangChain dan LlamaIndex, dan kerangka kerja orkestrasi LangGraph dapat ditemukan di GitHub. Kerangka kerja ini memungkinkan dilakukannya eksperimen dengan arsitektur agen untuk RAG dengan biaya minimal. Jika menggunakan model sumber terbuka seperti Granite atau Llama-3, perancang sistem RAG juga dapat mengurangi biaya yang diminta oleh penyedia lain seperti OpenAI sekaligus mendapatkan observabilitas yang lebih luas.

Sistem agen RAG dapat berisi satu atau lebih jenis agen AI, seperti:

Agen perutean

Agen perencanaan kueri

Agen ReAct

Agen perencanaan dan pelaksanaan

Agen perutean

Agen perutean menentukan sumber dan alat pengetahuan eksternal mana yang digunakan untuk menangani kueri pengguna. Mereka memproses prompt pengguna dan mengidentifikasi pipeline RAG yang paling mungkin menghasilkan pembuatan respons yang optimal. Dalam sistem RAG agen tunggal, agen perutean memilih sumber data mana yang akan ditanyakan.

Agen perencanaan kueri

Agen perencanaan kueri adalah manajer tugas dari jalur RAG. Agen ini memproses kueri pengguna yang kompleks untuk membaginya menjadi proses langkah demi langkah. Mereka mengirim subkueri yang dihasilkan ke agen lain dalam sistem RAG, kemudian menggabungkan respons untuk mendapatkan respons keseluruhan yang kohesif. Proses yang menggunakan satu agen untuk mengelola model AI lainnya adalah jenis orkestrasi AI.

Agen ReAct

ReAct (penalaran dan aksi) adalah kerangka kerja agen yang menciptakan sistem multiagen yang dapat membuat dan kemudian bertindak berdasarkan solusi langkah demi langkah. Mereka juga dapat mengidentifikasi alat yang tepat yang dapat membantu. Berdasarkan hasil dari setiap langkah, agen ReAct dapat secara dinamis menyesuaikan tahapan berikutnya dari alur kerja yang dihasilkan.

Agen perencanaan dan pelaksanaan

Kerangka kerja agen perencanaan dan pelaksanaan adalah perkembangan dari agen ReAct. Mereka dapat menjalankan alur kerja multilangkah tanpa menghubungi kembali agen utama, mengurangi biaya, dan meningkatkan efisiensi. Dan karena perencana harus memikirkan semua langkah yang diperlukan untuk suatu tugas, tingkat penyelesaian dan kualitas cenderung lebih tinggi.

Contoh penggunaan RAG agen

Kendati RAG agen dapat cocok dengan aplikasi RAG tradisional apa pun, permintaan komputasi yang lebih besar membuatnya lebih sesuai untuk situasi yang memerlukan kueri beberapa sumber data. Aplikasi RAG agen meliputi:

Menjawab pertanyaan secara real-time: Perusahaan dapat menerapkan chatbot dan FAQ yang didukung RAG untuk memberikan informasi terkini yang akurat kepada karyawan dan pelanggan.

Dukungan otomatis: Bisnis yang ingin menyederhanakan layanan dukungan pelanggan dapat menggunakan sistem RAG otomatis untuk menangani pertanyaan pelanggan yang lebih sederhana. Sistem RAG agen dapat meneruskan permintaan dukungan yang lebih sulit kepada personel manusia.

Manajemen data: Sistem RAG memudahkan pencarian informasi dalam penyimpanan data milik sendiri. Karyawan dapat dengan cepat mendapatkan data yang mereka butuhkan tanpa harus memilah-milah sendiri dalam database.

Mulai mewujudkan ROI: Panduan praktis untuk AI agen

Temukan cara untuk maju, berhasil menskalakan AI di seluruh bisnis Anda dengan hasil nyata.

Sumber daya

Tingkatkan produktivitas dengan agen AI yang dibuat untuk bisnis Anda

Jelajahi potensi agen AI yang mengubah permainan yang dapat dengan mudah diintegrasikan ke dalam operasi bisnis Anda.

Panduan pembeli Agen AI 2025

Selami panduan komprehensif ini menguraikan contoh penggunaan utama, kemampuan inti, dan rekomendasi langkah demi langkah untuk membantu Anda memilih solusi yang tepat untuk bisnis Anda.

Bayangkan kembali produktivitas bisnis dengan agen AI dan asisten AI

Pelajari cara agen AI dan asisten AI dapat bekerja sama untuk mencapai tingkat produktivitas baru.

Laporan Omdia tentang kecerdasan yang diberdayakan: Dampak agen AI

Temukan cara Anda dapat membuka potensi penuh gen AI dengan agen AI.

Mengantarkan perusahaan agentik: Memanfaatkan AI di seluruh kawasan teknologi Anda

Tetap dapatkan informasi terkini tentang agen AI baru yang sedang berkembang, titik balik mendasar dalam revolusi AI.

Coba watsonx Orchestrate

Jelajahi cara asisten AI generatif dapat meringankan beban kerja Anda dan meningkatkan produktivitas.

Cara agen AI menemukan kembali produktivitas

Pelajari cara-cara menggunakan AI agar lebih kreatif, efisien, dan mulai beradaptasi dengan masa depan yang melibatkan kerja sama dengan agen AI.

Masa depan agen, konsumsi energi AI, penggunaan komputer Anthropic, dan penandaan teks yang dihasilkan AI oleh Google

Tetap menjadi yang terdepan dengan para pakar AI kami di episode Mixture of Experts ini saat mereka membahas secara mendalam masa depan AI dan agen AI dan banyak lagi.

Bagaimana Comparus menggunakan "asisten perbankan"

Comparus menggunakan solusi dari IBM® watsonx.ai™ dan secara mengesankan menunjukkan potensi perbankan percakapan sebagai model interaksi baru.

Solusi terkait

Agen AI untuk bisnis

Bangun, terapkan, dan kelola asisten dan agen AI yang kuat yang mengotomatiskan alur kerja dan proses dengan AI generatif.

Menjelajahi watsonx Orchestrate

Solusi agen AI IBM

Bangun masa depan bisnis Anda dengan solusi AI yang dapat Anda percaya.

Jelajahi solusi agen AI

Layanan AI IBM Consulting

Layanan IBM Consulting AI membantu merancang ulang cara kerja bisnis dengan AI untuk transformasi.

Jelajahi layanan kecerdasan buatan

Ambil langkah selanjutnya

Baik Anda memilih untuk menyesuaikan aplikasi dan keterampilan yang dibangun sebelumnya atau membangun dan menerapkan layanan agen khusus menggunakan studio AI, platform IBM watsonx siap membantu Anda.