Meskipun RAG agen mengoptimalkan hasil dengan pemanggilan fungsi, penalaran dengan banyak langkah, dan sistem multiagen, sistem ini tidak selalu menjadi pilihan yang lebih baik. Lebih banyak agen di tempat kerja berarti biaya yang lebih besar dan sistem RAG agen biasanya memerlukan pembayaran untuk lebih banyak token. Meskipun RAG agen dapat meningkatkan kecepatan dibandingkan RAG tradisional, LLM juga menyebabkan latensi karena model ini memerlukan waktu lebih lama untuk menghasilkan outputnya.
Terakhir, agen tidak selalu dapat diandalkan. Mereka mungkin kesulitan dan bahkan gagal menyelesaikan tugas, tergantung pada kompleksitas dan agen yang digunakan. Agen tidak selalu berkolaborasi dengan lancar dan dapat bersaing memperebutkan sumber daya. Semakin banyak agen dalam suatu sistem, semakin rumit kolaborasinya, dengan peluang komplikasi yang lebih tinggi. Selain itu, bahkan sistem RAG yang paling ketat sekalipun tidak dapat menghilangkan potensi halusinasi sepenuhnya.