Embora a RAG agêntica otimize os resultados com chamada de função, raciocínio em várias etapas e sistemas multiagente, ele nem sempre é a melhor escolha. Mais agentes no trabalho significam maiores despesas, e um sistema de RAG agêntica geralmente requer o pagamento de mais tokens. Embora a RAG agêntica aumente a velocidade em relação à RAG tradicional, os LLMs também introduzem latência porque podem levar mais tempo para o modelo gerar suas saídas.
Por último, os agentes nem sempre são confiáveis. Eles podem ter dificuldades e até mesmo não conseguir concluir tarefas, dependendo da complexidade e dos agentes usados. Os agentes nem sempre colaboram de forma harmoniosa e podem competir pelos recursos. Quanto mais agentes houver em um sistema, mais complexa se tornará a colaboração, com maior chance de complicações. E mesmo o sistema de RAG mais robusto não consegue eliminar completamente o potencial de alucinações.