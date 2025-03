A geração aumentada de recuperação é uma aplicação de inteligência artificial (IA) que conecta um modelo de IA generativa a uma base de conhecimento externa. Os dados na base de conhecimento aumentam as consultas dos usuários com mais contexto para que o LLM possa gerar respostas mais precisas. O RAG permite que os LLMs sejam mais precisos em contextos específicos de domínio sem a necessidade de ajustes .

Em vez de depender apenas de dados de treinamento, os modelos de IA habilitados por RAG podem acessar dados atuais em tempo real por meio de APIs e outras conexões com fontes de dados. Um pipeline RAG padrão compreende dois modelos de IA:

O componente de recuperação de informações, normalmente um modelo de embedding emparelhado com um banco de dados de vetores contendo os dados a serem recuperados.

O componente de IA generativa , geralmente um LLM.

Em resposta às consultas de linguagem natural do usuário, o modelo de embedding converte a consulta em um embedding de vetor e, em seguida, recupera dados semelhantes da base de conhecimento. O sistema de IA combina os dados recuperados com a consulta do usuário para geração de respostas com base no contexto.