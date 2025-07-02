La generación aumentada por recuperación (RAG) conecta un LLM con una fuente externa de datos para ampliar su base de conocimientos. Cuando un usuario envía una consulta, el sistema RAG busca información relevante en la base de datos emparejada y luego la combina con la consulta para brindarle al LLM más contexto al generar una respuesta.

RAG emplea incorporaciones para transformar una base de datos, código fuente u otra información en una base de datos vectorial buscable. Las incrustaciones trazan matemáticamente cada punto de datos en un espacio vectorial tridimensional. Para encontrar datos relevantes, el modelo de recuperación de información en un sistema RAG convierte las consultas del usuario en incorporaciones y localiza incorporaciones similares en la base de datos vectorial.

Los sistemas RAG generalmente siguen la misma secuencia estándar:

Indicaciones: el usuario envía una indicación a la interfaz de usuario, como un chatbot impulsado por IA . Consulta: Un modelo de recuperación de información convierte la instrucción en una incorporación y consulta la base de datos en busca de datos similares. Recuperación: El modelo de recuperación recupera los datos relevantes de la base de datos. Generación: el sistema RAG combina los datos recuperados con la consulta del usuario y los envía al LLM, que genera una respuesta. Entrega: el sistema RAG devuelve la respuesta generada al usuario.

RAG recibe su nombre debido a la forma en que los sistemas RAG recuperan datos relevantes y los utilizan para aumentar la respuesta generada por el LLM. Los sistemas RAG más complejos introducen componentes adicionales para refinar el proceso y mejorar aún más la calidad de la respuesta.