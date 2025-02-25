La RAG avancée fonctionne comme un processus séquentiel basé sur des étapes :

1. Traitement des requêtes : Dès réception d'une requête d'utilisateur, celle-ci est transformée en un vecteur à haute dimension à l'aide du modèle d'embedding qui capture la signification sémantique de la requête.

2. Récupération de documents : la requête encodée parcourt une énorme base de connaissances qui fournit une récupération hybride en utilisant à la fois la recherche vectorielle dense et la récupération éparse, c’est-à-dire la similarité sémantique et la recherche par mot clé. Les résultats introduisent ainsi des correspondances sémantiques de mots clés dans les documents récupérés.

3. Reclassement des documents récupérés : le retriever attribue une note finale en fonction du contexte et par rapport à la requête qui permet de récupérer les documents.

4. Fusion contextuelle pour la génération : chaque document étant codé différemment, le décodeur fusionne tous les contextes codés afin de garantir la cohérence des réponses générées avec celles de la requête codée.

5. Génération de réponses : Le générateur de RAG avancée, généralement un LLM, tel que le modèle IBM Granite™ ou Llama, fournit la réponse en fonction des documents récupérés.

6. Boucle de rétroaction : À un stade avancé, la RAG utilise diverses techniques, telles que l'apprentissage actif, l'apprentissage par renforcement et le co-entraînement avec générateur de récupération pour améliorer continuellement ses performances. Au cours de cette phase, des signaux implicites apparaissent, tels que des clics sur des documents récupérés qui en déduisent la pertinence, ce qui entraîne des commentaires explicites, y compris des corrections ou des évaluations pour une application ultérieure en cours de génération. Par conséquent, au fil des ans, ces stratégies améliorent les processus de récupération et de génération de réponses afin de produire des réponses plus précises et plus pertinentes6.