La génération augmentée de récupération consiste à localiser les données pertinentes par rapport à la requête de l’utilisateur, puis à utiliser ces données pour créer des prompts plus informatifs. Un mécanisme de récupération d’informations est ajouté pour compléter les prompts du LLM et l’aider à générer des réponses plus pertinentes.
Les modèles RAG génèrent des réponses par le biais d’un processus en quatre étapes :
Requête : un utilisateur soumet une requête qui lance le système RAG.
Récupération d’informations : des algorithmes complexes ou des API passent au peigne fin les bases de connaissances internes et externes à la recherche d’informations pertinentes.
Intégration : les données récupérées sont combinées à la requête de l’utilisateur et transmises au modèle RAG pour qu’il y réponde. À ce stade, le LLM n’a pas encore traité la requête.
Réponse : en combinant les données récupérées à ses données d’entraînement et aux connaissances stockées, le LLM génère une réponse adaptée au contexte.
Lorsqu’ils recherchent des documents, les systèmes RAG utilisent la recherche sémantique. Les bases de données vectorielles organisent les données par similarité, permettant ainsi des recherches par signification plutôt que par mot-clé. Les techniques de recherche sémantique permettent aux algorithmes RAG d’aller au-delà des mots-clés pour atteindre l’intention d’une requête et renvoyer les données les plus pertinentes.
Les systèmes RAG nécessitent une construction et une maintenance élaborées de l’architecture de données. Les ingénieurs de données doivent créer les pipelines de données nécessaires pour connecter les data lakehouses de leur organisation au LLM et exploiter la RAG. Les systèmes RAG ont également besoin du prompt engineering pour localiser les bonnes données et s’assurer que le LLM sait comment s’en servir.
Encore une fois, imaginez un modèle d’IA générative comme un cuisinier en herbe à la maison. Il connaît les bases de la cuisine, mais n’a pas les informations et les connaissances spécialisées d’un chef formé à une cuisine plus sophistiquée. La RAG est comme donner un livre de recettes à un cuisinier. En combinant ses connaissances culinaires générales avec les recettes du livre de cuisine, il peut facilement confectionner ses plats préférés.