La génération augmentée par récupération (RAG) est une technique qui consiste à récupérer les informations pertinentes en procédant à une recherche de similarité dans les bases de données vectorielles, sources de connaissances externes et bases de connaissances internes. On combine ensuite les informations récupérées avec un LLM pour générer des sorties précises et adaptées au contexte. Si les applications RAG traditionnelles améliorent les fonctionnalités des LLM dans les applications d’IA générative, elles ne permettent pas de capter les relations complexes entre les données. Elles peines à accomplir des tâches telles que le raisonnement multi-sauts (combiner les informations provenant de plusieurs sources pour obtenir des réponses par le biais de connexions logiques et d’inférences indirectes), le contexte relationnel et la compréhension des données hiérarchiques. Par exemple, une approche RAG traditionnelle peut avoir du mal à répondre à une requête du type « Qui a développé la théorie de la relativité ? », car cela nécessite un raisonnement sur les relations entre les entités.

GraphRAG résout ce problème en incorporant des données structurées en graphes, qui organisent les informations dans un réseau de nœuds (entités telles que les personnes et les lieux), d’arêtes (les relations entre ces entités) et d’étiquettes (les attributs qui définissent la catégorie d’un nœud ou d’une arête). Par exemple, un graphe de connaissances peut représenter « Albert Einstein a développé la théorie de la relativité » sous forme d’informations structurées en graphe, ce qui facilite la récupération et le traitement de ces informations par GraphRAG. Dans cet exemple, les nœuds sont « Albert Einstein » et « théorie de la relativité », et l’arête est « développé ».