Retrieval-Augmented Generation (RAG) ist eine Technik, die relevante Informationen durch Ähnlichkeitssuche aus Vektordatenbank, externen Wissensquellen und internen Wissensbasen abruft. Anschließend werden diese gewonnenen Informationen mit LLMs kombiniert, um genaue und kontextbezogene Ausgaben zu generieren. Während traditionelle RAG-Anwendungen die Funktionalität von LLMs in generativen KI-Anwendungen verbessern, fehlt ihnen die Fähigkeit, komplexe Datenbeziehungen in Daten zu erfassen. RAG stößt bei Aufgaben wie Multi-Hop-Reasoning (also der Kombination von Informationen aus mehreren Quellen, um durch logische Verknüpfungen und indirekte Schlussfolgerungen Antworten abzuleiten), beim Erfassen von Beziehungszusammenhängen sowie beim Verstehen hierarchischer Daten an seine Grenzen. Ein herkömmlicher RAG-Ansatz könnte beispielsweise Schwierigkeiten mit einer Anfrage wie „Wer entwickelte die Relativitätstheorie?“ haben, da hierfür ein Verständnis der Beziehungen zwischen verschiedenen Entitäten erforderlich ist.

GraphRAG überwindet dieses Problem durch die Einbeziehung von als Graph strukturierten Daten, die Informationen als Netzwerk von Knoten (Entitäten wie Personen oder Orte), Kanten (Beziehungen zwischen diesen Entitäten) und Labels (Attribute, die die Kategorie eines Knotens und eines Edge definieren) organisieren. Zum Beispiel könnte ein Wissensgraph „Albert Einstein–entwickelte–die Relativitätstheorie“ wie als Graph strukturierte Informationseinheiten darstellen, was es GraphRAG erleichtert, diese Informationen abzurufen und zu verarbeiten. In diesem Beispiel sind die Knoten „Albert Einstein“ und „Relativitätstheorie“, und die Kante ist „entwickelte“.