Die erweiterte Generation (Graph Retrieval-Augmented Generation) (Graph RAG) entwickelt sich zu einer leistungsstarken Technik für generative KI-Anwendungen, um domänenspezifisches Wissen und relevante Informationen zu nutzen. Graph RAG ist eine Alternative zu Vektorsuchmethoden, die eine Vektordatenbank verwenden.

Wissensgraphen (Knowledge Graphs) sind Wissenssysteme, in denen Graphdatenbanken wie Neo4j oder Amazon Neptune strukturierte Daten darstellen können. In einem Wissensgraphen sind die Beziehungen zwischen Datenpunkten, als Edges bezeichnet, genauso aussagekräftig wie die Verbindungen zwischen Datenpunkten, die als Knoten bezeichnet werden. Ein Wissensgraph erleichtert das Durchlaufen eines Netzwerks und das Verarbeiten komplexer Abfragen zu verbundenen Daten. Wissensgraphen eignen sich besonders gut für Anwendungsfälle, die Chatbots, Identitätsauflösung, Netzwerkanalyse, Empfehlungsmaschinen, Customer 360 und Betrugserkennung beinhalten.

Ein Graph RAG-Ansatz nutzt die strukturierte Natur von Diagrammdatenbanken, um den abgerufenen Informationen über Netzwerke oder komplexe Beziehungen mehr Tiefe und Kontext zu verleihen. Eine Graphdatenbank wird mit einem Large Language Model (LLM) gepaart. So kann ein Entwickler wichtige Teile des Graphen-Erstellungsprozesses aus unstrukturierten Daten wie Text automatisieren. Ein LLM kann Textdaten verarbeiten und Entitäten identifizieren, ihre Beziehungen verstehen und sie in einer Diagrammstruktur darstellen.

Es gibt verschiedene Möglichkeiten, eine Graph-RAG-Anwendung zu erstellen, beispielsweise mit GraphRAG von Microsoft oder durch die Kombination von GPT4 mit LlamaIndex. Für dieses Tutorial verwenden Sie Memgraph, eine Open-Source-Lösung für Graphdatenbanken, um ein Rag-System mit Meta's Llama-3 auf Watsonx zu erstellen. Memgraph verwendet Cypher, eine deklarative Abfragesprache. Es weist einige Ähnlichkeiten mit SQL auf, konzentriert sich jedoch eher auf Knoten und Beziehungen als auf Tabellen und Zeilen. Llama 3 erstellt und füllt Ihre Diagrammdatenbank aus unstrukturiertem Text und Abfrageinformationen in der Datenbank.