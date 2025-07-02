Die Retrieval-Augmented Generation (RAG) verbindet ein LLM mit einer externen Datenquelle, um seine Wissensbasis zu erweitern. Wenn ein Benutzer eine Abfrage sendet, durchsucht das RAG-System die gepaarte Datenbank nach relevanten Informationen und kombiniert diese dann mit der Abfrage, um dem LLM bei der Generierung einer Antwort mehr Kontext zu geben.

RAG verwendet Einbettungen, um eine Datenbank, einen Quellcode oder andere Informationen in eine durchsuchbare Vektordatenbank umzuwandeln. Einbettungen stellen jeden Datenpunkt in einem dreidimensionalen Vektorraum mathematisch dar. Um relevante Daten zu finden, wandelt das Information-Retrieval-Modell in einem RAG-System Benutzeranfragen in Einbettungen um und sucht ähnliche Einbettungen in der Vektordatenbank.

RAG-Systeme folgen in der Regel der gleichen Standardabfolge:

Prompt: Der Benutzer sendet einen Prompt an die Benutzeroberfläche, z. B. einen KI-gestützten Chatbot. Abfrage: Ein Information-Retrieval-Modell wandelt den Prompt in eine Einbettung um und fragt die Datenbank nach ähnlichen Daten ab. Rückgewinnung: Das Retrieval-Modell ruft die relevanten Daten aus der Datenbank ab. Generierung: Das RAG-System kombiniert die abgerufenen Daten mit der Anfrage des Benutzers und sendet sie an das LLM, das eine Antwort generiert. Lieferung: Das RAG-System gibt die generierte Antwort an den Benutzer zurück.

RAG hat seinen Namen aufgrund der Art und Weise, wie RAG-Systeme relevante Daten abrufen und sie verwenden, um die vom LLM generierte Antwort zu ergänzen. Komplexere RAG-Systeme führen zusätzliche Komponenten ein, um den Prozess zu optimieren und die Antwortqualität weiter zu verbessern.