La retrieval-augmented generation funziona individuando i dati pertinenti alla query dell'utente, quindi utilizzandoli per creare prompt più informativi. Un meccanismo di recupero delle informazioni viene aggiunto per aumentare i prompt per l'LLM e aiutarlo a generare risposte più pertinenti.
I modelli RAG generano risposte attraverso un processo suddiviso in quattro passaggi:
Query: un utente invia una query che avvia il sistema RAG.
Recupero delle informazioni: algoritmi complessi o API setacciano le knowledge base interne ed esterne alla ricerca di informazioni pertinenti.
Integrazione: i dati recuperati vengono abbinati alla query dell'utente e forniti al modello RAG per la risposta. Fino a questo punto, l'LLM non ha elaborato la query.
Risposta: unendo i dati recuperati con il proprio addestramento e le conoscenze memorizzate, l'LLM genera una risposta contestualmente ricca e accurata.
Nella ricerca tra i documenti, i sistemi RAG utilizzano la ricerca semantica. I database vettoriali organizzano i dati per somiglianza, consentendo di effettuare ricerche per significato piuttosto che per parola chiave. Le tecniche di ricerca semantica consentono agli algoritmi RAG di raggiungere le parole chiave precedenti all'intento di una query e di restituire i dati più pertinenti.
I sistemi RAG richiedono una vasta costruzione e manutenzione dell'architettura dei dati. I data engineer devono creare le pipeline di dati necessarie per collegare i data lakehouse della loro organizzazione all'LLM e utilizzare la RAG. I sistemi RAG richiedono anche un prompt engineering preciso per individuare i dati giusti e assicurarsi che l'LLM sappia cosa farne.
Pensiamo ancora a un modello di gen AI come a un cuoco amatoriale. Conosce i concetti di base della cucina, ma non dispone delle informazioni più recenti e della conoscenza esperta di uno chef addestrato in una particolare cucina. La RAG equivale a dare a un cuoco amatoriale un libro di ricette di quella specifica cucina. Combinando la sua conoscenza generale con le ricette del libro, il nostro cuoco potrà creare facilmente i suoi piatti preferiti di quella cucina.