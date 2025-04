Secondo una ricerca di IBM, circa il 42% delle aziende intervistate utilizza l'AI nell'ambito del proprio business. Tra tutti i casi d'uso, molti di noi conoscono ormai molto bene i chatbot di AI per l'elaborazione del linguaggio naturale, in grado di rispondere alle nostre domande e di assisterci in attività come la composizione di e-mail o documenti. Eppure, anche con l'adozione diffusa di questi chatbot, le aziende si trovano ancora occasionalmente ad affrontare alcune problematiche. Ad esempio, i chatbot possono produrre risultati poco coerenti poiché attingono da grandi data store che potrebbero non essere pertinenti alla query in questione.

Per fortuna, la retrieval-augmented generation (RAG) è emersa come una soluzione promettente per basare i modelli linguistici di grandi dimensioni (LLM) sulle informazioni più accurate e aggiornate. In quanto framework di AI, la RAG lavora per migliorare la qualità delle risposte generate dall'LLM basando il modello su fonti di conoscenze, al fine di integrare la rappresentazione interna delle informazioni dell'LLM. IBM ha presentato watsonx, il suo nuovo portfolio di prodotti di AI che include la RAG, nel maggio 2023.

In poche parole, utilizzare la RAG è come far sostenere al modello un esame a libro aperto, poiché si chiede al chatbot di rispondere a una domanda con tutte le informazioni prontamente disponibili. Come opera tuttavia la RAG a livello di infrastruttura? Grazie a una combinazione di servizi platform-as-a-service (PaaS), la RAG può funzionare bene e facilmente, supportando i risultati dell'AI generativa delle organizzazioni che utilizzano gli LLM in vari tipi di settori.