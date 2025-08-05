La Retrieval-augmented generation (RAG) è un modo efficace per fornire a un LLM dataset aggiuntivi da varie fonti di dati senza la necessità di costose ottimizzazioni. Allo stesso modo, il RAG agente utilizza la capacità di un agente AI di pianificare ed eseguire attività secondarie insieme al recupero di informazioni rilevanti per integrare la base di conoscenze di un LLM. Questa capacità consente l'ottimizzazione e una maggiore scalabilità delle applicazioni RAG rispetto ai chatbot tradizionali. Non è più necessario scrivere complesse query SQL per estrarre dati rilevanti da una base di conoscenza.

Il futuro del RAG agentico è il RAG multi-agente, in cui diversi agenti specializzati collaborano per ottenere una latenza e un'efficienza ottimali. Dimostreremo questa collaborazione utilizzando un modello piccolo ed efficiente come Granite 3.2 e combinandolo con un'architettura di agenti modulare. Utilizzeremo diversi "mini agenti" specializzati che collaborano per portare a termine le attività attraverso una pianificazione adattiva e la chiamata di strumenti o funzioni. Come gli esseri umani, un team di agenti, o un sistema multiagente, spesso supera gli sforzi eroici di un individuo, soprattutto quando ha dei ruoli chiaramente definiti e una comunicazione efficace.

Per l' orchestrazione di questa collaborazione, possiamo usare AutoGen (AG2) come framework principale per gestire i workflow e il processo decisionale, insieme ad altri strumenti come Ollama per il servizio LLM locale e Open WebUI per l'interazione. AutoGen è un framework per la creazione di applicazioni AI multiagente sviluppato da Microsoft.1 In particolare, ogni componente utilizzato in questo tutorial è open source. Insieme, questi strumenti ti consentono di creare un sistema AI potente e attento alla privacy, senza lasciare il tuo laptop.