I sistemi di agentic AI uniscono la versatilità e la flessibilità dei grandi modelli linguistici (LLM) e la precisione dei modelli di programmazione tradizionali. I sistemi di agentic AI sono in grado di pianificare ed eseguire autonomamente attività per conto di un utente o di un altro sistema. I sistemi di agentic AI risolvono problemi complessi suddividendoli in serie di attività più piccole e utilizzando gli strumenti disponibili per interagire con i sistemi esterni o per eseguire attività computazionali.
Queste funzionalità rendono i sistemi di agentic AI in grado di gestire una gamma di attività molto più ampia e complessa rispetto ai soli LLM. Ad esempio, se si dovesse dare un prompt a un LLM per consigliare quale auto acquistare, il modello genererebbe doverosamente un elenco di consigli basato sui dati disponibili al momento dell'addestramento del modello. D'altra parte, una soluzione di agentic AI potrebbe suggerire ulteriori dettagli su come si intende utilizzare il veicolo (per piacere, per andare al lavoro, per trasportare carichi pesanti) e informare che è disponibile uno sconto da parte dei produttori fino alla fine del mese.
Un sistema di agentic AI è composto dai seguenti componenti:
Gli agenti hanno una propria architettura concettuale, illustrata nella figura sottostante.
Gli agenti sono costituiti dai seguenti componenti principali:
Componenti aggiuntivi, non mostrati nella figura, possono essere aggiunti per fornire la gestione operativa degli agenti, il monitoraggio delle prestazioni e i controlli di sicurezza come la propagazione delle identità e la prevenzione delle fughe di dati.
Il diagramma seguente illustra il flusso di controllo e di informazioni attraverso l'architettura concettuale.
Il diagramma sopra illustra la mappatura dei prodotti IBM verso l'architettura di agentic AI.
Watsonx Orchestrate è una soluzione di agentic AI "tutto in uno" che combina:
Watsonx.ai Agent Builder è uno strumento low-code/no-code che consente agli sviluppatori di creare agenti e definire e gestire strumenti utilizzando flussi precostituiti.
L'orchestrazione degli agenti può essere implementata con diversi approcci. Un approccio di orchestrazione centralizzata utilizza un singolo componente master di orchestrazione per gestire le azioni di tutti gli altri agenti nel sistema. Avere un unico punto di configurazione e gestione rende il sistema complessivo semplice da gestire e controllare, facile da diagnosticare. L'aspetto negativo è che un singolo punto di controllo può diventare un collo di bottiglia e portare a problemi di scalabilità con l'aumento dei volumi delle richieste e/o del numero di agenti.
Un approccio di orchestrazione decentralizzata implementa una coda di attività da cui gli agenti prelevano le attività e pubblicano i risultati, instradando tra loro le attività composte da più parti; in modo simile a un sistema blackboard. Le soluzioni di orchestrazione decentralizzate sono estremamente robuste e tolleranti ai guasti, ma sono difficili da progettare e risolvere man mano che i sistemi diventano più grandi con maggiori funzionalità.
Infine, un approccio di orchestrazione gerarchica combina elementi degli approcci centralizzati e decentralizzati. Nell'orchestrazione gerarchica, un orchestratore master viene utilizzato per coordinare le azioni di agenti di alto livello che a loro volta possono evocare altri agenti per completare compiti complessi. In questo modo si conserva gran parte della facilità di gestione e di controllo di un approccio centralizzato, ma si riduce la possibilità che il componente di controllo centrale diventi un collo di bottiglia in presenza di elevati volumi di richieste e/o di un gran numero di agenti.
La granularità di un agente AI si riferisce alla complessità dei compiti che l'agente può svolgere. Un agente ad alta granularità può essere in grado di svolgere molti compiti o un piccolo numero di compiti con un alto livello di dettaglio, mentre un agente a bassa granularità può essere in grado di svolgere solo un piccolo numero o anche solo un singolo compito con un livello di dettaglio ridotto. Per rendere più chiaro questo concetto, consideriamo un agente del servizio clienti. Un agente a bassa granularità può essere in grado di rispondere solo a semplici domande su un prodotto (ad esempio, "È disponibile in nero?"), mentre un agente ad alta granularità può essere in grado di controllare gli inventari locali e organizzare la consegna del prodotto a casa del cliente.
I progettisti di soluzioni agentiche devono decidere quanto rendere granulari i singoli agenti all'interno del sistema, ad esempio se avere un numero ridotto di agenti ad alta granularità oppure un numero maggiore di agenti a bassa granularità. Le ampie funzionalità dell'agente ad alta granularità comportano un maggiore fabbisogno di risorse informatiche e tempi di completamento delle attività più lunghi. Sebbene meno capaci, il focus ristretto degli agenti a bassa granularità significa che richiedono meno risorse di calcolo e generalmente completano le attività molto più velocemente.
Sebbene il livello di granularità "giusto" non sia ancora noto, le prime esperienze suggeriscono la creazione di agenti a bassa granularità allineati a processi aziendali mirati, ad esempio Purchase_Order_Processing_Agent, produce un buon equilibrio tra requisiti di risorse, velocità di elaborazione e complessità della soluzione. Gli agenti a bassa granularità possono quindi essere incorporati in workflow statici, oppure invocati da agenti ad alta granularità come parte di un processo più ampio.
I progettisti di soluzioni di agentic AI devono trovare un equilibrio tra agenti che seguono processi e workflow predefiniti e statici, e workflow generati dinamicamente in risposta ai prompt degli utenti. Sebbene non esista una risposta giusta o sbagliata, si consiglia agli architetti di tenere in considerazione le seguenti raccomandazioni e considerazioni:
I workflow statici dovrebbero essere utilizzati per i processi aziendali costituiti da più passaggi complessi che attraversano domini di conoscenza (ad esempio, legali e contabili) o che sono soggetti a supervisione normativa. L'uso di workflow statici in questi casi offre agli architetti diversi benefici: