Che cos'è l'architettura agentica?

Autori

Vanna Winland

AI Advocate & Technology Writer

Jess Bozorg

Lead, AI Advocacy

IBM

Cole Stryker

Staff Editor, AI Models

IBM Think

Che cos'è l'architettura agentica?

L'architettura agentica si riferisce alla struttura e al design dei framework di intelligenza artificiale (AI) agentica. Un'architettura di agentic AI è quella che modella lo spazio virtuale e la struttura del workflow per automatizzare i modelli AI all'interno di un sistema di agentic AI.

L'agentic AI è un sistema o programma che utilizza gli agenti AI per eseguire autonomamente attività per conto di un utente o di un altro sistema. L'architettura agentica funziona per supportare e regolare il comportamento degli agenti basati sull'AI che lavorano all'interno di un sistema di AI generativa (gen AI). I sistemi di agentic AI richiedono che i suoi agenti siano adattivi e navighino in ambienti dinamici per ottenere i risultati desiderati.

Il modello non è così diverso dalla psicologia umana: l'azione si riferisce alla capacità di far accadere intenzionalmente qualcosa in base alle proprie azioni.1 Per ottenere i risultati desiderati, è necessario utilizzare la pianificazione, l'azione, la memoria e la riflessione. Queste caratteristiche sono in linea con quelle dei moderni agenti AI utilizzati in framework ad agente singolo e multiagente.
 
I progressi negli algoritmi di apprendimento automatico (ML) e nei modelli linguistici di grandi dimensioni (LLM), come GPT di OpenAI, hanno guidato lo sviluppo degli agenti AI. L'obiettivo dell'architettura agentica è fornire una struttura per un LLM per automatizzare gli agenti per completare attività complesse.

Il comportamento o processo decisionale autonomo di un agente AI dipende dall'infrastruttura che lo abilita. L'architettura agentica è progettata per adattarsi ad ambienti dinamici, migliorando l'interoperabilità.

Ad esempio, gli agenti possono interfacciarsi con diverse fonti e formati di dati, application programming interface (API) o sistemi. Questo comportamento adattabile consente agli agenti di prendere decisioni informate.

Le ultime tendenze in materia di AI, proposte da esperti

Ricevi insight selezionati sulle notizie più importanti e interessanti sull'AI. Iscriviti alla nostra newsletter settimanale Think. Leggi l'Informativa sulla privacy IBM.

Grazie per aver effettuato l'iscrizione!

L'abbonamento sarà fornito in lingua inglese. Troverai un link per annullare l'iscrizione in tutte le newsletter. Puoi gestire i tuoi abbonamenti o annullarli qui. Per ulteriori informazioni, consulta l'Informativa sulla privacy IBM.

Come funziona l'architettura agentica

L'architettura di agentic AI dovrebbe essere composta da componenti che affrontino i fattori fondamentali dell'azione: intenzionalità (pianificazione), lungimiranza, auto-reattività e auto-riflessività.2 Questi fattori forniscono autonomia agli agenti AI in modo che possano fissare obiettivi, pianificare, monitorare le loro prestazioni e riflettere per raggiungere il loro obiettivo specifico.
 
La tecnologia agentica utilizza strumenti di backend per raccogliere informazioni aggiornate, ottimizza workflow complessi e genera automaticamente attività per raggiungere obiettivi complessi.

Man mano che funziona, l'agente autonomo si adatta alle preferenze dell'utente nel tempo, offrendo un'esperienza più personalizzata e fornendo risposte più dettagliate. Questo processo di tool calling può essere eseguito senza input umano, sbloccando possibilità più ampie per le applicazioni AI del mondo reale.

Agenti AI

5 tipi di agenti AI: funzioni autonome e applicazioni nel mondo reale

Scopri come l'AI basata sugli obiettivi e sulle utilità si adatta ai workflow e agli ambienti complessi.

Agente e non agente a confronto

Le architetture agentiche supportano il comportamento agentico all'interno degli agenti AI. Gli agenti AI sono sistemi adattabili guidati da modelli di machine learning che possono interagire con ambienti esterni e utilizzare strumenti per completare obiettivi specifici. Non tutti gli agenti AI sono agentici. Dipende dalla complessità e dalle funzionalità del framework o del sistema di orchestrazione.

L'architettura agentica consente agli agenti AI di agire con un certo grado di autonomia e prendere decisioni basate su obiettivi senza la necessità costante di input.3 Gli agenti AI autonomi necessitano di un intervento umano minimo o nullo per completare i loro compiti specifici.

Nelle architetture non agentiche, gli LLM sono in grado di svolgere attività singole o lineari.4 La funzione dei modelli AI in un'architettura non agentica è fornire output basati su input e contesto.

Senza un'orchestrazione esplicita, gli LLM non possono conservare nuove informazioni in tempo reale e spesso hanno problemi complessi a causa del loro contesto limitato. Ad esempio, alcune comuni applicazioni AI che non richiedono workflow agentici complessi includono l'analisi semantica, i chatbot e la generazione di testo.

L'architettura ideale dell'agente dipende dai requisiti dell'applicazione e dal caso d'uso. I sistemi ad agente singolo eccellono nell'affrontare problemi mirati e specifici, agendo essenzialmente come risolvitori di problemi individuali.

Tuttavia, alcune sfide potrebbero richiedere l'esperienza unica di un agente specializzato, mentre altre potrebbero trarre vantaggio da un approccio collaborativo che coinvolga più agenti che lavorano insieme come un team.

Tipi di architetture agentiche

La tabella fornisce un chiaro confronto tra i diversi tipi di sistemi di architettura degli agenti AI: verticale, orizzontale e ibrida. Ne evidenzia le strutture, le caratteristiche principali, i punti di forza, i punti deboli e i migliori casi d'uso per aiutare a determinare l'approccio più adatto per varie attività. 

Architetture a singolo agente

Un'architettura a singolo agente ha una caratteristica di un'unica entità autonoma che prende decisioni centralizzate all'interno di un ambiente.

  • Struttura

    • Un'architettura a singolo agente è un sistema in cui un singolo agente AI opera in modo indipendente per percepire il proprio ambiente, prendere decisioni e intraprendere azioni per raggiungere un obiettivo.

  • Caratteristiche principali

    • Autonomia: l'agente opera in modo indipendente senza richiedere l'interazione con altri agenti.
       
  • Punti di forza

    • Semplicità: più facile da progettare, sviluppare e distribuire rispetto ai sistemi multiagente. Richiede meno risorse perché non deve gestire più agenti o protocolli di comunicazione.
    • Prevedibilità: più facile da eseguire il debug e il monitoraggio perché l'agente opera in modo indipendente.
    • Velocità: non è necessario negoziare o raggiungere un consenso tra più agenti.
    • Costo: meno costoso da mantenere e aggiornare rispetto alle complesse architetture multi-agente. Meno problemi di integrazione se implementato in applicazioni aziendali.
       
  • Punti deboli

    • Scalabilità limitata: un singolo agente può diventare un collo di bottiglia nella gestione di attività complesse o ad alto volume.
    • Rigidità: difficoltà nell'affrontare compiti che richiedono workflow a multistep o coordinamento tra diversi ambiti.
    • Limitato: in genere progettato per una funzione o un dominio specifico.
       
  • Migliori casi d'uso

    • Chatbot semplici: i chatbot possono funzionare in modo indipendente, non richiedono il coordinamento con altri agenti e funzionano bene nelle interazioni utente autonome e strutturate.
    • Sistemi di raccomandazione: i consigli personalizzati sui contenuti, come quelli utilizzati nei servizi di streaming, sono abbastanza semplici per un'architettura a singolo agente.

Architetture multi-agente

Le architetture multi-agente vanno oltre le funzionalità dell'AI delle configurazioni tradizionali con un solo agente, offrendo diversi benefici unici. Ogni agente è specializzato in un dominio specifico, come l'analisi delle prestazioni, la prevenzione degli infortuni o le ricerche di mercato, e collabora in modo fluido per risolvere problemi complessi.

Gli agenti adattano i loro ruoli in base alle attività in evoluzione, contribuendo a garantire flessibilità e reattività in scenari dinamici.

I sistemi multi-agente sono più flessibili. Un agente potrebbe utilizzare l'elaborazione del linguaggio naturale (NLP), un altro potrebbe specializzarsi nella computer vision. Un agente potrebbe utilizzare la retrieval-augmented generation (RAG) per estrarre da set di dati esterni.

Esistono molti fornitori di framework multiagente come crewAI, un framework multiagente basato su Python che opera su LangChain. Un'altra soluzione AI è DeepWisdom, che offre MetaGPT, un workflow che utilizza un framework strutturato guidato da procedure operative standard.

Architetture AI verticali

  • Struttura

    • In un'architettura verticale, un agente leader supervisiona le sottoattività e le decisioni, con gli agenti che vi fanno riferimento per un controllo centralizzato.5 Gli agenti AI gerarchici conoscono il loro ruolo e fanno rapporto o supervisionano altri agenti di conseguenza.
       
  • Caratteristiche principali

    • Gerarchia: i ruoli sono chiaramente definiti.
    • Comunicazione centralizzata: gli agenti rispondono al leader.
       
  • Punti di forza

    • Efficienza delle attività: ideale per workflow sequenziali.
    • Chiara responsabilità: il leader allinea gli obiettivi.
  • Punti deboli

    • Colli di bottiglia: la dipendenza dai leader può rallentare i progressi.

    • Unico punto di errore: vulnerabile ai problemi dei leader.

  • Migliori casi d'uso

    • Automazione del workflow: approvazioni in più fasi.

    • Document generation: sezioni supervisionate da un leader.

Architetture AI orizzontali

  • Struttura

    • Modello di collaborazione tra pari: Gli agenti lavorano alla pari in un sistema decentralizzato, collaborando liberamente per risolvere i compiti.6

  • Funzioni principali

    • Collaborazione distribuita: tutti gli agenti condividono risorse e idee.

    • Decisioni decentralizzate: processo decisionale guidato dal gruppo per l'autonomia collaborativa.

  • Punti di forza

    • Risoluzione dinamica dei problemi: favorisce l'innovazione.

    • Elaborazione parallela: gli agenti lavorano contemporaneamente su più attività.

  • Punti deboli

    • Sfide di coordinamento: una gestione inadeguata può causare inefficienze.

    • Decisioni più lente: troppa riflessione.

  • Migliori casi d'uso

    • Brainstorming: generazione di idee diverse.

    • Risoluzione di problemi complessi: affrontare sfide interdisciplinari.

Architetture AI ibride

  • Struttura

    • Combina una leadership strutturata con la flessibilità collaborativa; la leadership cambia in base ai requisiti delle attività.

  • Funzioni principali

    • Leadership dinamica: la leadership si adatta alla fase del compito.

    • Leadership collaborativa: i leader interagiscono apertamente con i propri colleghi.

  • Punti di forza

    • Versatilità: unisce i punti di forza di entrambi i modelli.

    • Adattabilità: gestisce attività che richiedono sia struttura che creatività.

  • Punti deboli

    • Complessità: bilanciare i ruoli di leadership e la collaborazione richiede meccanismi solidi.

    • Gestione delle risorse: più impegnativa.

  • Migliori casi d'uso

    • Compiti versatili: pianificazione strategica o progetti di gruppo.

    • Processi dinamici: bilanciamento delle esigenze strutturate e creative.

Diagramma delle architetture a singolo agente e multi agente

Framework agentici

I framework agentici si riferiscono ad architetture o modelli di progettazione che definiscono il modo in cui gli agenti (artificiali o naturali) possono svolgere attività, prendere decisioni e interagire con il loro ambiente in modo autonomo e intelligente. Questi framework forniscono la struttura e le linee guida per il modo in cui gli agenti operano, ragionano e si adattano in vari contesti.

Architetture reattive

Le architetture reattive mappano le situazioni direttamente alle azioni. Sono riflessivi, prendono decisioni basate su stimoli immediati provenienti dall'ambiente piuttosto che attingere alla memoria o alle funzionalità. Non possono imparare dal passato o pianificare il futuro. 

Architetture deliberative

Un'architettura deliberativa è un sistema AI che prende decisioni basate sul ragionamento, sulla pianificazione e sui modelli interni del mondo. A differenza degli agenti reattivi, gli agenti deliberativi analizzano il loro ambiente, prevedono i risultati futuri e fanno scelte informate prima di agire.

Architetture cognitive

Un'architettura cognitiva agentica è un sistema AI avanzato che imita il pensiero, il ragionamento, l'apprendimento e il processo-decisionale simili a quelli umani.

Questi agenti incorporano elementi di percezione, memoria, ragionamento e adattamento, ciascuno rappresentato da moduli individuali, che consentono loro di operare in ambienti complessi e incerti migliorando nel tempo. Questo è il tipo più avanzato di architettura agentica.

Un architettura BDI (più comunemente denominata modello o framework) è progettata per modellare il processo-decisionale razionale negli agenti intelligenti e si basa sul framework belief-desire-intention (BDI).

Questa architettura modella il ragionamento simile a quello umano in un agente BDI, con:

  • Convinzioni (B): la conoscenza del mondo da parte dell'agente, che potrebbe includere la sua comprensione dell'ambiente, della situazione attuale e di qualsiasi dato sensoriale.

Esempio: "La porta è chiusa".

  • Desideri (D): gli obiettivi o le finalità dell'agente, che rappresentano ciò che desidera ottenere. I desideri non sono necessariamente azioni, ma obiettivi di alto livello.

Esempio: "Voglio entrare nella stanza".

  • Intenzioni (I): la linea d'azione che l'agente si impegna a seguire per realizzare i suoi desideri. Le intenzioni rappresentano azioni pianificate che l'agente sta perseguendo attivamente, considerando le sue convinzioni e i suoi desideri.

Esempio: "Aprirò la porta per entrare nella stanza".

Note a piè di pagina

1 Bandura A. "Social cognitive theory: an agentic perspective". Annu Rev Psychol. 2001;52:1-26. doi: 10.1146/annurev.psych.52.1.1. https://pubmed.ncbi.nlm.nih.gov/11148297/.

2 Bandura A. "Social cognitive theory: an agentic perspective".

3 T. Masterman, S. Besen, M. Sawtell, e A. Chao, "The Landscape of Emerging AI Agent Architectures for Reasoning, Planning, and Tool Calling: A Survey," arXiv prestampa arXiv:2404.11584, aprile 2024. [Online]. Disponibile: https://arxiv.org/abs/2404.11584.

4 E. H. Durfee e V. Lesser, "Negotiating Task Decomposition and Allocation Using Partial Global Planning", in Distributed Artificial Intelligence Volume II, ed. L. Gasser e M. Huhns (Londra: Pitman Publishing; San Mateo, CA: Morgan Kaufmann, 1989), 229—244.

5 Masterman, et al, "The Landscape of Emerging AI Agent Architectures for Reasoning, Planning, and Tool Calling: A Survey".

6 Masterman, et al., "The Landscape of Emerging AI Agent Architectures for Reasoning, Planning, and Tool Calling: A Survey".

Soluzioni correlate
Sviluppo di agenti AI IBM 

Consenti agli sviluppatori di creare, distribuire e monitorare agenti AI con lo studio IBM watsonx.ai.

Esplora watsonx.ai
Agenti e assistenti AI di IBM

Migliora la produttività con uno dei set di funzionalità più completi del settore che aiuta le aziende a creare, personalizzare e gestire agenti e assistenti AI. 

Scopri gli agenti AI
IBM Granite

Ottieni un risparmio sui costi di oltre il 90% con i modelli più piccoli e aperti di Granite, progettati per l'efficienza degli sviluppatori. Questi modelli pensati per le imprese offrono prestazioni eccellenti rispetto ai benchmark di sicurezza e in un'ampia gamma di attività aziendali, dalla cybersecurity alla RAG.

Esplora Granite
Prossimi passi

Automatizza i tuoi workflow complessi e migliora la produttività con uno dei set di funzionalità più completi del settore che aiuta le aziende a creare, personalizzare e gestire agenti e assistenti AI. 

Esplora lo sviluppo di agenti watsonx.ai Scopri watsonx Orchestrate