Dai microservizi agli agenti AI: l'evoluzione dell'architettura delle applicazioni

Un paio di colleghi che condividono idee in un ufficio moderno

L'architettura delle applicazioni ha nuovamente raggiunto un punto di svolta. Gli agenti AI stanno emergendo quali potenti elementi costitutivi dei sistemi moderni integrando, estendendo o addirittura sostituendo i microservizi tradizionali.

Questo cambiamento architettonico mantiene il modello fondamentale dei componenti, offrendo al contempo significativi progressi a livello di velocità di sviluppo, adattabilità e funzionalità di integrazione. Le organizzazioni che costruiscono nuove applicazioni con i framework basati su agenti sono ben posizionate per ottenere un vantaggio competitivo nel panorama tecnologico in rapida evoluzione.

Design 3D di palline che rotolano su una pista

Le ultime notizie e insight sull'AI 

Scopri notizie e insight selezionati da esperti in materia di AI, cloud e molto altro nella newsletter settimanale Think.

Il viaggio dell'evoluzione architettonica

La storia dell'architettura delle applicazioni rivela un modello coerente di decomposizione in componenti sempre più intelligenti.

Anni '90: applicazioni monolitiche
I sistemi a codice singolo hanno dominato l'informatica aziendale, creando sfide operative significative:

Le implementazioni hanno richiesto ampi cicli di test
La scalabilità richiedeva la duplicazione completa del sistema
I cambiamenti in un'area rischiavano di interrompere funzioni non correlate
I cicli di sviluppo si estendevano per mesi o anni

Primi anni 2000: architettura orientata ai servizi (SOA)
La SOA ha risolto le limitazioni monolitiche scomponendo le applicazioni in servizi allineati al business:

La nuova architettura migliorava la riutilizzabilità e le funzionalità di integrazione
I servizi sono rimasti relativamente pesanti
La complessità dell'orchestrazione creava sistemi fragili
I cicli di sviluppo venivano misurati in mesi

Anni 2010: microservizi
L'architettura dei microservizi suddivideva le applicazioni in unità più piccole e indipendentemente distribuibili:

Ogni microservizio operava in modo autonomo
I servizi venivano comunicati tramite application programming interface ben definite (API)
I componenti venivano scalati indipendentemente
Le tecnologie di containerizzazione semplificavano la distribuzione
I cicli di sviluppo venivano compressi in settimane

Mixture of Experts | 28 agosto, episodio 70

Decoding AI: Weekly News Roundup

Unisciti al nostro gruppo di livello mondiale di ingegneri, ricercatori, leader di prodotto e molti altri mentre si fanno strada nell'enorme quantità di informazioni sull'AI per darti le ultime notizie e gli ultimi insight sull'argomento.

Guarda gli ultimi episodi del podcast

Agenti AI: il nuovo paradigma architettonico

La frontiera architettonica di oggi presenta caratteristiche che includono agenti AI: componenti intelligenti e autonomi che migliorano le funzionalità dei microservizi. Le principali differenze includono:

Caratteristica	Microservizio	Agente AI
Modello di programmazione	Impone regole esplicite e logica	Offre un modello ibrido: core compilato con livello di ragionamento
Adattabilità	Richiede modifiche al codice	Combina ottimizzazione con ragionamento dinamico
Integrazione	Utilizza contratti API	Utilizza la doppia modalità: contratti API con comprensione semantica
Gestione degli errori	Ha risposte preprogrammate	Ha percorsi ottimizzati con fallback adattivi
Impegno per lo sviluppo	Richiede un elevato livello di impegno (codice monouso)	È più strategico (percorsi critici più interfacce di ragionamento)

Un microservizio tradizionale di elaborazione dei pagamenti richiede migliaia di righe di codice per gestire la convalida, l'elaborazione, gli stati di errore e le integrazioni. Al contrario, gli agenti AI ad alte prestazioni combinano componenti precompilati per percorsi critici con funzionalità di ragionamento per decisioni complesse. Questo approccio ibrido aiuta a garantire sia l'affidabilità delle prestazioni sia l'intelligenza adattiva.

Ad esempio, l'implementazione di agenti Semantic Kernel in C# con compilazione ahead-of-time (AOT) dimostra che i sistemi agentici di produzione possono eguagliare o superare i microservizi tradizionali in termini di prestazioni, aggiungendo al contempo preziose funzionalità di ragionamento.

Framework agentici: orchestrazione moderna

Proprio come i microservizi necessitano di piattaforme di orchestrazione sottostanti, gli agenti AI necessitano di framework specializzati. Soluzioni moderne come Semantic Kernel e LangChain Enterprise forniscono questa infrastruttura, necessaria per il coordinamento degli agenti con prestazioni di livello aziendale.

Questi framework offrono funzionalità che vanno oltre la tradizionale orchestrazione dei servizi, pur mantenendo gli standard di prestazioni di livello aziendale previsti:

Basi ad alte prestazioni: i framework agentici sono costruiti su linguaggi compilati con compilazione AOT per un'esecuzione prevedibile e a bassa latenza.
Progettazione efficiente della memoria: i framework agentici sono ottimizzati per sistemi ad alta produttività per garantire un consumo minimo di risorse.
Elaborazione semantica: gli agenti assegnano le risorse computazionali in base alla complessità del compito.
Integrazione enterprise: i framework agentici forniscono connettori di tipo sicuro ai sistemi esistenti con una solida applicazione dei contratti.
Pianificazione ibrida: i percorsi critici per le prestazioni del framework utilizzano la logica compilata mentre gli scenari complessi impiegano l'AI per il ragionamento.

Benefici aziendali pratici

Il passaggio all'architettura basata su agenti offre vantaggi misurabili, come:

Prestazioni con intelligenza: gli agenti AI ben progettati offrono prestazioni superiori. Gli agenti compilati possono raggiungere un throughput più elevato rispetto ai microservizi tradizionali e aggiungere il ragionamento per il rilevamento delle frodi.
Affidabilità di livello aziendale: i framework consentono un'integrazione robusta. Un sistema di supply chain può elaborare migliaia di transazioni e gestire in modo fluido le incongruenze dei dati.
Gestione superiore degli errori: gli agenti AI combinano percorsi di recupero con ragionamento. Il sistema di elaborazione degli ordini mantiene un'alta disponibilità grazie a percorsi ottimizzati di gestione degli errori e ragionamento per guasti inediti.
Architettura pronta per il futuro: le organizzazioni traggono beneficio oggi e si preparano per il domani. Gli agenti compilati con livelli di ragionamento ottimizzano le prestazioni attuali e spianano la strada ai futuri progressi dell'AI.

Strategia di implementazione: un approccio orientato alle prestazioni

Le organizzazioni necessitano di una strategia di implementazione pratica che mantenga gli standard aziendali, utilizzando al contempo i benefici dell'AI:

Profilazione delle prestazioni: identifica microservizi con percorsi critici per le prestazioni e punti decisionali complessi che trarrebbero beneficio dalle funzionalità di ragionamento.
Progettazione dell'architettura: crea progetti di agenti che separino i percorsi critici per le prestazioni (implementati nel codice compilato) dai componenti di ragionamento che gestiscono i casi edge.
Selezione del framework: valuta i framework agentici in base ai benchmark delle prestazioni, alla compatibilità del linguaggio con i sistemi esistenti e alle opzioni di compilazione.
Miglioramento del team: crea team di ingegneria che combinano le competenze tradizionali nello sviluppo software con le competenze ingegneristiche in ambito AI.
Implementazione sistematica: implementa e testa rigorosi benchmark delle prestazioni insieme alle capacità di ragionamento.

L'implementazione di un approccio orientato alle prestazioni può aiutare le organizzazioni a ottenere benefici operativi, costruendo al contempo capacità strategiche dell'AI.

Sviluppo delle valutazioni e guidato dalle valutazioni

L'ingegneria della qualità degli agenti AI richiede un approccio fondamentalmente diverso rispetto ai tradizionali test del software. Le aziende leader nell'architettura agentica hanno introdotto uno sviluppo guidato dalle valutazioni, una metodologia che garantisce che gli agenti soddisfino sia i requisiti funzionali sia gli standard di ragionamento.

Il framework di valutazione

Le valutazioni sono suite di test specializzate progettate per valutare il comportamento degli agenti in più dimensioni:

Valutazioni funzionali: verifica le funzionalità principali per il business tramite asserzioni di input/output.
Valutazioni del ragionamento: valuta la qualità delle decisioni e degli approcci alla risoluzione dei problemi.
Valutazioni comportamentali: verifica l'allineamento con le linee guida organizzative e gli standard etici.
Valutazioni delle prestazioni: misura i tempi di risposta, la produttività e l'utilizzo delle risorse.
Valutazioni avversarie: sfida gli agenti con casi edge e potenziali modalità di fallimento.

I dati interni di alcuni fornitori di cloud, dati e AI mostrano una riduzione significativa degli incidenti di produzione dopo l'implementazione di valutazioni multidimensionali per i loro sistemi di agenti.

Implementazione dello sviluppo guidato dalle valutazioni

Un processo di sviluppo maturo basato sulla valutazione include questi elementi chiave:

1. Protocollo di definizione di valutazione

Iniziamo definendo le aspettative in tutte le dimensioni. Per ogni agente:

Documenta le caratteristiche principali previste con chiari criteri di successo
Specifica i modelli di ragionamento che gli agenti dovrebbero dimostrare
Stabilisci limiti comportamentali e guardrail
Stabilisci soglie di prestazioni in base ai requisiti aziendali

2. Pipeline di valutazione continue

Crea pipeline automatizzate che eseguano valutazioni durante tutto il ciclo di vita dello sviluppo:

Le valutazioni preliminari identificano i problemi prima dell'integrazione del codice
Le valutazioni di integrazione verificano le interazioni degli agenti
Le valutazioni di staging effettuano test con dati di produzione
Il monitoraggio della produzione convalida continuamente gli agenti implementati

3. Generazione dinamica di test

Passa oltre i casi di test statici con scenari generati dinamicamente:

Usa modelli linguistici di grandi dimensioni (LLM) per creare diversi casi di test che mettono alla prova il ragionamento degli agenti
Genera variazioni di casi edge noti
Simula nuovi input basati su modelli di produzione

4. Valutazione collaborativa uomo-AI

Combina test automatizzati con competenze umane:

I revisori esperti valutano il ragionamento degli agenti su scenari complessi
I ricercatori UX valutano la qualità dell'interazione umano-agente
Gli specialisti del dominio verificano la correttezza della logica aziendale

5. Prevenzione della regressione

Previeni la regressione delle funzionalità con:

Suite di valutazione complete che crescono con ogni problema scoperto
Confronti A/B tra le versioni degli agenti
Monitoraggio continuo degli indicatori chiave di prestazione

Uno studio del 2024 dello Stanford Institute for Human-Centered AI (HAI) ha riscontrato che le aziende che utilizzano framework completi notano cicli di sviluppo più rapidi del 65% e il 42% in meno di rollback di produzione.

Case study: implementazione dei servizi finanziari

Una delle migliori 10 banche globali ha implementato uno sviluppo basato sulla valutazione per i propri agenti del servizio clienti con risultati impressionanti.

Il loro approccio si basava su un framework a tre livelli: suite di test automatizzate per la validazione funzionale, valutazioni di ragionamento per scenari decisionali complessi e verifiche di esperti per interazioni ad alto rischio.

Il framework ha scoperto problemi poco visibili che i test tradizionali avrebbero trascurato. Ad esempio, un agente ha approvato correttamente le applicazioni secondo la policy, ma ha utilizzato un ragionamento che inavvertitamente ha rafforzato i pregiudizi nei casi limite, un problema identificato dalle valutazioni del ragionamento prima dell'implementazione.

Strategie di ottimizzazione dei costi per l'architettura agentica

La fattibilità economica delle architetture agentiche dipende da efficaci strategie di gestione dei costi. Sebbene gli agenti AI offrano un valore significativo al business, la gestione delle spese operative rimane un fattore critico per il successo.

La sfida economica

Per quanto riguarda i costi, le organizzazioni devono affrontare due considerazioni principali:

Costi dei token: ogni interazione con i foundation model comporta costi per token che si accumulano rapidamente su larga scala. Reti di agenti complesse con ragionamento multistep possono generare da 10 a 15 volte più token rispetto a chiamate API dirette simili.

Costi di calcolo: l'esecuzione dell'inferenza, soprattutto per i ragionamenti sofisticati, richiede notevoli risorse computazionali. I cluster GPU on-premise per l'inferenza richiedono tipicamente un investimento iniziale importante. L'inferenza basata su cloud può comportare costi mensili che vanno da 10.000 USD a 50.000 USD per distribuzioni su piccola o media scala.

Approcci di ottimizzazione efficaci

Le organizzazioni leader hanno sviluppato approcci sistematici per gestire questi costi.

1. Ottimizzazione architettonica

Design degli agenti ibridi che indirizza le decisioni complesse ai foundation model
Quantizzazione dei modelli per l'implementazione in produzione
Caching strategico delle risposte per le query più comuni

JPMorgan Chase ha ridotto i costi di inferenza del 67% tramite un'architettura ibrida che elabora l'89% delle transazioni tramite percorsi deterministici, riservando le risorse degli LLM per scenari complessi.

2. Messa a punto del prompt engineering per l'efficienza

Precisione nella progettazione delle istruzioni per ridurre al minimo l'utilizzo dei token
Pruning contestuale che elimina le informazioni non necessarie
Ottimizzazione del formato di risposta per ridurre la generazione di token

3. Ottimizzazione dell'inferenza

Implementazione della cache Key-Value (KV) per interazioni ripetute
Elaborazione batch per operazioni non sensibili al tempo
Adattamento dell'infrastruttura di implementazione ai pattern di workload

4. Implementazione della RAG

Retrieval-augmented generation strategica per ridurre le dimensioni del contesto
Ottimizzazione del database vettoriale per un accesso efficiente alle informazioni
Tecniche di distillazione del contesto che comprimono le informazioni pertinenti

5. Ottimizzazione per la specializzazione del dominio

Creazione di modelli specifici di dominio con conteggio ridotto dei parametri
Distillazione di modelli generali in varianti specializzate efficienti
Approcci di ottimizzazione dei parametri efficienti come LoRA e QLoRA

Il rapporto 2024 sull'economia dell'AI di McKinsey afferma che l'implementazione di tre o più di queste strategie riduce in media i costi operativi dell'AI del 62%, mantenendo o migliorando le funzionalità del sistema.

Sfide dell'implementazione

Le architetture agentiche introducono nuove considerazioni di implementazione.

Complessità dell'orchestrazione
Il coordinamento degli agenti autonomi richiede approcci diversi rispetto all'orchestrazione tradizionale dei microservizi:

Il processo decisionale decentralizzato richiede un coordinamento sofisticato
Più agenti devono lavorare per raggiungere obiettivi comuni
Lo stato del sistema diventa più complesso con cambiamenti asincroni

I framework moderni affrontano queste sfide attraverso sistemi di prioritizzazione e un contesto condiviso. Il Semantic Kernel di Microsoft implementa un'orchestrazione che bilancia l'autonomia degli agenti con la coerenza del sistema.

Osservabilità e monitoraggio
Gli approcci di monitoraggio tradizionali devono evolversi:

I sistemi devono acquisire percorsi di ragionamento e criteri decisionali
L'analisi del comportamento aiuta a identificare i modelli nelle interazioni con gli agenti
Il monitoraggio predittivo anticipa i potenziali stati del sistema

Sicurezza e governance
Le architetture basate su agenti introducono nuove dimensioni di sicurezza:

Meccanismi per verificare che le istruzioni degli agenti siano in linea con le policy dell'organizzazione
Sistemi per convalidare le azioni dell'agente prima dell'esecuzione
Funzionalità per esaminare la conformità dei ragionamenti degli agenti

Confronto tra microservizi e sistemi agentici: un caso d'uso pratico

Per illustrare la differenza tra microservizi e architetture agentiche, consideriamo una piattaforma di trading di servizi finanziari.

Implementazione tradizionale dei microservizi:

Un servizio clienti gestisce le informazioni e i saldi dei clienti
Un servizio di trading esegue ordini in base a richieste esplicite
Un servizio di dati di mercato fornisce i prezzi quando richiesto
Un servizio di notifica invia avvisi dopo eventi predefiniti
Un servizio di gestione del rischio applica controlli basati su regole

Quando un cliente effettua un'operazione, il sistema segue un percorso predeterminato e ogni passaggio viene attivato esplicitamente.

Implementazione agentica:

Un agente di portfolio monitora continuamente le partecipazioni e suggerisce opportunità di riequilibrio
Un agente di esecuzione di trading seleziona le tempistiche ottimali in base alle condizioni di mercato
Un agente di valutazione del rischio valuta proattivamente la volatilità del mercato
Un agente di comunicazione fornisce informazioni rilevanti attraverso i canali preferiti

In pratica, l'implementazione agentica crea esperienze cliente fondamentalmente diverse. Quando la volatilità del mercato aumenta, l'agente di valutazione del rischio potrebbe regolare autonomamente i limiti di trading e notificare l'agente di portfolio, che analizza le partecipazioni dei clienti alla ricerca di potenziali vulnerabilità. Il sistema dimostra un'intelligenza che va oltre ciò che è stato esplicitamente codificato.

Guardando al futuro: ingegneria della piattaforma per la scalabilità agentica

La progressione dai monoliti ai servizi, ai microservizi agli agenti segue chiari schemi storici. Ogni evoluzione ha portato con sé componenti più granulari, con intelligenza e autonomia crescenti.

Le organizzazioni che implementano architetture agentiche su larga scala devono adottare i principi di ingegneria della piattaforma per ottenere qualità coerente, efficienza dei costi e governance in tutto il portafoglio di applicazioni.

Adozione guidata dalla piattaforma

Le organizzazioni lungimiranti utilizzano piattaforme interne per sviluppatori (IDP) per accelerare l'adozione degli agenti.

Infrastruttura standardizzata degli agenti

Template degli agenti preconfigurati con monitoraggio integrato
Modelli di implementazione all'avanguardia per i tipi di agenti più comuni
Distribuzione self-service con gate di qualità automatizzati

Observability unificata

Monitoraggio centralizzato delle prestazioni e del comportamento degli agenti
Tracciamento e visualizzazione delle interazioni tra agenti
Rilevamento automatico delle anomalie con analisi della causa principale

Focus sull'esperienza dello sviluppatore

Strumenti self-service per lo sviluppo e il test degli agenti
Ambienti di sviluppo integrati con debugging di agenti specializzati
Controlli di conformità automatizzati durante lo sviluppo

Governance su larga scala

Gestione e applicazione centralizzata delle policy
Valutazione automatizzata del comportamento degli agenti rispetto agli standard
Percorsi di controllo completi per tutte le azioni degli agenti

Il rapporto 2024 di Gartner sull'ingegneria della piattaforma afferma che gli approcci maturi delle piattaforme portano a un tempo di lancio sul mercato 3,2 volte più rapido per le funzionalità dei nuovi agenti e a una soddisfazione degli sviluppatori superiore del 76%.

Le organizzazioni si trovano di fronte a una scelta: guidare nell'adozione dell'architettura agentica per i casi d'uso appropriati, oppure seguire concorrenti che catturano i primi vantaggi. I dati suggeriscono che i pionieri che implementano approcci basati sulla piattaforma ottengono notevoli vantaggi competitivi in termini di velocità di sviluppo, flessibilità del sistema e funzionalità.

Scopri di più e parla con un esperto di AI di IBM® Consulting

Risorse

Raggiungere il ROI: agenti AI nella tua azienda

Unisciti a IBM per un webinar in cui dimostriamo come trovare un ROI reale attraverso iniziative di agentic AI, con esempi in tutti i settori, casi d'uso e le storie di successo della stessa IBM.

IBM è stata nominata leader nella scienza dei dati e nell'apprendimento automatico

Scopri perché IBM è stata riconosciuta come leader nel Gartner Magic Quadrant 2025 per le piattaforme di data science e machine learning.

Dai progetti di AI ai profitti: come l'agentic AI può sostenere un ritorno finanziario

Scopri come le organizzazioni stanno passando dal lancio di progetti pilota eterogenei di AI all'utilizzo dell'AI come motore di trasformazione centrale.

Migliora le tue competenza nell'AI

Accedi al nostro catalogo completo di oltre 100 corsi online acquistando oggi stesso un abbonamento individuale o multiutente che ti consentirà di ampliare le tue competenze su una gamma di prodotti a un prezzo contenuto.

Scopri IBM Granite

IBM Granite è una famiglia di modelli AI aperti, efficienti e affidabili, su misura per le aziende e ottimizzati per scalare le tue applicazioni AI. Esplora le opzioni relative a lingua, codice, serie temporali e guardrail.

AI Academy IBM

Condotto dai migliori leader di pensiero di IBM, il programma di studi è stato progettato per aiutare i dirigenti aziendali ad acquisire le conoscenze necessarie per dare priorità agli investimenti in AI che possono favorire la crescita.

AI in Action 2024

Abbiamo intervistato 2.000 organizzazioni in merito alle loro iniziative di AI per scoprire cosa funziona, cosa non funziona e come giocare d'anticipo.

La guida per i CEO 2025: 5 cambi di mentalità per potenziare la crescita aziendale

Introduci questi cinque cambiamenti di mentalità per eliminare le incertezze, favorire la reinvenzione del business e potenziare la crescita con l'agentic AI.

Sblocca la potenza dell'AI generativa e dell'ML

Scopri come incorporare in tutta sicurezza l'AI generativa e il machine learning nella tua azienda.

Come prosperare in questa nuova era dell'AI in tutta fiducia e sicurezza

Approfondisci i tre elementi critici di una solida strategia di AI: creare un vantaggio competitivo, scalare l'AI in tutta l'azienda e promuovere un'AI affidabile.

Soluzioni correlate

IBM® watsonx.ai

Addestra, convalida, adatta e implementa le funzionalità di AI generativa, foundation model e machine learning con IBM watsonx.ai, uno studio aziendale di nuova generazione per builder AI. Crea applicazioni AI in tempi ridotti e una minima quantità di dati.

Esplora watsonx.ai

Soluzioni di intelligenza artificiale

Metti l'AI al servizio della tua azienda con l'esperienza leader di settore e il portfolio di soluzioni di IBM nel campo dell'AI.

Esplora le soluzioni AI

Consulenza e servizi per l'intelligenza artificiale (AI)

I servizi di AI di IBM Consulting aiutano a reinventare il modo in cui le aziende lavorano con l'AI per la trasformazione.

Esplora i servizi AI

Fasi successive

Ottieni l'accesso completo a funzionalità che coprono l'intero ciclo di vita dello sviluppo dell'AI. Crea soluzioni AI all'avanguardia con interfacce intuitive, workflow e accesso alle API e agli SDK standard di settore.

Esplora watsonx.ai

Prenota una demo live