Dai microservizi agli agenti AI: l'evoluzione dell'architettura delle applicazioni

Un paio di colleghi che condividono idee in un ufficio moderno

L'architettura delle applicazioni ha nuovamente raggiunto un punto di svolta. Gli agenti AI stanno emergendo quali potenti elementi costitutivi dei sistemi moderni integrando, estendendo o addirittura sostituendo i microservizi tradizionali.

Questo cambiamento architettonico mantiene il modello fondamentale dei componenti, offrendo al contempo significativi progressi a livello di velocità di sviluppo, adattabilità e funzionalità di integrazione. Le organizzazioni che costruiscono nuove applicazioni con i framework basati su agenti sono ben posizionate per ottenere un vantaggio competitivo nel panorama tecnologico in rapida evoluzione.

Design 3D di palline che rotolano su una pista

Le ultime notizie e insight sull'AI


Scopri notizie e insight selezionati da esperti in materia di AI, cloud e molto altro nella newsletter settimanale Think. 

Il viaggio dell'evoluzione architettonica

La storia dell'architettura delle applicazioni rivela un modello coerente di decomposizione in componenti sempre più intelligenti.

Anni '90: applicazioni monolitiche
I sistemi a codice singolo hanno dominato l'informatica aziendale, creando sfide operative significative:

  • Le implementazioni hanno richiesto ampi cicli di test
  • La scalabilità richiedeva la duplicazione completa del sistema
  • I cambiamenti in un'area rischiavano di interrompere funzioni non correlate
  • I cicli di sviluppo si estendevano per mesi o anni

Primi anni 2000: architettura orientata ai servizi (SOA)
La SOA ha risolto le limitazioni monolitiche scomponendo le applicazioni in servizi allineati al business:

  • La nuova architettura migliorava la riutilizzabilità e le funzionalità di integrazione
  • I servizi sono rimasti relativamente pesanti
  • La complessità dell'orchestrazione creava sistemi fragili
  • I cicli di sviluppo venivano misurati in mesi

Anni 2010: microservizi
L'architettura dei microservizi suddivideva le applicazioni in unità più piccole e indipendentemente distribuibili:

  • Ogni microservizio operava in modo autonomo
  • I servizi venivano comunicati tramite application programming interface ben definite (API)
  • I componenti venivano scalati indipendentemente
  • Le tecnologie di containerizzazione semplificavano la distribuzione
  • I cicli di sviluppo venivano compressi in settimane
Mixture of Experts | 28 agosto, episodio 70

Decoding AI: Weekly News Roundup

Unisciti al nostro gruppo di livello mondiale di ingegneri, ricercatori, leader di prodotto e molti altri mentre si fanno strada nell'enorme quantità di informazioni sull'AI per darti le ultime notizie e gli ultimi insight sull'argomento.

Agenti AI: il nuovo paradigma architettonico

La frontiera architettonica di oggi presenta caratteristiche che includono agenti AI: componenti intelligenti e autonomi che migliorano le funzionalità dei microservizi. Le principali differenze includono:

Caratteristica
 

Microservizio
 

Agente AI
 

Modello di programmazione

Impone regole esplicite e logica

Offre un modello ibrido: core compilato con livello di ragionamento

Adattabilità

Richiede modifiche al codice

Combina ottimizzazione con ragionamento dinamico

Integrazione

Utilizza contratti API

Utilizza la doppia modalità: contratti API con comprensione semantica

Gestione degli errori

Ha risposte preprogrammate

Ha percorsi ottimizzati con fallback adattivi

Impegno per lo sviluppo

Richiede un elevato livello di impegno (codice monouso)

È più strategico (percorsi critici più interfacce di ragionamento)

 

Un microservizio tradizionale di elaborazione dei pagamenti richiede migliaia di righe di codice per gestire la convalida, l'elaborazione, gli stati di errore e le integrazioni. Al contrario, gli agenti AI ad alte prestazioni combinano componenti precompilati per percorsi critici con funzionalità di ragionamento per decisioni complesse. Questo approccio ibrido aiuta a garantire sia l'affidabilità delle prestazioni sia l'intelligenza adattiva.

Ad esempio, l'implementazione di agenti Semantic Kernel in C# con compilazione ahead-of-time (AOT) dimostra che i sistemi agentici di produzione possono eguagliare o superare i microservizi tradizionali in termini di prestazioni, aggiungendo al contempo preziose funzionalità di ragionamento.

Framework agentici: orchestrazione moderna

Proprio come i microservizi necessitano di piattaforme di orchestrazione sottostanti, gli agenti AI necessitano di framework specializzati. Soluzioni moderne come Semantic Kernel e LangChain Enterprise forniscono questa infrastruttura, necessaria per il coordinamento degli agenti con prestazioni di livello aziendale.

Questi framework offrono funzionalità che vanno oltre la tradizionale orchestrazione dei servizi, pur mantenendo gli standard di prestazioni di livello aziendale previsti:

  • Basi ad alte prestazioni: i framework agentici sono costruiti su linguaggi compilati con compilazione AOT per un'esecuzione prevedibile e a bassa latenza.
  • Progettazione efficiente della memoria: i framework agentici sono ottimizzati per sistemi ad alta produttività per garantire un consumo minimo di risorse.
  • Elaborazione semantica: gli agenti assegnano le risorse computazionali in base alla complessità del compito.
  • Integrazione enterprise: i framework agentici forniscono connettori di tipo sicuro ai sistemi esistenti con una solida applicazione dei contratti.
  • Pianificazione ibrida: i percorsi critici per le prestazioni del framework utilizzano la logica compilata mentre gli scenari complessi impiegano l'AI per il ragionamento.

Benefici aziendali pratici

Il passaggio all'architettura basata su agenti offre vantaggi misurabili, come:

  • Prestazioni con intelligenza: gli agenti AI ben progettati offrono prestazioni superiori. Gli agenti compilati possono raggiungere un throughput più elevato rispetto ai microservizi tradizionali e aggiungere il ragionamento per il rilevamento delle frodi.
  • Affidabilità di livello aziendale: i framework consentono un'integrazione robusta. Un sistema di supply chain può elaborare migliaia di transazioni e gestire in modo fluido le incongruenze dei dati.
  • Gestione superiore degli errori: gli agenti AI combinano percorsi di recupero con ragionamento. Il sistema di elaborazione degli ordini mantiene un'alta disponibilità grazie a percorsi ottimizzati di gestione degli errori e ragionamento per guasti inediti.
  • Architettura pronta per il futuro: le organizzazioni traggono beneficio oggi e si preparano per il domani. Gli agenti compilati con livelli di ragionamento ottimizzano le prestazioni attuali e spianano la strada ai futuri progressi dell'AI.

Strategia di implementazione: un approccio orientato alle prestazioni

Le organizzazioni necessitano di una strategia di implementazione pratica che mantenga gli standard aziendali, utilizzando al contempo i benefici dell'AI:

  • Profilazione delle prestazioni: identifica microservizi con percorsi critici per le prestazioni e punti decisionali complessi che trarrebbero beneficio dalle funzionalità di ragionamento.
  • Progettazione dell'architettura: crea progetti di agenti che separino i percorsi critici per le prestazioni (implementati nel codice compilato) dai componenti di ragionamento che gestiscono i casi edge.
  • Selezione del framework: valuta i framework agentici in base ai benchmark delle prestazioni, alla compatibilità del linguaggio con i sistemi esistenti e alle opzioni di compilazione.
  • Miglioramento del team: crea team di ingegneria che combinano le competenze tradizionali nello sviluppo software con le competenze ingegneristiche in ambito AI.
  • Implementazione sistematica: implementa e testa rigorosi benchmark delle prestazioni insieme alle capacità di ragionamento.

L'implementazione di un approccio orientato alle prestazioni può aiutare le organizzazioni a ottenere benefici operativi, costruendo al contempo capacità strategiche dell'AI.

Sviluppo delle valutazioni e guidato dalle valutazioni

L'ingegneria della qualità degli agenti AI richiede un approccio fondamentalmente diverso rispetto ai tradizionali test del software. Le aziende leader nell'architettura agentica hanno introdotto uno sviluppo guidato dalle valutazioni, una metodologia che garantisce che gli agenti soddisfino sia i requisiti funzionali sia gli standard di ragionamento.

Il framework di valutazione

Le valutazioni sono suite di test specializzate progettate per valutare il comportamento degli agenti in più dimensioni:

  • Valutazioni funzionali: verifica le funzionalità principali per il business tramite asserzioni di input/output.
  • Valutazioni del ragionamento: valuta la qualità delle decisioni e degli approcci alla risoluzione dei problemi.
  • Valutazioni comportamentali: verifica l'allineamento con le linee guida organizzative e gli standard etici.
  • Valutazioni delle prestazioni: misura i tempi di risposta, la produttività e l'utilizzo delle risorse.
  • Valutazioni avversarie: sfida gli agenti con casi edge e potenziali modalità di fallimento.

I dati interni di alcuni fornitori di cloud, dati e AI mostrano una riduzione significativa degli incidenti di produzione dopo l'implementazione di valutazioni multidimensionali per i loro sistemi di agenti.

Implementazione dello sviluppo guidato dalle valutazioni

Un processo di sviluppo maturo basato sulla valutazione include questi elementi chiave:

1. Protocollo di definizione di valutazione

Iniziamo definendo le aspettative in tutte le dimensioni. Per ogni agente:

  • Documenta le caratteristiche principali previste con chiari criteri di successo
  • Specifica i modelli di ragionamento che gli agenti dovrebbero dimostrare
  • Stabilisci limiti comportamentali e guardrail
  • Stabilisci soglie di prestazioni in base ai requisiti aziendali

2. Pipeline di valutazione continue

Crea pipeline automatizzate che eseguano valutazioni durante tutto il ciclo di vita dello sviluppo:

  • Le valutazioni preliminari identificano i problemi prima dell'integrazione del codice
  • Le valutazioni di integrazione verificano le interazioni degli agenti
  • Le valutazioni di staging effettuano test con dati di produzione
  • Il monitoraggio della produzione convalida continuamente gli agenti implementati

3. Generazione dinamica di test

Passa oltre i casi di test statici con scenari generati dinamicamente:

  • Usa modelli linguistici di grandi dimensioni (LLM) per creare diversi casi di test che mettono alla prova il ragionamento degli agenti
  • Genera variazioni di casi edge noti
  • Simula nuovi input basati su modelli di produzione

4. Valutazione collaborativa uomo-AI

Combina test automatizzati con competenze umane:

  • I revisori esperti valutano il ragionamento degli agenti su scenari complessi
  • I ricercatori UX valutano la qualità dell'interazione umano-agente
  • Gli specialisti del dominio verificano la correttezza della logica aziendale

5. Prevenzione della regressione

Previeni la regressione delle funzionalità con:

  • Suite di valutazione complete che crescono con ogni problema scoperto
  • Confronti A/B tra le versioni degli agenti
  • Monitoraggio continuo degli indicatori chiave di prestazione

Uno studio del 2024 dello Stanford Institute for Human-Centered AI (HAI) ha riscontrato che le aziende che utilizzano framework completi notano cicli di sviluppo più rapidi del 65% e il 42% in meno di rollback di produzione.

Case study: implementazione dei servizi finanziari

Una delle migliori 10 banche globali ha implementato uno sviluppo basato sulla valutazione per i propri agenti del servizio clienti con risultati impressionanti.

Il loro approccio si basava su un framework a tre livelli: suite di test automatizzate per la validazione funzionale, valutazioni di ragionamento per scenari decisionali complessi e verifiche di esperti per interazioni ad alto rischio.

Il framework ha scoperto problemi poco visibili che i test tradizionali avrebbero trascurato. Ad esempio, un agente ha approvato correttamente le applicazioni secondo la policy, ma ha utilizzato un ragionamento che inavvertitamente ha rafforzato i pregiudizi nei casi limite, un problema identificato dalle valutazioni del ragionamento prima dell'implementazione.

Strategie di ottimizzazione dei costi per l'architettura agentica

La fattibilità economica delle architetture agentiche dipende da efficaci strategie di gestione dei costi. Sebbene gli agenti AI offrano un valore significativo al business, la gestione delle spese operative rimane un fattore critico per il successo.

La sfida economica

Per quanto riguarda i costi, le organizzazioni devono affrontare due considerazioni principali:

Costi dei token: ogni interazione con i foundation model comporta costi per token che si accumulano rapidamente su larga scala. Reti di agenti complesse con ragionamento multistep possono generare da 10 a 15 volte più token rispetto a chiamate API dirette simili.

Costi di calcolo: l'esecuzione dell'inferenza, soprattutto per i ragionamenti sofisticati, richiede notevoli risorse computazionali. I cluster GPU on-premise per l'inferenza richiedono tipicamente un investimento iniziale importante. L'inferenza basata su cloud può comportare costi mensili che vanno da 10.000 USD a 50.000 USD per distribuzioni su piccola o media scala.

Approcci di ottimizzazione efficaci

Le organizzazioni leader hanno sviluppato approcci sistematici per gestire questi costi.

1. Ottimizzazione architettonica

  • Design degli agenti ibridi che indirizza le decisioni complesse ai foundation model
  • Quantizzazione dei modelli per l'implementazione in produzione
  • Caching strategico delle risposte per le query più comuni

JPMorgan Chase ha ridotto i costi di inferenza del 67% tramite un'architettura ibrida che elabora l'89% delle transazioni tramite percorsi deterministici, riservando le risorse degli LLM per scenari complessi.

2. Messa a punto del prompt engineering per l'efficienza

  • Precisione nella progettazione delle istruzioni per ridurre al minimo l'utilizzo dei token
  • Pruning contestuale che elimina le informazioni non necessarie
  • Ottimizzazione del formato di risposta per ridurre la generazione di token

3. Ottimizzazione dell'inferenza

  • Implementazione della cache Key-Value (KV) per interazioni ripetute
  • Elaborazione batch per operazioni non sensibili al tempo
  • Adattamento dell'infrastruttura di implementazione ai pattern di workload

4. Implementazione della RAG

  • Retrieval-augmented generation strategica per ridurre le dimensioni del contesto
  • Ottimizzazione del database vettoriale per un accesso efficiente alle informazioni
  • Tecniche di distillazione del contesto che comprimono le informazioni pertinenti

5. Ottimizzazione per la specializzazione del dominio

  • Creazione di modelli specifici di dominio con conteggio ridotto dei parametri
  • Distillazione di modelli generali in varianti specializzate efficienti
  • Approcci di ottimizzazione dei parametri efficienti come LoRA e QLoRA

Il rapporto 2024 sull'economia dell'AI di McKinsey afferma che l'implementazione di tre o più di queste strategie riduce in media i costi operativi dell'AI del 62%, mantenendo o migliorando le funzionalità del sistema. 

Sfide dell'implementazione

Le architetture agentiche introducono nuove considerazioni di implementazione.

Complessità dell'orchestrazione
Il coordinamento degli agenti autonomi richiede approcci diversi rispetto all'orchestrazione tradizionale dei microservizi:

  • Il processo decisionale decentralizzato richiede un coordinamento sofisticato
  • Più agenti devono lavorare per raggiungere obiettivi comuni
  • Lo stato del sistema diventa più complesso con cambiamenti asincroni

I framework moderni affrontano queste sfide attraverso sistemi di prioritizzazione e un contesto condiviso. Il Semantic Kernel di Microsoft implementa un'orchestrazione che bilancia l'autonomia degli agenti con la coerenza del sistema.

Osservabilità e monitoraggio
Gli approcci di monitoraggio tradizionali devono evolversi:

  • I sistemi devono acquisire percorsi di ragionamento e criteri decisionali
  • L'analisi del comportamento aiuta a identificare i modelli nelle interazioni con gli agenti
  • Il monitoraggio predittivo anticipa i potenziali stati del sistema

Sicurezza e governance
Le architetture basate su agenti introducono nuove dimensioni di sicurezza:

  • Meccanismi per verificare che le istruzioni degli agenti siano in linea con le policy dell'organizzazione
  • Sistemi per convalidare le azioni dell'agente prima dell'esecuzione
  • Funzionalità per esaminare la conformità dei ragionamenti degli agenti

Confronto tra microservizi e sistemi agentici: un caso d'uso pratico

Per illustrare la differenza tra microservizi e architetture agentiche, consideriamo una piattaforma di trading di servizi finanziari.

Implementazione tradizionale dei microservizi:

  • Un servizio clienti gestisce le informazioni e i saldi dei clienti
  • Un servizio di trading esegue ordini in base a richieste esplicite
  • Un servizio di dati di mercato fornisce i prezzi quando richiesto
  • Un servizio di notifica invia avvisi dopo eventi predefiniti
  • Un servizio di gestione del rischio applica controlli basati su regole

Quando un cliente effettua un'operazione, il sistema segue un percorso predeterminato e ogni passaggio viene attivato esplicitamente.

Implementazione agentica:

  • Un agente di portfolio monitora continuamente le partecipazioni e suggerisce opportunità di riequilibrio
  • Un agente di esecuzione di trading seleziona le tempistiche ottimali in base alle condizioni di mercato
  • Un agente di valutazione del rischio valuta proattivamente la volatilità del mercato
  • Un agente di comunicazione fornisce informazioni rilevanti attraverso i canali preferiti

In pratica, l'implementazione agentica crea esperienze cliente fondamentalmente diverse. Quando la volatilità del mercato aumenta, l'agente di valutazione del rischio potrebbe regolare autonomamente i limiti di trading e notificare l'agente di portfolio, che analizza le partecipazioni dei clienti alla ricerca di potenziali vulnerabilità. Il sistema dimostra un'intelligenza che va oltre ciò che è stato esplicitamente codificato.

Guardando al futuro: ingegneria della piattaforma per la scalabilità agentica

La progressione dai monoliti ai servizi, ai microservizi agli agenti segue chiari schemi storici. Ogni evoluzione ha portato con sé componenti più granulari, con intelligenza e autonomia crescenti.

Le organizzazioni che implementano architetture agentiche su larga scala devono adottare i principi di ingegneria della piattaforma per ottenere qualità coerente, efficienza dei costi e governance in tutto il portafoglio di applicazioni.

Adozione guidata dalla piattaforma

Le organizzazioni lungimiranti utilizzano piattaforme interne per sviluppatori (IDP) per accelerare l'adozione degli agenti.

Infrastruttura standardizzata degli agenti

  • Template degli agenti preconfigurati con monitoraggio integrato
  • Modelli di implementazione all'avanguardia per i tipi di agenti più comuni
  • Distribuzione self-service con gate di qualità automatizzati

Observability unificata

  • Monitoraggio centralizzato delle prestazioni e del comportamento degli agenti
  • Tracciamento e visualizzazione delle interazioni tra agenti
  • Rilevamento automatico delle anomalie con analisi della causa principale

Focus sull'esperienza dello sviluppatore

  • Strumenti self-service per lo sviluppo e il test degli agenti
  • Ambienti di sviluppo integrati con debugging di agenti specializzati
  • Controlli di conformità automatizzati durante lo sviluppo

Governance su larga scala

  • Gestione e applicazione centralizzata delle policy
  • Valutazione automatizzata del comportamento degli agenti rispetto agli standard
  • Percorsi di controllo completi per tutte le azioni degli agenti

Il rapporto 2024 di Gartner sull'ingegneria della piattaforma afferma che gli approcci maturi delle piattaforme portano a un tempo di lancio sul mercato 3,2 volte più rapido per le funzionalità dei nuovi agenti e a una soddisfazione degli sviluppatori superiore del 76%. 

Le organizzazioni si trovano di fronte a una scelta: guidare nell'adozione dell'architettura agentica per i casi d'uso appropriati, oppure seguire concorrenti che catturano i primi vantaggi. I dati suggeriscono che i pionieri che implementano approcci basati sulla piattaforma ottengono notevoli vantaggi competitivi in termini di velocità di sviluppo, flessibilità del sistema e funzionalità.

Soluzioni correlate
IBM® watsonx.ai

Addestra, convalida, adatta e implementa le funzionalità di AI generativa, foundation model e machine learning con IBM watsonx.ai, uno studio aziendale di nuova generazione per builder AI. Crea applicazioni AI in tempi ridotti e una minima quantità di dati.

Esplora watsonx.ai
Soluzioni di intelligenza artificiale

Metti l'AI al servizio della tua azienda con l'esperienza leader di settore e il portfolio di soluzioni di IBM nel campo dell'AI.

Esplora le soluzioni AI
Consulenza e servizi per l'intelligenza artificiale (AI)

I servizi di AI di IBM Consulting aiutano a reinventare il modo in cui le aziende lavorano con l'AI per la trasformazione.

Esplora i servizi AI
Fasi successive

Ottieni l'accesso completo a funzionalità che coprono l'intero ciclo di vita dello sviluppo dell'AI. Crea soluzioni AI all'avanguardia con interfacce intuitive, workflow e accesso alle API e agli SDK standard di settore.

Esplora watsonx.ai Prenota una demo live