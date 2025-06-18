18 giugno 2025
L'agentic AI è una forza trasformativa, con Gartner che prevede che un terzo delle interazioni di gen AI utilizzerà modelli d'azione e agenti autonomi entro il 2028.
Ma gli Agente AI senza supervisione possono operare con notevole autonomia e potenza, esponendo le organizzazioni a numerosi rischi imprevedibili che possono avere un impatto dannoso e irreversibile sia sulle aziende che sui clienti. I loro complessi processi decisionali, influenzati dai dati, possono creare pregiudizi, complicare la tracciabilità e introdurre problemi di sicurezza. Le allucinazioni e le scelte sbagliate aggravano ulteriormente questi problemi.
Per combattere queste sfide, a marzo abbiamo annunciato l'anteprima tecnica delle nostre funzionalità di governance dell'agentic AI. Sulla base di questo slancio, stiamo implementando nuove caratteristiche come parte di watsonx.governance.
Il Governed Agentic Catalog è una risorsa completa per la gestione e la selezione di strumenti, agenti e workflow AI, progettata per semplificare la selezione di tool/agenti e promuovere il riutilizzo tra utenti e casi d'uso. Questo repository centralizzato aiuta i team a mantenere la coerenza e l'efficienza consolidando un'ampia gamma di strumenti, ognuno dei quali svolge attività specifiche essenziali per la progettazione e la creazione di sistemi agentici. Questi strumenti agentici comprendono varie funzionalità, come il recupero dei dati e le connessioni esterne.
Le caratteristiche principali del catalogo includono:
Sfruttando il Governed Agentic Catalog, i team possono gestire l'espansione degli strumenti, garantire il corretto utilizzo degli strumenti e mantenere la coerenza tra i reparti. Questo approccio completo alla gestione degli strumenti accelera in ultima analisi i progressi e promuove un ambiente collaborativo per lo sviluppo di sistemi agentici.
La crescente prevalenza di agenti AI introduce complessità significative, come la sfida di valutare le prestazioni, l'affidabilità, la sicurezza e il comportamento etico di questi agenti AI autonomi.
Le best practice di valutazione dell'agentic AI possono ridurre l'esposizione a vari rischi prevedibili e sconosciuti. Tuttavia, un monitoraggio efficace delle prestazioni può essere una sfida per le organizzazioni e gli sviluppatori, poiché gli agenti richiedono di osservare non solo gli output ma anche i comportamenti, le decisioni e le intenzioni. Con watsonx.governance, le organizzazioni possono valutare le prestazioni degli agenti utilizzando:
A partire da marzo, watsonx.governance ha introdotto queste nuove funzionalità per supportare metriche specializzate aggiuntive. Sono ora disponibili le nuove metriche di valutazione della RAG di agentic AI. Il set completo di metriche per valutare le prestazioni, include HAP, PII, prompt, pertinenza del contesto, fedeltà, somiglianza delle risposte, pertinenza delle risposte, tasso di successo, precisione media, rango reciproco e richieste non riuscite, tra gli altri, per garantire una valutazione approfondita dell'efficacia del nostro sistema. Questo aiuta a confermare che gli agenti agiscono in modo appropriato e a rilevare i segnali di allarme aggiungendo i guardrail necessari per regolare il comportamento degli agenti verso il risultato desiderato.
Queste metriche saranno disponibili aggiungendo un semplice decoratore Python al nodo dello strumento in un'applicazione LangGraph. Aggiungendo questo decoratore si otterrà il calcolo della metrica come sottoprodotto dell'esecuzione del nodo nell'applicazione agentica. La metrica calcolata può quindi essere utilizzata all'interno dell'applicazione per prendere decisioni sul flusso. Ad esempio, se il contesto recuperato dal database vettoriale non è rilevante per la query dell'utente, non generare una risposta, ma prova ad effettuare una ricerca sul web per recuperare il contesto giusto. Questi valutatori non sono solo facili da usare, ma sono anche efficienti e includono sia metriche opensource che metriche avanzate IBM. Pertanto, forniscono un'ampia gamma di funzionalità di valutazione e sono adatti a vari casi d'uso e tipi di attività.
Il monitoraggio della sperimentazione è fondamentale per governare un agente AI perché fornisce un registro completo di tutte le modifiche, iterazioni e miglioramenti apportati durante il processo di sviluppo. Ciò include modifiche agli algoritmi, agli input di dati, agli iperparametri e ad altri aspetti critici.
Lo sviluppo di app agentiche è un processo iterativo. Gli sviluppatori creano un'app agentic AI, la testano, la mettono a punto quando necessario e creano una nuova versione per migliorare l'output, e il processo continua per un'ulteriore ottimizzazione. watsonX.Governance supporterà automaticamente il monitoraggio di vari esperimenti e confronti utilizzando Evaluation Studio:
watsonx.governance accelera il processo di iterazione e sviluppo consentendo rapidi confronti tra applicazioni di agentic AI. Questa funzionalità non si limita alle app AI create sulla nostra piattaforma watsonx; estende anche il supporto a piattaforme di terze parti, offrendo versatilità.
Le metriche di monitoraggio possono aiutare a tenere traccia delle prestazioni degli agenti, rilevare problemi come il degrado delle prestazioni, la deriva dei dati e la distorsione del modello in produzione e guidare i miglioramenti. Senza una valutazione adeguata, diventa difficile fidarsi, controllare o calibrare e mettere a punto gli agenti AI per una maggiore precisione, aumentando il rischio di risultati indesiderati.
Negli scenari in cui l'agentic AI viene distribuito in produzione, la sorveglianza continua diventa fondamentale per affrontare problemi come l'allucinazione, i tempi di risposta, la deriva dei modelli e i pregiudizi. Implementare applicazioni di agentic AI con il monitoraggio continuo della produzione è critico per mantenere l'affidabilità e la fiducia del sistema. La sorveglianza in tempo reale consente ai team MLOps e AgentOps di tenere traccia del comportamento dei modelli e degli agenti, del drift delle prestazioni e degli output imprevisti, consentendo un intervento immediato in caso di deviazioni. Questa prontezza operativa garantisce che i sistemi autonomi rimangano allineati con gli obiettivi e i vincoli di sicurezza previsti.
Nelle prossime versioni, watsonx.governance di IBM sarà in grado di offrire una supervisione continua delle applicazioni, avviando avvisi quando una delle metriche supera i limiti predefiniti. Questa caratteristica garantisce una gestione proattiva e un intervento tempestivo per mantenere prestazioni dell'AI ottimali.
Similmente ad altre tecnologie in rapida evoluzione, gli agenti AI introducono possibili rischi, ostacoli e conseguenze sociali. Alcuni nuovi rischi introdotti dagli agenti AI includono distorsioni dei dati, azioni ridondanti, allucinazioni che richiamano funzioni, condivisione di informazioni riservate e attacchi alle risorse esterne di un agente AI. Oltre a questi, l'agentic AI intensifica i rischi, le sfide e gli effetti sociali esistenti.
IBM® Risk Atlas fornisce un elenco di rischi inerenti ai dati e all'AI e viene aggiornato per riflettere i rischi e le minacce agentici.
La governance dell'AI è necessaria per tutto il ciclo di vita dell'AI, dalla creazione, sviluppo e convalida dei casi d'uso al monitoraggio in produzione. In ogni fase, ci sono rischi e insidie, che se non gestiti correttamente, possono causare problemi presenti o futuri. Ad esempio, durante la creazione di un nuovo caso d'uso, watsonx.governance fornisce una valutazione del rischio, che ti aiuta a identificare i rischi a cui è soggetto il tuo caso d'uso, in modo da poter incorporare le tecniche di gestione del rischio necessarie. Allo stesso modo, durante lo sviluppo di un'applicazione agentica, è necessario misurare e valutare le prestazioni di ogni strumento o nodo dell'applicazione per apportare miglioramenti nelle iterazioni future.
watsonx.governance fornisce una libreria con oltre 50 metriche che possono essere aggiunte come decoratori alla tua applicazione e misurarne le prestazioni. Senza governance, non è possibile scalare o creare fiducia nella propria AI.
Una governance e una sicurezza efficaci sono indispensabili, ma man mano che le aziende crescono e adottano l'AI su larga scala, l'implementazione di una solida struttura di governance dell'AI diventa essenziale per garantire una sperimentazione sicura e gestire in modo efficiente le complessità dell'adozione diffusa dell'AI.
Prova watsonx.governance per esplorare queste nuove caratteristiche rilasciate e diversi altri miglioramenti creati per aiutare le aziende a sbloccare il vero potenziale dell'AI e trasformare la tua esperienza di governance dell'AI oggi.
