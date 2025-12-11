Intelligenza artificiale Automazione IT

Ora GA: monitora gli agenti in tempo di esecuzione con watsonx Orchestrate

Questa versione offre visibilità in tempo di esecuzione ai suoi agenti umani, così può scalare con sicurezza l'automazione in tutta la sua azienda.

Pubblicato il 11 dicembre 2025
By Suzanne Livingston

Gli agenti AI stanno passando dai prototipi ai workload reali e di produzione in tempo reale. Tuttavia, a differenza delle app tradizionali, gli agenti non sono deterministici, sono multi-fase e basati su strumenti, quindi il "tempo di attività" non è sufficiente a stabilire se si stanno comportando in modo affidabile, sicuro o conveniente.

Ecco perché siamo entusiasti di annunciare la disponibilità generale (GA) del monitoraggio degli agenti in IBM watsonx Orchestrate, alimentato dall'integrazione con IBM watsonx.governance.

Novità nel monitoraggio degli agenti

Il monitoraggio degli agenti in watsonx Orchestrate permette ai builder di capire come gli utenti interagiscono con l'agente e come l'agente si comporta. Al centro è la capacità di monitorare gli agenti in tempo di esecuzione attraverso un dashboard che mostra le metriche che più contano una volta che gli agenti sono attivi.

Grazie al monitoraggio, i team possono:

  • Controllare le prestazioni degli agenti in tempo reale a colpo d'occhio sui singoli agenti o sull'intero catalogo di agenti.
  • Monitorare i KPI chiave, come tassi di successo, latenza, utilizzo dei token e driver di costo.
  • Approfondire i dettagli a livello di transazione per capire esattamente cosa è successo in una specifica interazione utente-agente.
  • Rilevare i problemi in anticipo utilizzando segnali tracciati che evidenziano dove i flussi si interrompono, gli strumenti non funzionano correttamente o le prestazioni si riducono.

Perché il monitoraggio è importante per gli agenti

Il monitoraggio tradizionale presuppone sistemi deterministici. Gli agenti sono diversi per 3 motivi:

  • Concatenano le chiamate degli LLM, le fasi di recupero e gli strumenti, quindi gli errori possono comparire in qualsiasi punto del percorso di ragionamento.
  • La qualità dei loro output può variare nel tempo con il cambiamento di dati, prompt o modelli sottostanti.
  • I loro costi possono aumentare inaspettatamente a seconda dei percorsi di conversazione e dell'uso degli strumenti.

Il monitoraggio della produzione fornisce la "verità in tempo di esecuzione", non solo il tempo di attività. Puoi verificare che gli agenti siano sempre precisi, sicuri ed efficienti mentre servono utenti reali e puoi rispondere rapidamente quando non lo sono.

Come funziona il monitoraggio del runtime

Quando un agente viene implementato in produzione, watsonx Orchestrate acquisisce automaticamente una ricca telemetria da ogni interazione. L'interfaccia utente di monitoraggio a tempo di esecuzione organizza quei dati in 3 livelli:

  1. Stato di salute a livello di agente: una vista riassuntiva tra gli agenti distribuiti ti aiuta a individuare rapidamente quali agenti stanno prosperando e quali necessitano di attenzione in base al volume di utilizzo, ai tassi di successo/fallimento e ai modelli di latenza.
  2. Insight a livello di messaggi e strumenti: i grafici a serie temporale mostrano come le prestazioni evolvono tra turni e chiamate di strumenti, così puoi individuare se rallentamenti o guasti derivano dall'LLM, dal recupero o da un sistema a valle.
  3. Insight a livello di conversazione: scopri come si comportano gli agenti in conversazioni complete e multi-turn, non solo in singole interazioni. Le visualizzazioni aggregate evidenziano i punti in cui gli utenti abbandonano il servizio e quali turni determinano guasti o escalation. Ciò aiuta i team a individuare schemi di attrito ricorrenti, a misurare il successo end-to-end e a dare priorità ai miglioramenti che aumentano il completamento delle attività nel mondo reale.

Agent Ops per gestire l'intero ciclo di vita degli agenti

Il monitoraggio del runtime è un elemento chiave della nostra strategia Agent Ops e una parte fondamentale del ciclo di vita dello sviluppo degli agenti. Agent Ops offre la possibilità di osservare, valutare e ottimizzare agenti sicuri e conformi, costruiti ovunque e in esecuzione ovunque.

  • Osservabilità: sia durante lo sviluppo che in produzione, i clienti hanno bisogno di una visibilità chiara su come si comportano i loro agenti: quali passaggi vengono eseguiti, quali strumenti vengono invocati e quali risposte vengono prodotte.  
  • Valutazione: i test di stress pre-produzione sono ancora manuali e fragili. I team hanno bisogno di un modo semplice e automatizzato per testare il proprio agente, rispetto a una varietà di casi d'uso e su una vasta gamma di metriche, dalla fedeltà alla rilevanza delle chiamate degli strumenti fino al conteggio dei token.
  • Ottimizzazione: le organizzazioni faticano a ricavare insight da tutti questi dati. Per scalare rapidamente, hanno bisogno di rilevamento dei problemi basato sull'AI, analisi della causa principale e raccomandazioni concrete per migliorare le prestazioni degli agenti e dei costi.

Suzanne Livingston

Vice President, Product Management

IBM watsonx Orchestrate