Le ultime tendenze in materia di AI, proposte da esperti
Ricevi insight selezionati sulle notizie più importanti e interessanti sull'AI. Iscriviti alla nostra newsletter settimanale Think. Leggi l'Informativa sulla privacy IBM.
Lo sviluppo di agenti AI è il processo di creazione di agenti AI. Include la progettazione, la creazione, la formazione, il test e la distribuzione di agentic AI.
Le aziende possono scegliere di creare agenti AI partendo da zero. Questo dà loro il pieno controllo dell'architettura e della funzionalità dell'agente. Possono anche adattare i sistemi degli agenti in base ai loro casi d'uso e alle esigenze aziendali e personalizzare l'agentic AI per attività specifiche. D'altro canto, per creare agenti AI partendo da zero sono necessarie competenze significative in intelligenza artificiale, machine learning e sviluppo software. Inoltre, può essere costoso.
Un approccio più rapido e scalabile, soprattutto per i principianti, prevede l'utilizzo di framework di agenti AI. Come struttura fondamentale per gli agenti basati su AI, queste piattaforme software dispongono di caratteristiche integrate che aiutano a semplificare il processo di sviluppo degli agenti, tra cui architetture e modelli predefiniti, sistemi di gestione delle attività e strumenti di integrazione e di monitoraggio.
Ricevi insight selezionati sulle notizie più importanti e interessanti sull'AI. Iscriviti alla nostra newsletter settimanale Think. Leggi l'Informativa sulla privacy IBM.
L'implementazione degli agenti AI consiste in genere in queste serie di passaggi:
Il primo passo è definire obiettivi chiari e un ambito definito per un agente AI. Ecco alcune domande che possono aiutare:
Le risposte a queste domande possono aiutare a guidare la fase di progettazione.
Il blueprint di un agente viene redatto durante la fase di progettazione. Questo blueprint comprende l'architettura, i workflow, l'integrazione e l'esperienza dell'utente.
Per funzioni semplici, come gli agenti dell'assistenza clienti che tracciano gli ordini in tempo reale e forniscono ai clienti aggiornamenti di stato, potrebbe essere sufficiente un'architettura con un solo agente. Ma per attività complesse, un sistema multiagente potrebbe essere più adatto. Nel settore sanitario, ad esempio, un sistema multiagente può automatizzare i complessi workflow della scoperta di farmaci, con agenti separati per esplorare le librerie di composti chimici e riassumere la ricerca medica e un altro agente di AI generativa (gen AI) per generare nuovi progetti molecolari.
L'architettura aiuta a determinare il giusto tipo di agente AI e i suoi componenti. Aiuta anche a mappare i workflow agentici, inclusi casi limite e scenari di errore. Per gli ecosistemi multiagente, devono essere presi in considerazione i protocolli di comunicazione, le strategie di orchestrazione e collaborazione.
Se un agente interagisce direttamente con gli utenti, le aziende possono optare per un'interfaccia di assistente AI simile ai chatbot come ChatGPT di OpenAI. Serve anche un piano per l'integrazione con altre piattaforme e si può prendere in considerazione il tool calling per accedere alle application programming interface (API), ai plug-in esterni, ai dati dei clienti e ad altre fonti di dati per l'elaborazione delle informazioni in tempo reale e il processo decisionale.
Una volta definito il design, la fase successiva è scegliere il framework, il modello AI e altri strumenti o librerie di intelligenza artificiale pertinenti.
Le organizzazioni possono creare agenti autonomamente utilizzando linguaggi di programmazione come Python o JavaScript. Per chi utilizza framework agentici, alcune scelte comuni includono framework open source come BeeAI, CrewAI, LangChain, LangGraph e il kit di sviluppo software AutoGen and Semantic Kernel di Microsoft (SDK).
La selezione del modello è fondamentale per allineare gli algoritmi di machine learning o i modelli linguistici di grandi dimensioni (LLM) con le funzioni e le attività di un agente AI. Le aziende potrebbero anche cercare strumenti specializzati come sistemi o librerie di Retrieval-augmented generation (RAG) come PyTorch, scikit-learn e TensorFlow per potenziare ulteriormente i loro agenti AI.
La fase di costruzione è quella in cui avviene l'azione di sviluppo dell'agente. Per evitare di trovarsi in una situazione di sovraccarico, le aziende possono adottare un approccio modulare, realizzando ogni componente separatamente prima di combinarli tutti insieme in un agenti AI funzionante. Questa strategia modulare consente anche una manutenzione più semplice poiché le modifiche a ciascuna parte avranno solo un impatto minimo sull'intero sistema di agenti.
Oltre a creare l'agente AI stesso, le organizzazioni devono considerare anche questi fattori nello sviluppo dell'agentic AI:
L'addestramento dei modelli implica l'apprendimento di un modello AI da un set di dati di attività di esempio pertinenti alle funzioni e alle azioni di un agente. È un processo iterativo che prevede la preparazione di un set di dati, l'esecuzione del modello su questi dati, la misurazione delle sue prestazioni attraverso un segnale di perdita o ricompensa e la regolazione dei parametri del modello per migliorare le previsioni future.
La formazione di modelli di machine learning da zero può essere lunga, costosa e richiede molte risorse. Le aziende potrebbero preferire invece utilizzare un modello preaddestrato e metterlo a punto su set di dati specifici per le attività di un agente AI.
La valutazione dell'agente AI è il processo di test e convalida dell'agentic AI per garantire che raggiunga i suoi obiettivi e funzioni come previsto. Richiede un set di dati di test o convalida diverso dal set di dati di formazione e sufficientemente diversificato da coprire tutti i possibili casi di test e riflettere gli scenari del mondo reale.
Condurre test in una sandbox o in un ambiente simulato può aiutare a individuare tempestivamente i miglioramenti delle prestazioni e identificare eventuali problemi di sicurezza e rischi etici prima di distribuire gli agenti agli utenti effettivi.
Come i benchmark LLM, anche gli agenti AI hanno una serie di metriche di valutazione. Le metriche più comuni includono metriche funzionali come la percentuale di successo o il completamento delle attività, il tasso di errore e la latenza e metriche etiche come la distorsione e il punteggio di equità e la vulnerabilità dell'iniezione di prompt. Gli agenti e i bot che interagiscono con gli utenti vengono valutati in base al flusso conversazionale, al tasso di coinvolgimento e al punteggio di soddisfazione degli utenti.
Dopo aver misurato le metriche e analizzato i risultati dei test, i team di sviluppo degli agenti possono procedere con il debug degli algoritmi, la modifica delle architetture agentiche, il perfezionamento della logica e l'ottimizzazione delle prestazioni.
Questa fase finale prevede la distribuzione di sistemi agentici in ambienti di produzione live in cui i clienti possono interagire e utilizzare gli agenti AI. Include anche il monitoraggio continuo, fondamentale per tracciare e migliorare le prestazioni degli agenti e assicurarsi che si adattino a nuove situazioni e sfide.
Piattaforme come Amazon Bedrock AgentCore e IBM® watsonx.ai aiutano ad automatizzare l'implementazione e il monitoraggio degli agenti. Grazie a watsonx.ai per esempio, gli sviluppatori possono utilizzare al meglio le funzionalità di distribuzione e tracciamento con un clic per l'osservabilità.
Crea, implementa e gestisci assistenti e agenti AI potenti che automatizzano workflow e processi con l'AI generativa.
Costruisci il futuro della tua azienda con soluzioni AI di cui puoi fidarti.
I servizi di AI di IBM Consulting aiutano a reinventare il modo in cui le aziende lavorano con l'AI per la trasformazione.