Cos'è BabyAGI?

Autori

Staff writer

Staff Editor, AI Models

IBM Think

BabyAGI è un framework di agenti autonomi progettato per generare ed eseguire una sequenza di attività in base a un obiettivo fornito dall'utente. Condiviso pubblicamente da Yohei Nakajima nel 2023, BabyAGI orchestra un ciclo di creazione, esecuzione e definizione delle priorità utilizzando un modello linguistico di grandi dimensioni (LLM) e un archivio di memoria vettoriale.

L'implementazione standard è uno script Python che utilizza i modelli GPT di OpenAI tramite un'API, un database vettoriale (comunemente Pinecone) per la memoria e il framework di agenti LangChain per strutturare i ruoli degli agenti AI. Il database vettoriale registra i risultati delle attività come embedding utilizzati per il recupero del contesto, mentre l'LLM potenzia il ragionamento dell'agente e la logica delle attività.¹

In qualità di agente AI autonomo, BabyAGI itera continuamente utilizzando i risultati delle attività completate per informare nuove attività, riassegnare le priorità all'elenco delle attività ed eseguire le attività secondarie. Il processo continua fino all'esaurimento della coda delle attività o al raggiungimento di una condizione di arresto.

Le ultime notizie nel campo della tecnologia, supportate dalle analisi degli esperti

Resta al passo con le tendenze più importanti e interessanti del settore relative ad AI, automazione, dati e oltre con la newsletter Think. Leggi l' Informativa sulla privacy IBM.

Come funziona BabyAGI?

BabyAGI utilizza un workflow di AI ripetuto in tre fasi:

Esecuzione dell'attività: l'agente di esecuzione esegue un'attività usando il contesto del database vettoriale e l'obiettivo di alto livello come indicazioni.
Creazione dell'attività: in base al risultato dell'attività eseguita, l'agente per la creazione dell'attività genera attività di follow-up in linea con l'obiettivo originale.
Assegnazione delle priorità alle attività: un agente addetto alle priorità riordina tutte le attività in sospeso, comprese le nuove attività, in base alle dipendenze e alla pertinenza rispetto all'obiettivo.

Il ciclo si ripete fino a quando non rimane più alcuna attività o viene soddisfatta un'altra condizione finale.

Caratteristiche principali di BabyAGI

BabyAGI è costituito da diversi moduli architetturali di base che collaborano per facilitare la generazione, la definizione delle priorità e l'esecuzione automatizzate delle attività. Questi componenti sono:

LLM
Database vettoriali
Elenco delle attività
Agente di esecuzione delle attività
Agente di creazione delle attività
Agente di definizione delle priorità delle attività

LLM

Il componente LLM di BabyAGI è l'orchestratore centrale del sistema agentico. Questo modello di intelligenza artificiale (AI) svolge il ruolo di direttore di alto livello, riceve il prompt dell'utente e lo valuta con l'elaborazione del linguaggio naturale (NLP) per identificare l'obiettivo. Inoltre, potenzia gli agenti che creano, eseguono e assegnano priorità alle attività.

BabyAGI utilizza in genere GPT-4 di OpenAI. I tre agenti del sistema BabyAGI utilizzano il prompt engineering per guidare il comportamento del GPT-4 nei suoi ruoli agentici.

Database vettoriale

Il componente del database vettoriale di BabyAGI memorizza i record e i risultati delle attività completate ed è la memoria dell'agente. BabyAGI può utilizzare i risultati del primo compito per informare il secondo compito e itera questo processo man mano che procede nell'elenco dei compiti.

I database vettoriali memorizzano i dati come rappresentazioni matematiche chiamate embedding. I punti dati più vicini tra loro nello spazio vettoriale ad alta dimensione sono considerati più simili dal punto di vista semantico. BabyAGI utilizza la ricerca semantica per trovare informazioni rilevanti nel database.

L'implementazione canonica utilizza Pinecone, ma a volte vengono utilizzati database vettoriali alternativi come Facebook AI Similarity Search (FAISS) e Chroma di Meta in varianti o fork. FAISS e Chroma sono open source, mentre Pinecone, come molti prodotti OpenAI, non lo è.

Elenco delle attività

L'elenco o la coda delle attività è un elenco con assegnazione di priorità delle attività secondarie derivanti dall'obiettivo di alto livello e dall'attività iniziale. Man mano che l'agente di esecuzione delle attività le completa, tali risultati vengono caricati nel database vettoriale. In base ai risultati di tali attività, il relativo elenco può cambiare man mano che le priorità vengono modificate e ne vengono aggiunte di nuove.

Agente di esecuzione delle attività

L'agente di esecuzione delle attività utilizza l'LLM e i dati nel database vettoriale per eseguire le attività elencate. Per trovare informazioni rilevanti nel database vengono utilizzate delle tecniche di ricerca semantica. Una volta completata l'attività, il sistema crea un nuovo embedding e memorizza il record nel database.

Agente di creazione attività

L'agente per la creazione delle attività utilizza l'obiettivo di alto livello e i risultati delle attività precedenti per generare le attività successive nel workflow. Piuttosto che lavorare tramite un workflow predeterminato, il processo di generazione continua delle attività consente al sistema di iterare sui risultati passati e apprendere in modo dinamico.

Agente di definizione delle priorità delle attività

L'agente di prioritizzazione delle attività le gestisce riordinandone e organizzandone regolarmente l'elenco. Il suo compito è dare priorità alle attività secondarie in base ai risultati delle attività precedenti e al modo in cui le nuove attività si relazionano all'obiettivo di alto livello. L'agente di prioritizzazione considera anche le dipendenze tra le attività, ovvero se un'attività deve essere completata prima che un'altra diventi possibile.

Agenti AI

5 tipi di agenti AI: funzioni autonome e applicazioni nel mondo reale

Scopri come l'AI basata sugli obiettivi e sulle utilità si adatta ai workflow e agli ambienti complessi.

Sviluppa, distribuisci e monitora gli agenti AI

Come usare BabyAGI

BabyAGI è una libreria Python e richiede alcune conoscenze di codifica Python per essere utilizzata. Tuttavia, il processo di configurazione è relativamente snello:

Installa Python e Git. Scarica il repository GitHub di BabyAGI da github.com.
Apri la directory con BabyAGI e installa tutte le dipendenze usando il comando pip install .
Crea un file con estensione .env e copia il file .env di esempio.
Aggiungi una chiave API OpenAI e una chiave API Pinecone al file .env . Se necessario, crea prima un account OpenAI e ottieni una chiave API.
Definisci l'obiettivo modificando il valore OBJECTIVE. Quindi, fornisci un compito iniziale.
Salva e chiudi il file .env.
Immetti il comando python babyagi.py per eseguire l'agente.

Casi d'uso di BabyAGI

BabyAGI è più una sandbox di formazione che un'applicazione a livello di produzione pronta per l'uso mainstream dell'agentic AI. Gli appassionati di machine learning (ML) e agentic AI hanno usato BabyAGI per esplorare task agent autonomi e ragionamenti a catena di pensiero con gli LLM.

BabyAGI e AutoGPT

BabyAGI viene spesso paragonato ad AutoGPT, un altro framework open source per agenti autonomi basato su LLM. Entrambi sono strumenti di AI progettati per automatizzare obiettivi in più fasi combinando un LLM con memoria e uso degli strumenti.

BabyAGI esegue un ciclo compatto che crea, esegue e riassegna priorità alle attività con un database vettoriale per la memoria a breve e lungo termine. AutoGPT fornisce un framework con caratteristiche per la scomposizione degli obiettivi, l'integrazione degli strumenti e l'uso di API esterne.

Mentre BabyAGI è meglio utilizzato come strumento di ricerca e sandbox, AutoGPT può automatizzare le attività su larga scala.

BabyAGI è un'intelligenza artificiale generale (AGI?)

Nonostante il nome, BabyAGI non è un esempio di intelligenza artificiale generale (AGI). L'AGI è un'ipotetica AI con funzionalità di pensiero e ragionamento a livello umano. Ad oggi, l'AGI è ancora un concetto teorico. Nessuna applicazione di AI, compresa BabyAGI, ha raggiunto un tale livello di sofisticazione.

Come molti altri esempi di applicazioni AI generativa, BabyAGI utilizza modelli statistici avanzati per prevedere il risultato più probabile per un determinato input. Non capisce, non impara e non pensa come gli esseri umani.

Che cos'è BabyAGI 2?

Nel 2024, Nakajima ha introdotto BabyAGI 2, una variante sperimentale che utilizza un framework functionz in grado di memorizzare le funzioni e i relativi metadati in un database. L'agente può caricare, eseguire e aggiornare le funzioni con i metadati durante la compilazione.

Inizia a realizzare il ROI: una guida pratica all'agentic AI

Scopri come scalare l'agentic AI per ottenere un ROI misurabile in tutta la tua azienda. Questo playbook delinea i principali ostacoli che limitano l'impatto, spiega come misurare efficacemente il ROI e delinea un framework pratico per promuovere un'adozione di successo a livello aziendale.

Risorse

L'impresa nel 2030: progettata per l'innovazione continua

Scopri le nostre cinque previsioni su ciò che definirà le aziende di maggior successo nel 2030 e i passi che i leader possono intraprendere per ottenere un vantaggio AI-first.

Un imperativo della governance dell'AI: le normative in evoluzione e l'emergere dell'agentic AI

Scopri come le normative in evoluzione e l'emergere degli agenti AI stanno rimodellando la necessità di solidi framework di governance dell'AI.

Spieghiamo l'agentic AI

Techsplainers di IBM analizza gli elementi essenziali dell'agentic AI, dai concetti chiave ai casi d'uso reali. Gli episodi chiari e rapidi ti aiutano ad apprendere rapidamente le nozioni fondamentali.

Sblocca il ROI dell'AI: una guida tattica alla produttività aziendale

Scopri strategie dimostrate per aumentare la produttività e alimentare la trasformazione incentrata su AI e innovazione.

IDC MarketScape nomina IBM leader nella tecnologia di valutazione della gen AI 2025

Scarica il report per scoprire perché IDC MarketScape ha nominato IBM leader nella tecnologia di valutazione della gen AI 2025 e come watsonx.governance fa avanzare la gestione del rischio, la reportistica e l'integrazione.

In che modo gli agenti e gli assistenti AI possono aiutare la tua organizzazione

Immergiti in questa guida completa che analizza i principali casi d'uso e le funzionalità di base, fornendo consigli dettagliati per aiutarti a scegliere le soluzioni giuste per la tua azienda.

Reinventa la produttività aziendale con agenti e assistenti AI

Scopri come gli agenti e gli assistenti basati su AI possono collaborare per raggiungere nuovi livelli di produttività.

Prova watsonx Orchestrate

Esplora come gli assistenti di AI generativa possono alleggerire il tuo workload e migliorare la produttività.

Dai progetti di AI ai profitti: come l'agentic AI può sostenere un ritorno finanziario

Scopri come le organizzazioni stanno passando dal lancio di progetti pilota eterogenei di AI all'utilizzo dell'AI come motore di trasformazione centrale.

Rapporto Omdia sull'intelligenza potenziata: l'impatto degli agenti AI

Scopri come sbloccare il pieno potenziale della gen AI con gli agenti AI.

Come gli agenti AI reinventeranno la produttività

Impara come usare l'AI per essere più creativo ed efficiente e iniziare ad adattarti a un futuro che implica la collaborazione a stretto contatto con gli agenti AI.

Arriva l'agentic enterprise: mettere l'AI al servizio di tutta la tua tecnologia

Rimani aggiornato sui nuovi agenti AI emergenti, un punto di svolta fondamentale nella rivoluzione dell'AI.

Il futuro degli agenti, il consumo energetico dell'AI, l'utilizzo di computer Anthropic e la filigrana di Google sul testo generato dall'AI

Rimani sempre un passo avanti grazie ai nostri esperti di AI in questa puntata di Mixture of Experts, nel corso della quale approfondiranno il futuro degli agenti AI e molto altro.

Come Comparus utilizza un "assistente bancario"

Comparus ha utilizzato le soluzioni di IBM® watsonx.ai e ha dimostrato in modo impressionante il potenziale del conversational banking come nuovo modello di interazione.

Soluzioni correlate

Sviluppo di agenti AI IBM

Consenti agli sviluppatori di creare, distribuire e monitorare agenti AI con lo studio IBM watsonx.ai.

Esplora watsonx.ai

Soluzioni di intelligenza artificiale

Metti l'AI al servizio della tua azienda grazie all'esperienza leader di settore e alla gamma di soluzioni di IBM nel campo dell'AI.

Esplora le soluzioni AI

Consulenza e servizi sull'AI

Reinventa i flussi di lavoro e le operazioni critiche aggiungendo l'AI per massimizzare le esperienze, il processo decisionale in tempo reale e il valore di business.

Esplora i servizi AI

Prossimi passi

Sia che tu scelga di personalizzare app e competenze precostituite o di creare e implementare servizi di agenti personalizzati utilizzando uno studio di AI, la piattaforma IBM watsonx è la soluzione che fa per te.

Note a piè di pagina

1. Nakajima, Yohei. “Task-driven Autonomous Agent Utilizing GPT-4, Pinecone, and LangChain for Diverse Application”28 marzo, 2023.