Che cos'è il chain of thought (CoT) prompting?

Autori

Vrunda Gadesha

AI Advocate | Technical Content Author

Eda Kavlakoglu

Business Development + Partnerships

IBM Research

Vanna Winland

AI Advocate & Technology Writer

La chain of thought (CoT) è una tecnica di Prompt Engineering che migliora l'output dei modelli linguistici di grandi dimensioni (LLM), in particolare per le attività complesse che coinvolgono il ragionamento a più fasi. Facilita la risoluzione dei problemi guidando il modello attraverso un processo di ragionamento passo a passo utilizzando una serie coerente di passaggi logici. 

Il prompt engineering viene utilizzato nell'intelligenza artificiale per perfezionare gli input (prompt) e ottenere gli output più accurati dal modello. In questo studio, viene introdotto il concetto di chain of thought prompting, che induce il ragionamento negli LLM.1 Il documento sostiene che spingere i modelli a generare fasi di ragionamento intermedie aumenta significativamente la loro capacità di risolvere con precisione problemi a più fasi come l'aritmetica, il buon senso e il ragionamento simbolico. 

I ricercatori si sono ispirati alla capacità degli LLM di "pensare ad alta voce" in linguaggio naturale, notando che con l'aumentare della dimensione dei parametri, anche la capacità e l'accuratezza del ragionamento miglioravano. Per questo motivo, il CoT prompting è considerato un'abilità emergente o un'abilità che appare man mano che aumentano le dimensioni o la complessità del modello. Gli LLM di grandi dimensioni tendono a ottenere risultati migliori perché hanno appreso modelli di ragionamento più sfumati grazie all'addestramento su enormi set di dati. 

Tuttavia, l'aumento delle dimensioni del modello non è l'unico modo per migliorare l'accuratezza della risoluzione dei problemi in una varietà di benchmark. I progressi nella messa a punto delle istruzioni hanno consentito a modelli più piccoli di eseguire il ragionamento CoT. I modelli IBM® Granite Instruct, ad esempio, sono ottimizzati utilizzando set di dati di formazione specializzati composti da istruzioni didattiche ed esempi per le attività CoT. Un prompt è un esempio che il modello utilizza come modo ideale per rispondere.

Perché il CoT prompting è efficace?

Il chain of thought prompting simula processi di ragionamento simili a quelli umani suddividendo problemi elaborati in passaggi intermedi gestibili che portano in sequenza a una risposta conclusiva.2 Questa struttura graduale di risoluzione dei problemi mira a garantire che il processo di ragionamento sia chiaro, logico ed efficace.

Nei formati di prompt standard, l'output del modello è in genere una risposta diretta all'input fornito. Ad esempio, se a un'AI viene fornito un prompt di input "Di che colore è il cielo?", l'AI genererà una risposta semplice e diretta, come "Il cielo è blu." 

Tuttavia, se chiedessimo di spiegare perché il cielo è blu utilizzando il prompt CoT, l'AI definirebbe prima il significato di "blu" (un colore primario). L'AI dedurrebbe quindi che il cielo appare blu a causa dell'assorbimento di altri colori da parte dell'atmosfera. Questa risposta dimostra la capacità dell'AI di costruire un argomento logico.

Per creare un prompt, un utente in genere aggiunge un'istruzione alla fine del prompt. Gli utenti solitamente aggiungono un'istruzione al loro prompt, ad esempio "descrivi i passaggi del tuo ragionamento" o "spiega la tua risposta passo a passo". In sostanza, questa tecnica di prompting chiede all'LLM non solo di generare un risultato, ma anche di dettagliare la serie di passaggi intermedi che hanno portato a quel risultato.3

Il prompt chaining è un altro metodo popolare utilizzato nelle applicazioni gen AI per migliorare l'affidabilità utilizzando più prompt che si basano l'uno sull'altro in sequenza per suddividere le attività complesse. Tecniche come il prompt chaining e il CoT portano il modello a ragionare su un problema passo a passo piuttosto che passare a una risposta che sembra corretta. Questo metodo può essere utile anche per l'observability e il debug, in quanto incoraggia il modello a essere più trasparente nel suo ragionamento. La differenza principale tra questi metodi è che il prompt chaining sequenzia più prompt per suddividere le attività passo dopo passo, mentre il CoT prompting suscita il processo di ragionamento del modello in un unico prompt.

Pensa oltre i prompt e considera il contesto completo 

Resta aggiornato sulle ultime novità del settore, sugli strumenti di AI e sulle tendenze emergenti nel prompt engineering con la Think Newsletter. Inoltre, avrai accesso a nuovi articoli esplicativi, tutorial e insight, direttamente nella tua casella di posta. Leggi l'Informativa sulla privacy IBM.

Grazie per aver effettuato l'iscrizione!

Come funziona il chain of thought prompting?

Il chain of thought prompting utilizza i modelli linguistici di grandi dimensioni (LLM) per articolare una successione di fasi di ragionamento, guidando il modello verso la generazione di catene di ragionamento analoghe per compiti nuovi. Ciò viene ottenuto attraverso prompt basati su esempi che illustrano il processo di ragionamento, migliorando così la capacità del modello di affrontare sfide di ragionamento complesse.4Comprendiamo il flusso di questa tecnica di prompting affrontando il classico problema di parole matematiche: risolvere un'equazione polinomiale.

Esempio: come funziona il chain of thought prompting per risolvere le equazioni polinomiali?

Il chain of thought prompting (CoT) può aiutare in modo significativo nella risoluzione delle equazioni polinomiali guidando un modello linguistico di grandi dimensioni (LLM) a seguire una serie di passaggi logici, scomponendo il processo di risoluzione del problema.2 Esaminiamo come il CoT prompting può gestire un'equazione polinomiale.

Considera l'esempio della risoluzione di un'equazione quadratica.

Prompt di input: risolvi l'equazione quadratica: x2 - 5x + 6 = 0

Quando diamo questo prompt alla chat di IBM® watsonx.ai, possiamo vedere la seguente conversazione tra domanda umana e risposta dell'assistenza AI.

Per generare questo tipo di output, i fondamenti del CoT funzionano come illustrato nell'immagine seguente. La risposta finale del chain of thought sarà: "Le soluzioni all'equazione x2 − 5x + 6 = 0 sono x = 3 e x = 2"

Varianti della chain of thought

Il chain of thought (CoT) prompting si è evoluto in varie varianti innovative, ognuna personalizzata per affrontare sfide specifiche e migliorare le funzionalità di ragionamento del modello in modi unici. Questi adattamenti non solo estendono l'applicabilità del CoT in diversi domini, ma perfezionano anche il processo di risoluzione dei problemi del modello.6

Chain of thought zero-shot

La variante zero-shot del chain of thought utilizza le conoscenze intrinseche all'interno dei modelli per affrontare i problemi senza esempi specifici precedenti o perfezionamenti per il compito da svolgere. Questo approccio è particolarmente utile quando si tratta di tipi di problemi nuovi o diversi in cui potrebbero non essere disponibili dati di addestramento personalizzati.7 Questo approccio può utilizzare le proprietà della generazione di prompt standard e della generazione di prompt few-shot.

Per esempio, quando si affronta la domanda "Qual è la capitale di un paese che confina con la Francia e ha una bandiera bianca e rossa?", un modello che utilizza il CoT zero-shot attingerebbe alle sue conoscenze geografiche e di bandiera incorporate per dedurre i passaggi che portano alla Svizzera come risposta, nonostante non sia stato addestrato esplicitamente su questo tipo di domande.

Chain of thought automatico

Il chain of thought automatico (Auto-CoT) mira a ridurre al minimo lo sforzo manuale nella creazione dei prompt automatizzando la generazione e la selezione di percorsi di ragionamento efficaci. Questa variante migliora la scalabilità e l'accessibilità dei prompt CoT per una gamma più ampia di attività e utenti.8, 9

Ad esempio, per risolvere un problema di matematica come "Se compri 5 mele e ne hai già 3, quante ne hai in totale?", un sistema Auto-COT potrebbe generare automaticamente dei passaggi intermedi. Questi passaggi potrebbero includere "Inizia con 3 mele" e "Aggiungi 5 mele alle 3 esistenti", culminando con "Mele totali = 8", semplificando il processo di ragionamento senza intervento umano.

Chain of thought multimodale

Il chain of thought multimodale estende il framework CoT per incorporare input provenienti da varie modalità, come testo e immagini, consentendo al modello di elaborare e integrare diversi tipi di informazioni per compiti di ragionamento complessi.10

Ad esempio, quando viene presentata un'immagine di una spiaggia affollata e viene chiesto: "È probabile che questa spiaggia sia popolare in estate?", un modello che impiega il CoT multimodale potrebbe analizzare gli indizi visivi (tra cui l'occupazione della spiaggia, le condizioni meteorologiche e altro ancora) insieme alla sua comprensione testuale della popolarità stagionale per elaborare una risposta dettagliata, come: "La spiaggia è affollata, il che indica un'alta popolarità, che probabilmente aumenterà ulteriormente in estate".

Queste varianti del chain of thought prompting non solo mostrano la flessibilità e l'adattabilità dell'approccio CoT, ma suggeriscono anche l'enorme potenziale di sviluppi futuri delle funzionalità di ragionamento e risoluzione dei problemi dell'AI.

AI Academy

Diventa un esperto di AI

Acquisisci le conoscenze necessarie per dare priorità agli investimenti nell'AI alla base della crescita aziendale. Inizia oggi stesso con la nostra AI Academy gratuita e guida il futuro dell'AI nella tua organizzazione.

Vantaggi e limitazioni

Il CoT prompting è una tecnica potente per migliorare le prestazioni dei modelli linguistici di grandi dimensioni (LLM) su compiti di ragionamento complessi, che offre benefici significativi in vari domini come una maggiore precisione, trasparenza e capacità di ragionamento in più fasi. Tuttavia, è essenziale considerare i suoi limiti, tra cui la necessità di prompt di alta qualità, l'aumento dei costi computazionali, la suscettibilità agli attacchi avversari e le sfide nella valutazione dei miglioramenti qualitativi nel ragionamento o nella comprensione. Risolvendo queste limitazioni, ricercatori e professionisti possono garantire un'implementazione responsabile ed efficace del CoT prompting in diverse applicazioni.11

Vantaggi del chain of thought prompting

Gli utenti possono beneficiare di una serie di vantaggi all'interno del chain of thought prompting. Alcuni di questi includono:

  • Output rapidi migliorati: il CoT prompting migliora le prestazioni degli LLM su attività di ragionamento complesse suddividendole in passaggi più semplici e logici.
  • Trasparenza e comprensione: la generazione di fasi di ragionamento intermedie offre trasparenza sul modo in cui il modello giunge alle sue conclusioni, rendendo il processo decisionale più comprensibile per gli utenti.
  • Ragionamento in più fasi: affrontando sistematicamente ogni componente di un problema, il CoT prompting spesso porta a risposte più accurate e affidabili, in particolare nelle attività che richiedono un ragionamento in più fasi. Il ragionamento in più fasi si riferisce alla capacità di eseguire operazioni logiche complesse suddividendole in passaggi sequenziali più piccoli. Questa abilità cognitiva è essenziale per risolvere problemi complessi, prendere decisioni e comprendere le relazioni di causa-effetto. 
  • Attenzione ai dettagli: il modello di spiegazione dettagliata è simile ai metodi di insegnamento che incoraggiano la comprensione attraverso suddivisioni dettagliate, rendendo il CoT prompting utile nei contesti educativi.
  • Diversità: il CoT può essere applicato a un'ampia gamma di compiti, tra cui, a titolo esemplificativo ma non esaustivo, il ragionamento aritmetico, il ragionamento di buon senso e la risoluzione di problemi complessi, dimostrando la sua flessibilità.

Limitazioni del chain of thought prompting

Ecco alcune limitazioni che potresti incontrare durante l'adozione del chain of thought.
  • Controllo di qualità: l'efficacia del CoT prompting dipende in larga misura dalla qualità dei prompt forniti, che richiedono esempi accuratamente realizzati per guidare il modello in modo accurato.
  • Elevata potenza di calcolo: la generazione e l'elaborazione di più fasi di ragionamento richiede più potenza e tempo di calcolo rispetto alla generazione di prompt standard in un solo passaggio. Quindi questa tecnica è più costosa da adottare da qualsiasi organizzazione.
  • Fuorviante concettualmente: c'è il rischio di generare percorsi di ragionamento plausibili ma errati, che portino a conclusioni fuorvianti o false.
  • Costoso e laborioso: la progettazione di prompt CoT efficaci può essere più complessa e laboriosa e richiede una profonda comprensione del dominio del problema e delle funzionalità del modello.
  • Overfitting dei modelli: esiste il rischio potenziale che i modelli si adattino eccessivamente allo stile o al modello di ragionamento nei prompt, il che può ridurre le loro capacità di generalizzazione su varie attività.
  • Valutazione e convalida: sebbene il CoT possa migliorare l'interpretabilità e l'accuratezza, misurare i miglioramenti qualitativi nel ragionamento o nella comprensione può essere difficile. Ciò è dovuto alla complessità intrinseca della cognizione umana e alla natura soggettiva della valutazione delle espressioni linguistiche. Tuttavia, è possibile utilizzare diversi approcci per valutare l'efficacia del CoT prompting. Ad esempio, confrontando le risposte del modello con quelle di un modello di base o di esperti umani è possibile ottenere insight sui relativi miglioramenti delle prestazioni. Inoltre, l'analisi delle fasi di ragionamento intermedie generate dall'LLM può offrire preziosi insight sul processo decisionale, anche se è difficile misurare direttamente i miglioramenti nel ragionamento o nella comprensione.

Progressi nel chain of thought

L'evoluzione del chain of thought (CoT) è una testimonianza dei progressi sinergici in diversi domini, in particolare nell'elaborazione del linguaggio naturale (NLP), nel machine learning e nel fiorente campo dell'AI generativa. Questi progressi non solo hanno spinto il CoT in prima linea nella risoluzione di problemi complessi, ma hanno anche sottolineato la sua utilità in una vasta gamma di applicazioni. Qui, approfondiamo gli sviluppi chiave, integrando i termini specificati per tracciare un quadro completo dei progressi del CoT.

Prompt Engineering e prompt originale

Le innovazioni nel prompt engineering hanno migliorato in modo significativo la comprensione e l'interazione dei modelli con il prompt originale, portando a percorsi di ragionamento più sfumati e contestualmente allineati. Questo sviluppo è stato fondamentale per perfezionare l'efficacia del CoT.12

Ragionamento simbolico e ragionamento logico

L'integrazione nelle attività di ragionamento simbolico e nelle attività di ragionamento logico ha migliorato la capacità dei modelli di pensiero astratto e deduzione, segnando un salto significativo nell'affrontare le sfide basate sulla logica con il CoT.13

Ad esempio, il ragionamento simbolico consiste nel risolvere equazioni matematiche, come 2 + 3 = 5. In questo caso, il problema viene scomposto nelle sue parti costitutive (addizione e numeri) e il modello deduce la risposta corretta in base alle conoscenze apprese e alle regole di inferenza. Il ragionamento logico, invece, consiste nel trarre conclusioni da premesse o ipotesi, come: "Tutti gli uccelli possono volare e un pinguino è un uccello". Il modello determinerebbe quindi che un pinguino può volare in base alle informazioni fornite. L'integrazione del CoT prompting nelle attività di ragionamento simbolico e logico ha permesso agli LLM di dimostrare una migliore capacità di pensiero astratto e di deduzione, consentendo loro di affrontare problemi più complessi e diversificati.

Creatività migliorata

L'applicazione dell'AI generativa e delle architetture trasformative ha rivoluzionato il CoT, consentendo la generazione di percorsi di ragionamento sofisticati che mostrano creatività e profondità. Questa sinergia ha ampliato l'applicabilità del CoT, influenzando sia il dominio accademico che quello pratico.9

Modelli più piccoli e autoconsistenza

I progressi che consentono ai modelli più piccoli di impegnarsi efficacemente nel ragionamento CoT hanno democratizzato l'accesso a sofisticate funzionalità di ragionamento. L'attenzione all'autoconsistenza all'interno del CoT garantisce la solidità logica dei percorsi generati, migliorando l'affidabilità delle conclusioni tratte dai modelli.11

Casi d'uso per il chain of thought

La metodologia del chain of thought (CoT), con la sua capacità di scomporre problemi complessi in passaggi di ragionamento comprensibili, ha trovato applicazioni in una vasta gamma di campi. Questi casi d'uso non solo dimostrano la versatilità del CoT, ma anche il suo potenziale nel trasformare il modo in cui i sistemi affrontano le attività decisionali e di risoluzione dei problemi. Nella sezione seguente, esploriamo diversi casi d'uso importanti in cui il CoT è stato applicato in modo efficace.

Assistenti AI

L'integrazione del CoT nei chatbot e lo sfruttamento di tecniche di NLP all'avanguardia hanno trasformato l'AI conversazionale, consentendo ai chatbot di condurre interazioni più complesse che richiedono un livello più profondo di comprensione e competenza nella risoluzione dei problemi.

Questi progressi rappresentano collettivamente un balzo in avanti nelle funzionalità del CoT e l'importanza dell'integrazione di chatbot e modelli CoT, evidenziando il loro potenziale per rivoluzionare i processi decisionali e di risoluzione dei problemi basati sull'AI. Combinando le capacità conversazionali dei chatbot con le funzionalità di ragionamento avanzate dei modelli CoT, possiamo creare sistemi AI più sofisticati ed efficaci in grado di gestire una gamma più ampia di compiti e applicazioni.

Inoltre, l'integrazione di varie applicazioni e modelli CoT può migliorare l'esperienza complessiva dell'utente, consentendo ai sistemi AI di comprendere e rispondere meglio alle esigenze e alle preferenze degli utenti. Integrando le tecniche di elaborazione del linguaggio naturale (NLP) nei modelli CoT, possiamo consentire ai chatbot di comprendere e rispondere agli input degli utenti in un modo più umano, creando esperienze di conversazione più coinvolgenti, intuitive ed efficaci.

Customer service chatbot

I chatbot avanzati utilizzano il CoT per comprendere e rispondere meglio alle domande dei clienti. Suddividendo il problema di un cliente in parti più piccole e gestibili, i chatbot possono fornire risposte più accurate e utili, migliorando la soddisfazione del cliente e riducendo la necessità di intervento umano.

Ricerca e innovazione

I ricercatori utilizzano il CoT per strutturare il loro processo di pensiero nella risoluzione di problemi scientifici complessi, facilitando l'innovazione. Questo approccio strutturato può accelerare il processo di scoperta e consentire la formulazione di nuove ipotesi.

Creazione e riepilogo dei contenuti

Nella creazione di contenuti, il CoT aiuta a generare schemi o riepiloghi strutturati organizzando logicamente pensieri e informazioni, migliorando la coerenza e la qualità dei contenuti scritti.

Formazione e apprendimento

Il CoT è fondamentale nelle piattaforme di tecnologia educativa, in quanto aiuta a generare spiegazioni dettagliate per problemi complessi. Questa abilità è particolarmente prezioso in materie come la matematica e le scienze, dove la comprensione del processo è cruciale quanto la risposta finale. I sistemi basati sul CoT possono guidare gli studenti attraverso procedure di risoluzione dei problemi, migliorandone la comprensione e la memorizzazione.

Etica e processo decisionale dell'AI

Il CoT è fondamentale per chiarire il ragionamento che sta dietro alle decisioni basate sull'AI, soprattutto negli scenari che richiedono considerazioni etiche. Fornendo un percorso di ragionamento trasparente, il CoT assicura che le decisioni dell'AI siano in linea con gli standard etici e le norme sociali.

Questi casi d'uso sottolineano il potenziale trasformativo del CoT in diversi settori, offrendo uno sguardo sulla sua capacità di ridefinire la risoluzione dei problemi e i processi decisionali. Man mano che il CoT continua ad evolversi, si prevede che le sue applicazioni si espandano, integrando ulteriormente questa metodologia nel tessuto dei progressi tecnologici e sociali.

La sollecitazione della chain of thought rappresenta un salto in avanti nella capacità dell'AI di intraprendere compiti di ragionamento complessi, emulando i processi cognitivi umani. Illustrando le fasi intermedie del ragionamento, il CoT non solo amplifica l'acume di risoluzione dei problemi degli LLM, ma migliora anche la trasparenza e l'interpretabilità. Nonostante le limitazioni intrinseche, le esplorazioni in corso sulle varianti e le applicazioni della CoT continuano ad ampliare le capacità di ragionamento dei modelli AI, preannunciando futuri miglioramenti delle funzionalità cognitive dell'AI.

Soluzioni correlate
IBM® watsonx.ai

Addestra, convalida, adatta e implementa le funzionalità di AI generativa, foundation model e machine learning con IBM watsonx.ai, uno studio aziendale di nuova generazione per builder AI. Crea applicazioni AI in tempi ridotti e una minima quantità di dati.

Esplora watsonx.ai
Soluzioni di intelligenza artificiale

Metti l'AI al servizio della tua azienda con l'esperienza leader di settore e il portfolio di soluzioni di IBM nel campo dell'AI.

Esplora le soluzioni AI
Consulenza e servizi per l'intelligenza artificiale (AI)

I servizi di AI di IBM Consulting aiutano a reinventare il modo in cui le aziende lavorano con l'AI per la trasformazione.

Esplora i servizi AI
Prossimi passi

Attraverso l'AI, IBM Concert scopre insight di importanza chiave sulle operazioni e fornisce raccomandazioni specifiche per migliorare le applicazioni. Scopri come Concert può migliorare il tuo business.

Esplora Concert Esplora le soluzioni di automazione dei processi aziendali