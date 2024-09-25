Cos'è la generazione di prompt few-shot?

Autore/i:

Vrunda Gadesha

AI Advocate | Technical Content Author

Che cos'è la generazione di prompt few-shot?

La generazione di prompt few-shot è il processo di fornire a un modello AI alcuni esempi di un'attività per guidare le sue prestazioni. Questo metodo è particolarmente utile negli scenari in cui non sono disponibili dati di addestramento completi.

In altre tecniche come la generazione di prompt zero-shot, che non richiede esempi, o la generazione di prompt one-shot, che si basa su un solo esempio, la generazione di prompt few-shot utilizza più esempi per migliorare la precisione e l'adattabilità. Oltre a questo, anche altri framework avanzati di prompt engineering come il chain-of-thought prompting e il tree-of-thought prompting utilizzano degli esempi per ottenere l'output desiderato e ottimizzare l'output del modello.

L'apprendimento few-shot è essenziale in situazioni in cui per l'AI generativa raccogliere grandi quantità di dati etichettati è difficile. I metodi di prompting convertono l'input di testo in un formato strutturato, consentendo a modelli come la serie IBM Granite, i modelli Llama di Meta e GPT-3 e GPT-4 di OpenAI di riempire gli spazi vuoti con risposte appropriate, eseguendo efficacemente attività senza set di dati etichettati estesi.[1] Questa tecnica consente anche di ottenere il formato di output predefinito guidando il modello attraverso esempi specifici, garantendo coerenza e precisione nella struttura desiderata.

Nel campo in rapida evoluzione dell'intelligenza artificiale (AI), dell'apprendimento automatico (ML) e dell'elaborazione del linguaggio naturale (NLP), la generazione di prompt few-shot è emersa come una tecnica potente perché consente ai modelli di eseguire attività con esempi limitati, caratteristica che la distingue da altri metodi di prompt come generazione di prompt zero-shot e one-shot. Comprendere la generazione di prompt few-shot è fondamentale per sfruttare tutto il potenziale di sistemi di AI avanzati come GPT-3/GPT-4 di OpenAI e altri modelli linguistici di grandi dimensioni (LLM), come i modelli IBM Granite o i modelli Llama di Meta.

La Figura 1 illustra un processo di apprendimento few-shot per la classificazione del sentiment utilizzando un modello linguistico di grandi dimensioni. Il prompt fornisce esempi di testo etichettato come "positivo" o "negativo". Il modello, dopo aver visto questi esempi etichettati, ha quindi il compito di classificare una nuova parte di testo ("Questo prodotto è molto conveniente") come "positivo". Questo dimostra come l'apprendimento few-shot consenta al modello di generalizzare da un numero limitato di esempi per eseguire un'attività specifica.

Come funziona la generazione di prompt few-shot?

La generazione di prompt few-shot funziona presentando al modello diversi esempi dell'attività desiderata all'interno del prompt. Questa tecnica utilizza la conoscenza preaddestrata dei modelli linguistici di grandi dimensioni (LLM) per eseguire attività specifiche in modo efficiente, anche con dati limitati.

Query dell'utente: il processo inizia con una query dell'utente, ad esempio "Questo prodotto è molto conveniente".

Database vettoriale: tutti gli esempi sono memorizzati in un database vettoriale, un database ottimizzato per la ricerca semantica. Quando viene ricevuta una richiesta dell'utente, il sistema esegue una corrispondenza semantica per trovare gli esempi più pertinenti dal database vettoriale.

Recupero di esempi pertinenti: solo gli esempi più pertinenti vengono recuperati e utilizzati per formare il prompt. In questo esempio, la Retrieval-Augmented Generation (RAG) viene utilizzata per recuperare gli esempi da un database vettoriale, il che aiuta ad adattare il prompt alla query specifica. Sebbene la RAG non sia universalmente richiesta per la generazione di prompt few-shot, può migliorare notevolmente la procedura, garantendo che vengano utilizzati gli esempi più pertinenti dal punto di vista contestuale, migliorando le prestazioni del modello in determinati scenari.

Formazione del prompt: il prompt è costruito con gli esempi recuperati e la query dell'utente. Ad esempio, il prompt potrebbe essere simile al seguente:

Elaborazione LLM: il prompt costruito viene quindi inserito nel LLM. Il modello elabora il prompt e genera un output che, in questo caso, classifica il sentiment della richiesta dell'utente.

Output: l'LLM restituisce la classificazione, ad esempio "negativo" per l'esempio fornito.

La ricerca ha evidenziato l'efficacia di un approccio di apprendimento few-shot che riduce la dipendenza dal prompt engineering. A differenza della messa a punto tradizionale, che prevede la regolazione dei parametri del modello utilizzando un set di dati di grandi dimensioni prima della richiesta, la messa a punto nell'impostazione few-shot si riferisce al processo di adattamento dei modelli preaddestrati con solo pochi esempi forniti direttamente nel prompt. Questo approccio consente al modello di utilizzare le sue conoscenze preesistenti in modo più efficace senza la necessità di ulteriore addestramento su grandi dataset.[2] Questo studio ha dimostrato che anche utilizzando i "null prompt", cioè prompt che non contengono modelli o esempi etichettati specifici per le attività, il modello potrebbe comunque raggiungere una precisione competitiva in varie attività. Ad esempio, un null prompt potrebbe semplicemente porre una domanda come "Qual è il sentiment nel testo seguente?" senza fornire esempi o istruzioni specifici su come classificare il sentiment. Nonostante la mancanza di struttura, il modello può funzionare bene, dimostrando la robustezza dell'apprendimento few-shot.

Nel complesso, lo studio suggerisce che l'apprendimento few-shot è una strategia molto efficace, in particolare quando si utilizzano prompt strutturati. Sebbene i null prompt possano produrre buoni risultati, l'aggiunta di alcuni esempi ben scelti può migliorare ulteriormente le prestazioni del modello, rendendolo un approccio versatile ed efficiente, soprattutto in scenari con dati etichettati limitati. [1]

Vantaggi e limiti della generazione di prompt few-shot

La generazione di prompt few-shot è una potente tecnica di elaborazione del linguaggio naturale (NLP) che consente ai modelli di eseguire attività con esempi minimi. Questo approccio presenta vantaggi e limiti di diverso tipo che ne influenzano l'efficacia e l'applicabilità.

Vantaggi

  1. Efficienza e flessibilità: la generazione di prompt few-shot riduce notevolmente la quantità di dati etichettati necessari per l'addestramento, rendendoli altamente efficienti e adattabili a nuove attività. Sfruttando modelli linguistici di grandi dimensioni pre-addestrati, la generazione di prompt few-shot può raggiungere prestazioni competitive anche con dati limitati. Ad esempio, nello studio citato di seguito, gli autori hanno dimostrato che la messa a punto dei modelli linguistici in pochi passaggi riduce la necessità di prompt engineering e può raggiungere un'elevata precisione in un'ampia gamma di attività.[2]
  2. Prestazioni migliorate in diverse applicazioni: la generazione di prompt few-shot ha dimostrato miglioramenti notevoli in varie applicazioni, dalla classificazione del testo alla traduzione automatica e altro ancora. Ad esempio, gli autori dello studio riportato di seguito citato hanno proposto TransPrompt, un framework di prompt trasferibile che acquisisce conoscenze trasversali, migliorando di molto le prestazioni nelle attività di classificazione del testo con poche immagini.[3]
  3. Robustezza rispetto a diversi prompt: la robustezza della generazione di prompt few-shot rispetto a diverse formulazioni di prompt è un altro vantaggio fondamentale. L'Unified Prompt Tuning (UPT), come descritto da Feihu Jin et al., arricchisce i prompt con informazioni specifiche dell'attività e dipendenti dall'istanza, ottenendo miglioramenti significativi delle prestazioni in varie attività di PNL.[4]
  4. Riduzione del sovraccarico computazionale: i recenti progressi hanno reso più efficiente la generazione di prompt few-shot. Ad esempio, Lewis Tunstall et al. hanno presentato SetFit, un framework efficiente per la messa a punto few-shot di Sentence Transformers, che raggiunge un'elevata precisione con un numero molto inferiore di parametri e tempi di addestramento ridotti rispetto ai metodi esistenti.[5]

Limitazioni

  1. Dipendenza dalla qualità dei prompt: la qualità e la progettazione dei prompt hanno un impatto significativo sulle prestazioni della generazione di prompt few-shot. Creare prompt efficaci richiede spesso un'attenta progettazione ed esperienza riguardo ai domini. Gli autori Timo Schick e altri ricercatori hanno evidenziato la variabilità delle prestazioni dovuta alla qualità dei prompt, sottolineando la necessità di una gestione intelligente di più prompt per ottenere risultati affidabili.[6]
  2. Complessità computazionale: i modelli linguistici di grandi dimensioni utilizzati nella generazione di prompt few-shot richiedono risorse sostanziali, un potenziale ostacolo per molte organizzazioni, che limita l'accessibilità di questi modelli. Morteza Bahrami et al. hanno osservato che i modelli con un numero enorme di parametri richiedono un hardware potente, che può costituire un vincolo per l'adozione diffusa.[1]
  3. Sfida della generalizzazione: la generalizzazione dei prompt in diverse attività e set di dati rimane una sfida significativa. Sebbene la generazione di prompt few-shot possa funzionare bene per attività specifiche, garantire prestazioni costanti tra varie applicazioni richiede tecniche avanzate. Ad esempio, lo studio condotto da Feihu Jin e altri autori ha affrontato questo problema nel ragionamento numerico sfruttando grandi quantità di dati di formazione per migliorare la generalizzazione nell'apprendimento basato sui prompt.[4]
  4. Funzionalità limitate: anche se la generazione di prompt few-shot eccelle con esempi minimi, le prestazioni in impostazioni zero-shot possono essere meno affidabili. Lo studio sui progressi del NER ha introdotto QaNER, un metodo basato sui prompt per la Named Entity Recognition che risolve i limiti delle funzionalità zero-shot migliorando la robustezza dei prompt.[7]

Pertanto, la generazione di prompt few-shot offre notevoli benefici in termini di efficienza, flessibilità e prestazioni in diverse applicazioni. Tuttavia, la sua dipendenza dalla qualità del prompt, dalla complessità computazionale, dalle sfide di generalizzazione e dalle limitate funzionalità zero-shot evidenziano le aree in cui sono necessari ulteriori progressi per massimizzarne il potenziale.

Newsletter Think

Pensa oltre i prompt e considera il contesto completo 

Resta aggiornato sulle ultime novità del settore, sugli strumenti di AI e sulle tendenze emergenti nel prompt engineering con la Think Newsletter. Inoltre, avrai accesso a nuovi articoli esplicativi, tutorial e insight, direttamente nella tua casella di posta. Leggi l'Informativa sulla privacy IBM.

Grazie per aver effettuato l'iscrizione!

Casi d’uso

La generazione di prompt few-shot si è dimostrata uno strumento versatile e potente con una serie di esempi in varie applicazioni, che utilizzano i punti di forza dei modelli linguistici di grandi dimensioni per eseguire attività complesse con esempi limitati. È popolare tra i casi d'uso della gen AI creativa, come la creazione di contenuti o l'apprendimento contestuale. Ecco alcuni casi d'uso degni di nota spiegati in dettaglio:

Analisi del sentiment
La generazione di prompt few-shot è particolarmente utile nell'analisi del sentiment in cui i modelli classificano il sentiment di un testo con dati etichettati limitati. L'integrazione della generazione di prompt few-shot con la corrispondenza semantica, come mostrato nella figura 2, ne è un esempio, in quanto consente ai modelli di classificare accuratamente il sentiment in base a esempi pertinenti da un database vettoriale.[1]

Riconoscimento delle azioni nei video
La generazione di prompt few-shot è stata applicata anche al riconoscimento delle azioni nei video. Yuheng Shi et al. hanno introdotto il knowledge prompting, che utilizza le conoscenze di buon senso provenienti da risorse esterne per il prompting di modelli visione-linguaggio. Questo metodo classifica efficacemente le azioni nei video con una supervisione minima, ottenendo prestazioni all'avanguardia e riducendo notevolmente i costi generali di addestramento.[8]

Generazione di dialoghi radicati
Nella generazione di dialoghi o nei chatbot, la generazione di prompt few-shot rafforza i modelli di dialogo integrando fonti di informazioni esterne. Questo studio ha dimostrato che i metodi di generazione di prompt few-shot potrebbero migliorare in modo significativo le prestazioni dei modelli di dialogo, rendendoli più coerenti e contestualmente pertinenti.[9]

Named Entity Recognition (NER)
La generazione di prompt few-shot può migliorare le attività di named entity recognition fornendo esempi che aiutano il modello a riconoscere e classificare le entità all'interno del testo. L'autore dello studio citato ha sviluppato un metodo di apprendimento basato su prompt consapevole delle entità per le attività di domanda-risposta che può essere adattato per le attività NER, migliorando notevolmente le prestazioni del modello.[10]

Attività di generazione del codice
La generazione di prompt few-shot è applicabile anche alle attività legate al codice, ad esempio la generazione di asserzioni di test e la riparazione del programma. Nel loro studio, Noor Nashid et al. hanno sviluppato una tecnica che recupera automaticamente le dimostrazioni del codice per creare prompt efficaci, mostrando miglioramenti sostanziali nella precisione delle attività.[11]

Questi casi d'uso dimostrano l'ampia applicabilità ed efficacia della generazione di prompt few-shot in diversi campi e attività, nonché il suo potenziale nel promuovere l'innovazione e l'efficienza nelle applicazioni di AI e NLP.

La generazione di prompt few-shot rappresenta un salto significativo nell'AI e nell'NLP, in quanto fornisce efficienza, flessibilità e prestazioni migliorate con esempi limitati. Man mano che la tecnologia si evolve, svolgerà un ruolo cruciale in varie applicazioni, promuovendo l'innovazione e l'efficienza in diversi campi.

AI Academy

Diventa un esperto di AI

Acquisisci le conoscenze necessarie per dare priorità agli investimenti nell'AI alla base della crescita aziendale. Inizia oggi stesso con la nostra AI Academy gratuita e guida il futuro dell'AI nella tua organizzazione.
Guarda la serie

Risorse

Raggiungere il ROI: agenti AI nella tua azienda

Unisciti a IBM per un webinar in cui dimostriamo come trovare un ROI reale attraverso iniziative di agentic AI, con esempi in tutti i settori, casi d'uso e le storie di successo della stessa IBM.
IBM è stata nominata leader nella scienza dei dati e nell'apprendimento automatico

Scopri perché IBM è stata riconosciuta come leader nel Gartner Magic Quadrant 2025 per le piattaforme di data science e machine learning.
Dai progetti di AI ai profitti: come l'agentic AI può sostenere un ritorno finanziario

Scopri come le organizzazioni stanno passando dal lancio di progetti pilota eterogenei di AI all'utilizzo dell'AI come motore di trasformazione centrale.

Migliora le tue competenza nell'AI

Accedi al nostro catalogo completo di oltre 100 corsi online acquistando oggi stesso un abbonamento individuale o multiutente che ti consentirà di ampliare le tue competenze su una gamma di prodotti a un prezzo contenuto.
Scopri IBM Granite

IBM Granite è una famiglia di modelli AI aperti, efficienti e affidabili, su misura per le aziende e ottimizzati per scalare le tue applicazioni AI. Esplora le opzioni relative a lingua, codice, serie temporali e guardrail.
AI Academy IBM

Condotto dai migliori leader di pensiero di IBM, il programma di studi è stato progettato per aiutare i dirigenti aziendali ad acquisire le conoscenze necessarie per dare priorità agli investimenti in AI che possono favorire la crescita.
AI in Action 2024

Abbiamo intervistato 2.000 organizzazioni in merito alle loro iniziative di AI per scoprire cosa funziona, cosa non funziona e come giocare d'anticipo.
La guida per i CEO 2025: 5 cambi di mentalità per potenziare la crescita aziendale

Introduci questi cinque cambiamenti di mentalità per eliminare le incertezze, favorire la reinvenzione del business e potenziare la crescita con l'agentic AI.
Sblocca la potenza dell'AI generativa e dell'ML

Scopri come incorporare in tutta sicurezza l'AI generativa e il machine learning nella tua azienda.
Come prosperare in questa nuova era dell'AI in tutta fiducia e sicurezza

Approfondisci i tre elementi critici di una solida strategia di AI: creare un vantaggio competitivo, scalare l'AI in tutta l'azienda e promuovere un'AI affidabile.
Soluzioni correlate
IBM® watsonx.ai

Addestra, convalida, adatta e implementa le funzionalità di AI generativa, foundation model e machine learning con IBM watsonx.ai, uno studio aziendale di nuova generazione per builder AI. Crea applicazioni AI in tempi ridotti e una minima quantità di dati.

 Esplora watsonx.ai
Soluzioni di intelligenza artificiale

Metti l'AI al servizio della tua azienda con l'esperienza leader di settore e il portfolio di soluzioni di IBM nel campo dell'AI.

 Esplora le soluzioni AI
Consulenza e servizi per l'intelligenza artificiale (AI)

I servizi di AI di IBM Consulting aiutano a reinventare il modo in cui le aziende lavorano con l'AI per la trasformazione.

 Esplora i servizi AI
Prossimi passi

Attraverso l'AI, IBM Concert scopre insight di importanza chiave sulle operazioni e fornisce raccomandazioni specifiche per migliorare le applicazioni. Scopri come Concert può migliorare il tuo business.

 Esplora Concert Esplora le soluzioni di automazione dei processi aziendali
Note a piè di pagina
  1. Morteza Bahrami, M. M. (14 febbraio 2023). Few-shot Learning with Prompting Methods. 6th International Conference on Pattern Recognition and Image Analysis (IPRIA), 1-5. https://ieeexplore.ieee.org/document/10147172.
  2. Robert L Logan IV, I. B. (24 giugno 2021). Cutting Down on Prompts and Parameters: Simple Few-Shot Learning with Language Models. 2824-2835. https://aclanthology.org/2022.findings-acl.222/.
  3. Chengyu Wang, J. W. (2021). TransPrompt: Towards an Automatic Transferable Prompting Framework for Few-shot Text Classification. 2792-2802. https://aclanthology.org/2021.emnlp-main.221/.
  4. Feihu Jin, J. L. (4 giugno 2023). Unified Prompt Learning Makes Pre-Trained Language Models Better Few-Shot Learners. ICASSP 2023 - 2023 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 1-5. https://ieeexplore.ieee.org/document/10095738.
  5. Lewis Tunstall, N. R. (22 settembre 2022). Efficient Few-Shot Learning Without Prompts. https://arxiv.org/abs/2209.11055.
  6. Timo Schick, H. S. (2021). Exploiting Cloze-Questions for Few-Shot Text Classification and Natural Language Inference. In Proceedings of the 16th Conference of the European Chapter of the Association for Computational Linguistics: Main Volume, pagg. 255–269, Online. Association for Computational Linguistics.
  7. Andy T. Liu, W. X.-W. (3 marzo 2022). QaNER: Prompting Question Answering Models for Few-shot Named Entity Recognition. https://arxiv.org/abs/2203.01543.
  8. Yuheng Shi, XW (22 novembre 2022). Prompting di conoscenza per il riconoscimento di azioni few-shothttps://doi.org/10.48550/arXiv.2211.12030.
  9. Chujie Zheng, M. H. (14 settembre 2021). Exploring Prompt-based Few-shot Learning for Grounded Dialog Generation. https://arxiv.org/abs/2109.06513.
  10. Yi Chen, X. S. (26 maggio 2023). Few-shot Question Answering with Entity-Aware Prompt. Proceedings of the 2023 4th International Conference on Computing, Networks and Internet of Things. https://dl.acm.org/doi/10.1145/3603781.3603812.
  11. Noor Nashid, M. S. (1 maggio 2023). Retrieval-Based Prompt Selection for Code-Related Few-Shot Learning. IEEE/ACM 45th International Conference on Software Engineering (ICSE), 2450-2462. https://ieeexplore.ieee.org/document/10172590.