A differenza della generazione di prompt zero-shot, la generazione di prompt few-shot fornisce al modello esempi di input e output previsti per l'attività.1 L'immagine precedente illustra la differenza tra la generazione di prompt zero-shot e la generazione di prompt few-shot, con la generazione di prompt one-shot mostrata anche come caso speciale.
Utilizzando lo stesso modello IBM granite-3-8b-instruct, vengono forniti esempi di "Problemi" e le "Classi" corrispondenti per questa attività.2 I tre esempi di input e output forniti illustrano la strategia di generazione di prompt few-shot. In risposta a questo prompt, il modello fa una previsione ragionevole della classe “Media” (come evidenziato in grassetto).
Nota: il prompt è stato eseguito con IBM watsonx.ai Prompt Lab utilizzando la modalità "Freeform".
Imposta il nome della classe per il problema descritto su Alta, Media o Bassa. Ho fornito alcuni esempi di problemi e i nomi delle classi corrispondenti. Prevedi solo il nome della classe per l'ultima versione. Fornisci una breve descrizione del motivo per cui è stato scelto il nome della classe.
Nome della classe: Alta
Descrizione: un problema che ha un costo aziendale elevato, ha un impatto su molti utenti o su entrambi.
Nome della classe: Media
Descrizione: un problema che si colloca tra il massimo e il minimo.
Nome della classe: Bassa
Descrizione: un problema che ha un impatto su alcuni utenti, non ha un costo aziendale elevato o entrambi.
Problema: i nuovi utenti segnalano di non poter creare un account.
Classe: Alta
Problema: un utente segnala che le etichette si sovrappongono nella funzione di analisi dell'app.
Classe: Bassa
Problema: gli utenti negli Stati Uniti segnalano che l'app si blocca quando tentano di effettuare un acquisto.
Classe: Alta
Problema: gli utenti segnalano che le immagini non vengono caricate nell'app.
Classe: Media
Spiegazione: il problema del mancato caricamento delle immagini nell'app influisce sull'esperienza degli utenti e potrebbe causare frustrazione, ma non ha un costo aziendale elevato né un impatto su molti utenti. Pertanto, è classificato come un problema di medio livello.
La generazione di prompt few-shot, che è una strategia derivata dal paradigma di apprendimento few-shot, viene in genere utilizzata per migliorare le prestazioni del modello rispetto alla generazione di prompt zero-shot su un'attività.1 In questo esempio, il modello AI produce inferenze utili sia nello scenario zero-shot che in quello few-shot. Nel decidere se utilizzare il prompt zero-shot o few-shot, è necessario considerare i vincoli del problema e le prestazioni dimostrate di entrambe le strategie. Reynolds e McDonell (2021) hanno scoperto che, migliorando la struttura dei prompt, il prompt zero-shot può superare il prompt few-shot in alcuni scenari.4 Schulhoff et al. (2024) trovano risultati diversi confrontando le prestazioni di diverse strategie di prompting.5