Contrairement à l’apprentissage zero-shot, l’apprentissage few-shot fournit au modèle des exemples d’entrée et de sortie attendues pour la tâche.1 L’image précédente montre la différence entre l’apprentissage zero-shot et l’apprentissage few-shot, l’apprentissage one-shot étant également présenté à titre de cas particulier.
En utilisant le même modèle IBM granite-3-8b-instruct, des exemples de « problèmes » et leurs « classes » correspondantes sont fournis pour cette tâche.2 Les trois exemples d’entrée et de sortie qui sont fournis illustrent la stratégie d’apprentissage few-shot. En réponse à ce prompt, le modèle fait une prédiction raisonnable de la classe « Moyen » (comme indiqué en gras).
Remarque : le prompt a été exécuté avec IBM watsonx.ai Prompt Lab en mode « Freeform ».
Définis le nom de classe pour le problème décrit : Élevé, Moyen ou Faible. J’ai fourni quelques exemples de problèmes et les noms de classe correspondants. Prévois uniquement le nom de la classe pour le dernier problème. Fournis une brève description de la raison pour laquelle ce nom de classe a été choisi.
Nom de la classe : Élevé
Description : il s’agit d’un problème qui a un coût commercial élevé, qui affecte de nombreux utilisateurs ou les deux.
Nom de la classe : Moyen
Description : un problème qui se situe quelque part entre les niveaux élevé et bas.
Nom de la classe : Faible
Description : il s’agit d’un problème qui a un impact sur quelques utilisateurs, qui n’a pas de coût d’entreprise élevé, ou les deux.
Problème : les nouveaux utilisateurs signalent qu’ils ne peuvent pas créer de comptes.
Classe : Élevé
Problème : un utilisateur signale que les libellés se chevauchent dans la fonction analytique de l’application.
Classe : Faible
Problème : les utilisateurs aux États-Unis signalent que l’application se bloque lorsqu’ils tentent d’effectuer un achat.
Classe : Élevé
Problème : les utilisateurs signalent que les images ne se chargent pas dans l’application.
Classe : Moyen
Explication : le problème des images qui ne se chargent pas dans l’application a une incidence sur l’expérience des utilisateurs et peut engendrer de la frustration, mais cela n’a pas un coût élevé pour l’entreprise et n’affecte pas de nombreux utilisateurs. Elle est donc classée comme étant problème moyen.
L’apprentissage few-shot, qui est une stratégie dérivée du paradigme d’apprentissage few-shot, est généralement utilisé pour améliorer la performance du modèle par rapport à l’apprentissage zero-shot sur une tâche.1 Dans cet exemple, les modèles IA produisent des inférences utiles dans les scénarios d’apprentissage zero-shot et d’apprentissage few-shot. Pour décider d’utiliser l’apprentissage zero-shot ou l’apprentissage few-shot, il faut prendre en compte les contraintes du problème et les performances démontrées des deux stratégies. Reynolds et McDonell (2021) ont constaté qu’avec des améliorations de la structure des prompts, l’apprentissage zero-shot peut être plus performant que l’apprentissage few-shot dans certains scénarios.4 Schulhoff et al. (2024) trouvent des résultats différents en comparant les performances de plusieurs stratégies de prompting.5