Ao contrário do prompt zero-shot, o prompt few-shot fornece ao modelo exemplos de entradas e saídas esperadas para a tarefa.1 A imagem anterior diagrama a diferença entre o prompt zero-shot e o prompt few-shot, com o prompt one-shot também mostrado como um caso especial.
Utilizando o mesmo modelo IBM granite-3-8b-instruct, são fornecidos exemplos de "Problemas" e suas "Classes" correspondentes para esta tarefa.2 Os três exemplos de entradas e saídas apresentados ilustram a estratégia de prompt few-shot. Em resposta a esse prompt, o modelo faz uma previsão razoável da classe "Média" (conforme destacado em negrito).
Observação: o prompt foi executado com o IBM watsonx.ai Prompt Lab usando o modo "Freeform".
Defina o nome da Classe para o problema descrito como Alto, Médio ou Baixo. Forneci alguns exemplos de problemas e os nomes de Classes correspondentes. Preveja apenas o nome da Classe do último problema. Forneça uma breve descrição do motivo pelo qual o nome da Classe foi escolhido.
Nome da classe: Alto
Descrição: um problema que tem um alto custo comercial, afeta muitos usuários ou ambos.
Nome da classe: Médio
Descrição: um problema que fica entre alto e baixo.
Nome da classe: Baixo
Descrição: um problema que afeta alguns usuários, não tem um alto custo comercial ou ambos.
Problema: novos usuários relatam que não conseguem criar contas.
Classe: Alto
Problema: um usuário relata que os rótulos estão renderizando sobreposições na função de análise de dadosdo aplicativo.
Classe: Baixo
Problema: usuários nos Estados Unidos estão relatando que o aplicativo está falhando ao tentar fazer uma compra.
Classe: Alto
Problema: os usuários relatam que as imagens não estão carregando no aplicativo.
Classe: Médio
Explicação: o problema das imagens não carregarem no aplicativo afeta a experiência dos usuários e pode causar frustração, mas não tem um alto custo comercial ou afeta muitos usuários. Portanto, está classificado como um problema de nível Médio.
O prompt few-shot, que é uma estratégia derivada do paradigma de aprendizado few-shot , normalmente é usado para melhorar o desempenho do modelo em relação ao prompt zero-shot em uma tarefa.1 Neste exemplo, o modelo de IA produz inferências úteis tanto no cenário zero-shot quanto no few-shot. Ao se decidir se deve ser usado o prompt zero-shot ou o prompt few-shot, deve-se considerar as restrições do problema e o desempenho demonstrado de ambas as estratégias. Reynolds e McDonell (2021) descobriram que, com melhorias na estrutura do prompt, o prompt zero-shot pode superar o prompt few-shot em alguns cenários.4 Schulhoff et al. (2024) encontram resultados diferentes comparando o desempenho de várias estratégias de prompts.5