O que é o prompt one-shot?

Autor(es):

Vrunda Gadesha

AI Advocate | Technical Content Author

O que é o prompt one-shot?

Prompt one-shot refere-se ao método em que um modelo recebe um único exemplo ou prompt para executar uma tarefa. Ao contrário de outras técnicas de engenharia de prompts, o prompt zero-shot, em que nenhum exemplo é fornecido, ou o prompt few-shot, em que alguns exemplos são fornecidos, o prompt one-shot depende de um prompt único e bem elaborado para obter a saída desejada. Esse método aproveita grandes modelos de linguagem (LLMs), como os modelos GPT-3/GPT-4 (Generative Pre-trained Transformer) da OpenAI ou os modelos IBM® Granite, para entender e gerar texto semelhante ao humano com base no mínimo de entradas.

O prompt one-shot é particularmente útil em cenários em que a coleta de grandes quantidades de dados de treinamento é impraticável. Por exemplo, em aplicações como prompt da cadeia de pensamento, prompt few-shot e prompt zero-shot, onde dados rotulados são limitados ou inexistentes, o prompt one-shot oferece uma vantagem significativa, permitindo que os modelos generalizem a partir de um único exemplo. Na Figura 1, a formação do prompt one-shot é ilustrada.

No campo em rápida evolução da inteligência artificial (IA) e do processamento de linguagem natural (NLP), especificamente na IA generativa, a engenharia de prompts tornou-se uma técnica fundamental. Entre os vários tipos de prompts, o prompt one-shot se destaca por sua eficiência e eficácia. Este artigo explora o conceito de prompt one-shot, seus mecanismos, aplicações, vantagens, limitações e perspectivas futuras.

Prompting é uma técnica usada em IA para guiar modelos de linguagem na geração de saídas desejadas. Existem diferentes tipos de prompting, incluindo prompts zero-shot, few-shot e one-shot. Cada tipo varia em termos da quantidade de dados e exemplos fornecidos ao modelo para executar uma tarefa específica. A engenharia de prompts envolve a elaboração desses prompts para otimizar o desempenho do modelo.

Mecanismos por trás do prompt one-shot

O prompt one-shot aproveita os recursos de grandes modelos de linguagem (LLMs) avançados avançados para gerar respostas coerentes e contextualmente apropriadas a partir de um único exemplo de prompt. Essa eficiência é possível graças a vários mecanismos subjacentes, entre eles o prompt de conhecimento, o prompt no contexto visual e a projeção de funcionalidades adaptativa. Enquanto alguns desses mecanismos, como prompts de conhecimento e projeção de funcionalidades adaptativa, são generalizados e podem ser aplicados a vários tipos de dados, como texto, imagem e vídeo, outros, como o prompt no contexto visual, são projetados especificamente para lidar com imagem ou dados de vídeo.

O prompt no contexto visual permite que o modelo interprete e responda com base em pistas visuais, o que é crucial para tarefas como reconhecimento de imagem ou análise de vídeo. Por outro lado, a solicitação de conhecimento e a projeção de funcionalidades adaptativa aprimoram a capacidade do modelo de entender e gerar respostas em diferentes tipos de entradas, tornando-o versátil em vários domínios.

Por exemplo, você precisa resumir um documento em francês para inglês e formatar a saída para uma API específica. Com o prompt one-shot, você pode fornecer um único exemplo de prompt, como: "Resuma este texto em francês para inglês usando o modelo de API {Title}, {Key Points}, {Summary}." O LLM usa seus recursos multilíngues e projeção de funcionalidades adaptativa para produzir o formato de saída desejado. No Python, esse processo pode ser automatizado integrando a resposta do modelo de IA generativa ao fluxo de trabalho da API.

Prompt de conhecimento

Esse método envolve o uso de bases de conhecimento externas ou corpora específicos de domínio pré-existentes para aprimorar a compreensão contextual do modelo e os recursos de tomada de decisão. Ao integrar gráficos de conhecimento estruturados ou propostas de texto enriquecidas com informações relacionadas à ação ou específicas da tarefa, o modelo pode recuperar efetivamente informações relevantes compatíveis com inferências mais precisas. Por exemplo, o embedding de corpora relacionado a ações, como sequências de tarefas ou eventos relevantes para o domínio, permite que o modelo generalize melhor para novas tarefas em cenários de aprendizado one-shot. Essa abordagem permite que o modelo preencha lacunas de conhecimento usando repositórios de informações predefinidas, melhorando sua capacidade de se adaptar e gerar respostas mais apropriadas ao contexto.[1] Essa técnica é particularmente poderosa quando combinada com LLMs de grande escala, pois mitiga a necessidade de grandes quantidades de dados de treinamento específicos da tarefa e, ao mesmo tempo, fornece saídas robustas.

Prompt no contexto visual

Essa técnica aproveita pistas visuais, como máscaras de segmentação, caixas delimitadoras ou pontos-chave, para orientar os modelos na compreensão e no processamento de dados de imagem ou vídeo de forma mais eficaz. No prompt no contexto visual, o modelo recebe uma imagem de referência ou um conjunto de segmentos de imagem que destacam regiões específicas de interesse, permitindo que ele se concentre nas principais funcionalidades visuais durante a inferência. Ao usar esses prompts visuais, o modelo pode entender melhor as relações espaciais, os limites e os elementos contextuais dentro da imagem, melhorando significativamente o desempenho em tarefas de visão. Demonstrou-se que essa abordagem aprimora os recursos de aprendizado zero-shot e one-shot, permitindo que o modelo generalize a partir do mínimo de exemplos em várias aplicações baseadas em visão, como detecção de objetos, classificação de imagens e segmentação.[2] Além disso, a técnica permite que o modelo refine suas previsões adaptando-se dinamicamente a novos contextos visuais com o mínimo de dados, tornando-o altamente eficaz em cenários com exemplos limitados de treinamento rotulado.

Projeção de funcionalidades adaptativa

No reconhecimento de ações one-shot, a projeção de funcionalidades adaptativa lida com o desafio de variações temporais nos dados de vídeo, alinhando e refinando os recursos extraídos ao longo do tempo. Este método envolve o pré-treinamento e o ajuste fino da rede de base para aprender um conjunto geral de funcionalidades e, em seguida, a aplicação de técnicas de adaptação de funcionalidades que permitem ao modelo ajustar dinamicamente suas representações de funcionalidades internas com base na progressão temporal do vídeo. Ao projetar as funcionalidades de entrada em um espaço que captura padrões espaciais e temporais, o modelo pode lidar melhor com a variabilidade nas sequências de ação, fornecendo exemplos como mudanças na velocidade de movimento ou interação de objetos. Essa abordagem melhora significativamente a capacidade do modelo de reconhecer ações de um único vídeo de treinamento, aprimorando sua generalização e precisão no reconhecimento de ações complexas em sequências de vídeo novas e não vistas.[3] A projeção de funcionalidades adaptativa é particularmente útil para lidar com a dinâmica temporal refinada de tarefas baseadas em vídeo, tornando-a um componente crítico para o reconhecimento de ação one-shot de alto desempenho.

Zoom de atenção

Essa estratégia aprimora o aprendizado one-shot com foco passo a passo na atenção do modelo nas regiões mais relevantes da entrada. Em tarefas de detecção de ação, o zoom de atenção é empregado por meio de mecanismos como atenção cruzada entre conjuntos de suporte e consultas. Essa abordagem permite que o modelo compare e alinhe funcionalidades de um vídeo de suporte (que contém o exemplo de ação) com um vídeo de consulta (onde a ação precisa ser detectada). Ao se concentrar em regiões temporais ou espaciais específicas que têm maior probabilidade de conter a ação relevante, o modelo gera propostas de ação de alta qualidade. Esse mecanismo de atenção cruzada permite que o modelo "aumente o zoom" em partes importantes da entrada, reduzindo o ruído e informações irrelevantes, e melhorando, assim, seu desempenho em cenários de aprendizado one-shot.[4] A técnica ajuda a reduzir os espaços de entradas complexos, permitindo um processamento mais eficiente do conjunto de consultas, mantendo a precisão, mesmo com o mínimo de exemplos de treinamento.

Esses mecanismos ilustram a adaptabilidade e robustez do prompt one-shot em diferentes domínios com exemplos específicos. Ao aproveitar técnicas avançadas de engenharia de prompts e integrar conhecimentos externos e sinais visuais, o prompt one-shot pode alcançar alta precisão e eficiência com o mínimo de entradas.

Vantagens e limitações do prompt one-shot

O prompt one-shot oferece benefícios significativos e alguns desafios, tornando-o uma técnica atraente, porém complexa, no campo da IA e do aprendizado de máquina. Veja a seguir uma análise detalhada de suas vantagens e limitações:

Vantagens

  • EficiênciaDados de treinamento reduzidos: o prompt one-shot requer significativamente menos dados de treinamento em comparação com os modelos tradicionais de aprendizado de máquina. Essa eficiência reduz os recursos computacionais e o tempo necessários para o treinamento. Por exemplo, em aplicações como reconhecimento de ações one-shot, os modelos podem obter alta precisão com o mínimo de dados de entrada.[3]
  • VelocidadeImplementação mais rápida: o prompt one-shot permite a rápida implementação de modelos de IA. Isso é particularmente benéfico em ambientes dinâmicos, onde a rápida adaptação a novas tarefas é crucial. A capacidade de gerar respostas de alta qualidade a partir de um único exemplo acelera o processo de implementação.[5]
  • FlexibilidadeAdaptabilidade a várias aplicações: o prompt one-shot é altamente adaptável a uma variedade de aplicações, desde chatbots para atendimento ao cliente a recomendações personalizadas. Essa flexibilidade o torna adequado para diversos casos de uso, incluindo cenários de aprendizado few-shot e zero-shot.[1]

Limitações

  • Potencial de viésViés herdado de dados pré-treinados: um dos desafios significativos do prompt one-shot é o potencial de viés. Como os modelos dependem fortemente de dados pré-treinados, eles podem herdar e perpetuar vieses presentes nos conjuntos de dados de treinamento. Isso pode afetar a imparcialidade e a precisão das saídas do modelo.[6]
  • PrecisãoVariabilidade no desempenho: embora o prompt one-shot possa ser altamente eficaz, ele nem sempre alcança o mesmo nível de precisão dos métodos que usam dados de treinamento extensos. Tarefas complexas que exigem compreensão e contexto detalhados podem representar desafios para modelos de prompt one-shot, levando a variabilidade no desempenho.[7]

Pense além dos prompts e tenha o contexto completo 

Fique à frente das últimas notícias do setor, ferramentas de IA e tendências emergentes em engenharia de prompts com o boletim informativo Think. Além disso, tenha acesso a novas explicações, tutoriais e insights, entregues diretamente na sua caixa de entrada. Consulte a declaração de privacidade da IBM.

Agradecemos a você! Você se inscreveu.

Casos de uso

O prompt one-shot é uma técnica poderosa que encontra vários exemplos e aplicações em uma ampla gama de setores e cenários. Ao aproveitar os recursos de grandes modelos de linguagem (LLMs) avançados e métodos sofisticados de prompts, o prompt one-shot pode melhorar significativamente a eficiência e o desempenho em diversas tarefas. Veja aqui alguns casos de uso notáveis:

1. Atendimento ao cliente e chatbots

O prompt one-shot pode melhorar muito o desempenho de chatbots e assistentes virtuais em cenários de atendimento ao cliente. Ao fornecer um exemplo único e bem elaborado, os chatbots podem ser treinados para lidar com consultas complexas, oferecer respostas personalizadas e melhorar a satisfação geral do cliente. Esse método reduz a necessidade de dados de treinamento extensos, permitindo a rápida implementação e adaptação a diferentes cenários de atendimento ao cliente.[6]

2. Criação e automação de conteúdo

No campo de criação e automação de conteúdo, o prompt one-shot pode ser usado para gerar artigos, relatórios e conteúdo criativo de alta qualidade com o mínimo de entradas. Isso é particularmente útil para profissionais de marketing, redatores e criadores de conteúdo, que precisam produzir grandes volumes de conteúdo de forma eficiente. Ao fornecer um único prompt, os modelos podem gerar conteúdo diversificado e contextualmente relevante, economizando tempo e recursos.[1]

3. Recomendações personalizadas

O prompt one-shot aprimora os sistemas de recomendação, gerando sugestões personalizadas com base em entradas limitadas. Por exemplo, plataformas de comércio eletrônico podem usar o prompt one-shot para fornecer recomendações personalizadas de produtos, melhorando a experiência e impulsionando as vendas. Esse método aproveita o mínimo de dados para produzir recomendações altamente precisas e relevantes.[7]

4. Reconhecimento de ação em vídeos

Na análise de vídeo, o prompt one-shot pode ser usado para tarefas de reconhecimento de ação, como a identificação de ações específicas em imagens de vigilância ou análise de dados esportivos. Ao fornecer um único exemplo de vídeo, os modelos podem aprender a reconhecer ações semelhantes em novos vídeos, mesmo sob condições variadas. Isso é particularmente valioso em aplicações como segurança, análise de desempenho esportivo e edição automatizada de vídeo.[3]

Assim, o prompt one-shot é um avanço significativo na IA, oferecendo soluções eficientes e flexíveis em vários domínios. À medida que a pesquisa continua a lidar com suas limitações, as potenciais aplicações e benefícios dessa técnica devem se expandir, contribuindo para a evolução dos sistemas inteligentes.

AI Academy

Torne-se um especialista em IA

Adquira conhecimento para priorizar os investimentos em IA que estimulam o crescimento dos negócios. Comece a usar hoje mesmo a nossa AI Academy sem custo e lidere o futuro da IA na sua organização.

Soluções relacionadas
IBM® watsonx.ai

Treine, valide, ajuste e implemente recursos de IA generativa, modelos de base e recursos de aprendizado de máquina com o IBM watsonx.ai, um estúdio empresarial de última geração para construtores de IA. Crie aplicações de IA em menos tempo com menos dados.

Explore o watsonx.ai
Soluções de inteligência artificial

Coloque a IA em ação na sua empresa com a experiência em IA líder do setor e com o portfólio de soluções da IBM.

Explore as soluções de IA
Consultoria e serviços em inteligência artificial (IA)

Os serviços de IA da IBM Consulting ajudam a reinventar a forma como as empresas trabalham com IA para gerar transformação.

Explore os serviços de IA
Dê o próximo passo

Ao utilizar a IA, o IBM Concert revela insights cruciais sobre suas operações e fornece recomendações específicas para cada aplicação com foco em melhorias. Descubra como o Concert pode impulsionar sua empresa.

Explorar Concert Explore as soluções de automação de processos de negócios