O DSPy pode ser útil em vários tipos diferentes de fluxos de trabalho e cenários. Alguns dos mais comumente usados são geração aumentada de recuperação, resposta a perguntas com múltiplos saltos e sumarização de documentos.

Cadeia de pensamento

O prompt da cadeia de pensamento (CoT) simula processos de raciocínio semelhantes aos humanos, pedindo ao modelo que decomponha tarefas complexas em uma sequência de etapas lógicas em direção a uma resolução final. Essas etapas de raciocínio são alimentadas na janela de contexto do modelo, proporcionando mais fundamentação na tarefa em questão e, muitas vezes, levando a melhores respostas, mesmo em cenários complexos. O DSPy ajuda fazendo com que o modelo de linguagem gere prompts da cadeia de pensamento e estratégias e testando aqueles com o modelo de linguagem para gerar os prompts de CoT mais eficazes para o modelo fornecido.

Geração aumentada de recuperação

A geração aumentada de recuperação (RAG) é uma abordagem que permite que os LLMs aproveitem um grande corpus de conhecimento de fontes e consultem seu armazenamento de conhecimento para encontrar passagens ou conteúdo relevantes e produzir uma resposta bem refinada. A RAG garante que os LLMs possam usar dinamicamente o conhecimento em tempo real, mesmo que não tenham sido treinados originalmente no assunto, e deem respostas corretas. Esse poder adicional leva a uma maior complexidade na configuração dos pipelines de RAG. O DSPy oferece uma abordagem sem dificuldades para configurar pipelines de prompts e gerar prompts eficazes (ajuste de prompts) ou, no caso de modelos menores, realizar o ajuste fino dos próprios pesos do modelo.

Os pipelines de RAG podem ser otimizados com o DSPy de duas maneiras: usando exemplos rotulados ou usando exemplos de bootstrap. Os exemplos rotulados são simplesmente preexistentes; os exemplos rotulados manualmente são usados para treinar diretamente o modelo aluno. Bootstraps, no contexto do DSPy, significa usar um modo de linguagem em um paradigma de professor e aluno. O professor gera novos exemplos de treinamento com base em alguns prompts fornecidos pelo usuário. Esses exemplos de bootstrap são usados juntamente com ou em vez dos exemplos rotulados manualmente para treinar o módulo aluno até que ele forneça as respostas corretas. Os prompts que geram as respostas corretas são, então, atualizados de forma iterativa em todo o pipeline do DSPy.

Respostas a perguntas com vários saltos

Muitas vezes, uma única consulta de pesquisa não é suficiente para uma tarefa complexa de resposta a perguntas. O popular conjunto de dados de resposta a perguntas do HotPot consiste em perguntas que exigem várias análises e recuperações de perguntas antes de poderem ser respondidas. Por exemplo: "Bill Nelson voou como especialista em carga em um ônibus espacial lançado pela primeira vez em que ano?" Esta resposta requer saber que Bill Nelson voou no ônibus espacial Columbia e, em seguida, ser capaz de determinar que o Columbia voou pela primeira vez em 1981.

A abordagem padrão para esse desafio na literatura de recuperação aumentada é a construção de um sistema de busca de vários saltos. Esses sistemas leem os resultados recuperados e geram consultas adicionais para reunir informações adicionais quando necessário, antes de chegar a uma resposta final. Usando o DSPy, você pode criar o mesmo sistema em algumas linhas de código de uma forma robusta, permitindo atualizar modelos e simplesmente executar novamente seu pipeline.

Sumarização

A sumarização condensa um trecho mais longo de texto em uma versão mais curta, enquanto retém as informações e as ideias principais. É uma habilidade poderosa para um LLM fazer bem, com aplicações que vão desde a criação de resumos de artigos até a geração de relatórios concisos a partir de documentos longos.

Avaliar a qualidade dos resumos produzidos por modelos de linguagem apresenta desafios significativos. Ao contrário de tarefas com respostas certas ou erradas, a qualidade da sumarização geralmente é subjetiva e dependente do contexto. O modelo precisa equilibrar a retenção de informações com a concisão, preservando o tom e a intenção do texto original, e garantindo a precisão dos fatos sem introduzir erros. A adaptação a diferentes tipos de material de origem e fins de resumo apresenta um desafio adicional. O DSPy permite que você use dados rotulados para ajustar os prompts de sumarização para obter as melhores respostas possíveis.