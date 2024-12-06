A geração aumentada de recuperação (RAG) é uma arquitetura que otimiza a saída de um grande modelo de linguagem usando referências de uma base de conhecimento confiável. Isso aumenta os dados de treinamento com fontes verificadas antes que o modelo de linguagem gere uma resposta. Os LLMs são treinados em grandes corporações e usam bilhões de parâmetros para gerar a saída, mas podem não conseguir acessar informações atualizadas ou precisas de seus corpus de treinamento. A RAG estende os recursos já poderosos dos LLMs para um domínio específico sem exigir que o modelo seja retreinado. É uma maneira poderosa e potencialmente econômica de melhorar as saídas dos LLMs para que permaneçam relevantes, precisos e úteis em vários contextos.

No DSPy, você utiliza uma arquitetura de RAG adicionando uma etapa de contexto na assinatura. Essa etapa reúne o contexto do modelo de recuperação e o adiciona à solicitação do modelo de linguagem para obter uma resposta melhor.

class GenerateAnswer(dspy.Signature):

“””Answer questions with short factoid answers.”””



context = dspy.InputField(desc=”may contain relevant facts”)

question = dspy.InputField()

answer = dspy.OutputField(desc=”often between 1 and 5 words”)

Essa assinatura do newGenerateAnswer pode ser usada com seu modelo de RAG. Você passa o theGenerateAnswer para o módulo "ChainOfThought" para que o contexto recuperado e a pergunta e a resposta usem uma abordagem da cadeia de pensamento.

Você também atualiza o método theforward para gerar passagens de contexto a partir da RAG e usa essas passagens contextuais para gerar respostas. O DSPy chamará esse método "forward" cada vez que gera uma nova resposta em resposta a uma pergunta, reunindo o contexto do conjunto de dados de resumos ColBERT Wikipedia 17 e, em seguida, passando esse contexto para o modelo de linguagem, neste caso, o Llama 3.1. À medida que cada resposta é gerada, o DSPy compara a saída com o resultado desejado para garantir que os prompts estejam auxiliando o modelo a gerar as respostas corretas.

class RAG(dspy.Module):

def __init__(self, num_passages=3):

super().__init__()



self.retrieve = dspy.Retrieve(k=num_passages)

self.generate_answer = dspy.ChainOfThought(GenerateAnswer)



def forward(self, question):

context = self.retrieve(question).passages

prediction = self.generate_answer(context=context, question=question)

return dspy.Prediction(context=context, answer=prediction.answer)

Para ajudar o DSPy a criar os melhores prompts para nós, você precisa de um conjunto de dados que ele possa usar para testar os prompts e, depois, avaliá-los.

Para fornecer perguntas de teste ao DSPy, você carrega o conjunto de dados HotPotQA. O HotpotQA é um conjunto de dados de respostas a perguntas que apresenta perguntas naturais com vários saltos que exigem várias recuperações e inferências para chegar à resposta correta. É uma ótima ferramenta para testar o quão bem os modelos geram fatos corroboradores para treinar e testar sistemas de respostas a perguntas mais explicáveis.

Por exemplo, uma pergunta do conjunto de dados é: "Quem o presidente Franklin Roosevelt nomeou como responsável pela transmissão dos votos do Colegiado Eleitoral para o Congresso?" Você pode ver que essa pergunta requer várias informações para ser respondida corretamente.

The answer is: “Robert Digges Wimberly Connor”.

O contexto corroborador vem de páginas da Wikipedia sobre Robert Digges Wimberly Connor e sobre a National Archives and Records Administration.

O HotPotQA é coletado e publicado por uma equipe de pesquisadores de NLP da Carnegie Mellon University, Stanford University e Universite de Montreal. Mais informações sobre o HotPotQA estão disponíveis no site do GitHub.

Depois de carregar o conjunto de dados, divida-o em conjuntos de treino e teste. Isso permite testar a cadeia de recuperação e ajudar o DSPy a localizar os melhores prompts para o modelo de linguagem.

# Load the dataset.

dataset = HotPotQA(train_seed=1, train_size=20, eval_seed=2023, dev_size=50, test_size=0)



# Tell DSPy that the ‘question’ field is the input. Any other fields are labels and/or metadata.

trainset = [x.with_inputs(‘question’) for x in dataset.train]

devset = [x.with_inputs(‘question’) for x in dataset.dev]

Em seguida, você fará bootstrapping de mais exemplos para dar ao DSPy mais oportunidades de gerar prompts e avaliá-los. O Callingcompile é o que usa toda a arquitetura que você configurou, bem como o conjunto de dados do HotPotQA para gerar e testar prompts e obter o melhor desempenho de seu modelo de linguagem.

from dspy.teleprompt import BootstrapFewShot



# Validation logic: check that the predicted answer is correct.

# Also check that the retrieved context does actually contain that answer.

def validate_context_and_answer(example, pred, trace=None):

answer_EM = dspy.evaluate.answer_exact_match(example, pred)

answer_PM = dspy.evaluate.answer_passage_match(example, pred)

return answer_EM and answer_PM



# Set up a basic DSPy optimizer, which will compile your RAG program.

bfs_optimizer = BootstrapFewShot(metric=validate_context_and_answer)



# Compile!

compiled_rag = bfs_optimizer.compile(RAG(), trainset=trainset)

Agora que o DSPy fez a engenharia de prompts para você, você a testará com a pergunta personalizada sobre o Prêmio Nobel de 2006 que usou antes. Como o modelo de recuperação está usando extratos da Wikipedia de 2017, ele terá o melhor desempenho com o conhecimento que possa estar presente nesse corpus:

# Get the prediction. This contains `pred.context` and `pred.answer`.

pred = compiled_rag(test_question)



# Print the contexts and the answer.

print(f”Question: {test_question}”)

print(f”Predicted Answer: {pred.answer}”)

Agora você recebe a resposta correta.

Pergunta: De que país foi o vencedor do prêmio Nobel de literatura em 2006 e qual era seu nome? Resposta prevista: Turquia, Orhan Pamuk

Orhan Pamuk é da Turquia e, portanto, essa resposta está correta. A versão compilada do DSPy não só obteve a resposta correta, como também a enquadrou corretamente, respondendo com uma resposta curta e clara. Vamos ver o contexto dessa resposta prevista para ver como o modelo chegou à resposta correta:

pred.context

Isso retorna:

["Orhan Pamuk | Ferit Orhan Pamuk (conhecido em geral simplesmente como Orhan Pamuk; nascido em 7 de junho de 1952) é um romancista, roteirista e acadêmico turco e ganhador do Prêmio Nobel de Literatura de 2006. Um dos romancistas mais proeminentes da Turquia, sua obra vendeu mais de 13 milhões de livros em 63 idiomas, tornando-o o escritor mais vendido do país.", "2006 Palanca Awards | Os vencedores do Carlos Palanca Memorial Awards for Literature no ano de 2006 (classificação, título do trabalho vencedor, nome do autor).", "Miguel Donoso Pareja | Miguel Donoso Pareja (13 de julho de 1931 - 16 de março de 2015) foi um escritor equatoriano e vencedor do Prêmio Eugenio Espejo de 2006 (Prêmio Nacional do Equador em literatura, concedido pelo Presidente do Equador)."]

A resposta está na primeira parte do contexto retornado. Você pode ver como o DSPy criou prompts ideais examinando o histórico do modelo de linguagem usando o método inspect_history() do modelo de linguagem.

lm.inspect_history()

Esse histórico é muito longo, pois inclui todos os exemplos do processo de compilação em que o DSPy testou seus prompts gerados. A última parte do histórico mostra como o modelo chegou à resposta certa e no formato correto:

[[ ## context ## ]][1] "Orhan Pamuk | Ferit Orhan Pamuk (conhecido em geral simplesmente como Orhan Pamuk; nascido em 7 de junho de 1952) é um romancista, roteirista e acadêmico turco e ganhador do Prêmio Nobel de Literatura de 2006. Um dos romancistas mais proeminentes da Turquia, sua obra vendeu mais de 13 milhões de livros em 63 idiomas, tornando-o o escritor mais vendido do país." [2] "2006 Palanca Awards | Os vencedores do Carlos Palanca Memorial Awards for Literature no ano de 2006 (classificação, título do trabalho vencedor, nome do autor)." [3] Miguel Donoso Pareja | Miguel Donoso Pareja (13 de julho de 1931 - 16 de março de 2015) foi um escritor equatoriano e vencedor do Prêmio Eugenio Espejo de 2006 (Prêmio Nacional do Equador em literatura, concedido pelo Presidente do Equador)." [[ ## question ## ]] De que país foi o vencedor do prêmio Nobel de literatura em 2006 e qual era seu nome? Responda com os campos de saída correspondentes, começando com o campo "[[ ## thinking ## ]]", depois "[[ ## answer ## ]]" e terminando com o marcador para "[[ ## completed ## ]]`. [31mResponse:[0m [32m[[ ## thinking ## ]] O texto menciona o Prêmio Nobel de Literatura de 2006 e afirma que Orhan Pamuk, um romancista turco, foi o vencedor. [[ ## answer ## ]] Turquia, Orhan Pamuk [[ ## completed ## ]][0m

Você pode ver que o DSPy usou o modelo para gerar o prompt:

Responda com os campos de saída correspondentes, começando pelo campo [[ ## reasoning ## ]] , então [[ ## answer ## ]] e terminando com o marcador para [[ ## completed ## ]] .

Isso leva à resposta e ao enquadramento corretos.