La generación aumentada por recuperación (RAG) es una arquitectura que optimiza el output de un modelo de lenguaje grande utilizando referencias de una base de conocimiento autorizada. Esto aumenta los datos de entrenamiento con fuentes verificadas antes de que el modelo de lenguaje genere una respuesta. Los LLM se entrenan en grandes corpus y utilizan miles de millones de parámetros para generar resultados, pero es posible que no puedan acceder a información actualizada o precisa de sus corpus de entrenamiento. RAG amplía las ya potentes capacidades de los LLM a un dominio específico sin necesidad de volver a entrenar el modelo. Es una forma potente y potencialmente rentable de mejorar los outputs de los LLM para que sigan siendo relevantes, precisos y útiles en diversos contextos.

En DSPy, se utiliza una arquitectura RAG añadiendo un paso de contexto en Signature. Este paso recopila el contexto del modelo de recuperación y lo añade a la instrucción del modelo de lenguaje para, con suerte, provocar una mejor respuesta.

class GenerateAnswer(dspy.Signature):

“””Answer questions with short factoid answers.”””



context = dspy.InputField(desc=”may contain relevant facts”)

question = dspy.InputField()

answer = dspy.OutputField(desc=”often between 1 and 5 words”)

Esa firma newGenerateAnswer se puede utilizar con su modelo RAG. Pase theGenerateAnswer al módulo 'ChainOfThought' para que el contexto recuperado y la pregunta y la respuesta utilicen un enfoque de cadena de pensamiento.

También actualiza el método forward para generar pasajes contextuales a partir del RAG y utiliza esos pasajes contextuales para generar respuestas. DSPy llamará a este método `forward` cada vez que genere una nueva respuesta a una pregunta, recopilando tanto el contexto del conjunto de datos de resúmenes ColBERT Wiki 17 como luego pasando ese contexto al modelo de lenguaje, en este caso, Llama 3.1. A medida que se genera cada respuesta, DSPy comparará el resultado con el resultado deseado para asegurarse de que las instrucciones ayuden al modelo a generar las respuestas correctas.

class RAG(dspy.Module):

def __init__(self, num_passages=3):

super().__init__()



self.retrieve = dspy.Retrieve(k=num_passages)

self.generate_answer = dspy.ChainOfThought(GenerateAnswer)



def forward(self, question):

context = self.retrieve(question).passages

prediction = self.generate_answer(context=context, question=question)

return dspy.Prediction(context=context, answer=prediction.answer)

Para ayudar a DSPy a diseñar las mejores instrucciones para nosotros, necesita un conjunto de datos de prueba que pueda utilizar para probar las instrucciones y luego evaluarlas.

Para hacer preguntas de prueba de DSPy, deberá cargar el conjunto de datos HotPotQA. HotpotQA es un conjunto de datos de respuesta a preguntas que presenta preguntas naturales de varios saltos que requieren múltiples recuperaciones e inferencias para llegar a la respuesta correcta. Es una gran herramienta para probar cómo los modelos generan hechos de apoyo para entrenar y probar sistemas de respuesta a preguntas más explicables.

Por ejemplo, una pregunta del conjunto de datos es: "¿A quién nombró el presidente Franklin Roosevelt para que fuera responsable de transmitir los votos del Colegio Electoral al Congreso?" Como puede ver, esta pregunta requiere varios datos para responderla correctamente.

The answer is: “Robert Digges Wimberly Connor”.

El contexto de apoyo proviene de las páginas de Wikipedia sobre Robert Digges Wimberly Connor y sobre la Administración Nacional de Archivos y Registros.

HotPotQA es recopilado y publicado por un equipo de investigadores de PLN de la Universidad Carnegie Mellon, la Universidad de Stanford y la Universidad de Montreal. Más información sobre HotPotQA está disponible en su sitio de GitHub.

Después de cargar el conjunto de datos, divídalo en conjuntos de entrenar y de prueba. Esto le permite probar la cadena de recuperación y ayudar a DSPy a localizar las mejores instrucciones para el modelo de lenguaje.

# Load the dataset.

dataset = HotPotQA(train_seed=1, train_size=20, eval_seed=2023, dev_size=50, test_size=0)



# Tell DSPy that the ‘question’ field is the input. Any other fields are labels and/or metadata.

trainset = [x.with_inputs(‘question’) for x in dataset.train]

devset = [x.with_inputs(‘question’) for x in dataset.dev]

A continuación, realizará el bootstrapping de más ejemplos para dar a DSPy más oportunidades de generar instrucciones y evaluarlas. Callingcompile es lo que utiliza toda la arquitectura que ha configurado, así como el conjunto de datos HotPotQA, para generar y probar instrucciones y obtener el mejor rendimiento de su modelo de lenguaje.

from dspy.teleprompt import BootstrapFewShot



# Validation logic: check that the predicted answer is correct.

# Also check that the retrieved context does actually contain that answer.

def validate_context_and_answer(example, pred, trace=None):

answer_EM = dspy.evaluate.answer_exact_match(example, pred)

answer_PM = dspy.evaluate.answer_passage_match(example, pred)

return answer_EM and answer_PM



# Set up a basic DSPy optimizer, which will compile your RAG program.

bfs_optimizer = BootstrapFewShot(metric=validate_context_and_answer)



# Compile!

compiled_rag = bfs_optimizer.compile(RAG(), trainset=trainset)

Ahora que DSPy ha realizado el prompt engineering por usted, lo probará con la pregunta personalizada sobre el Premio Nobel de 2006 que utilizó anteriormente. Dado que el modelo de recuperación utiliza extractos de Wikipedia de 2017, funcionará mejor con el conocimiento que pueda estar presente en ese corpus:

# Get the prediction. This contains `pred.context` and `pred.answer`.

pred = compiled_rag(test_question)



# Print the contexts and the answer.

print(f”Question: {test_question}”)

print(f”Predicted Answer: {pred.answer}”)

Ahora obtendrá la respuesta correcta.

Question: What country was the winner of the Nobel Prize in Literature in 2006 from and what was their name? Predicted Answer: Turkey, Orhan Pamuk

Orhan Pamuk es de Turquía, por lo que esta respuesta es correcta. La versión compilada de DSPy no solo dio la respuesta correcta, sino que también la enmarcó correctamente, respondiendo con una respuesta breve y clara. Veamos el contexto de esta respuesta prevista para ver cómo el modelo llegó a la respuesta correcta:

pred.context

Esto devuelve:

["Orhan Pamuk | Ferit Orhan Pamuk (generally known simply as Orhan Pamuk; born 7 June 1952) is a Turkish novelist, screenwriter, academic and recipient of the 2006 Nobel Prize in Literature. One of Turkey's most prominent novelists, his work has sold over thirteen million books in sixty-three languages, making him the country's best-selling writer.", '2006 Palanca Awards | The Carlos Palanca Memorial Awards for Literature winners in the year 2006 (rank, title of winning entry, name of author).', "Miguel Donoso Pareja | Miguel Donoso Pareja (July 13, 1931 – March 16, 2015) was an Ecuadorian writer and 2006 Premio Eugenio Espejo Award-winner (Ecuador's National Prize in literature, given by the President of Ecuador)."]

La respuesta está en el primer fragmento de contexto devuelto. Puede ver cómo DSPy diseñó instrucciones óptimas observando el historial del modelo de lenguaje utilizando el método inspect_history() del modelo de lenguaje.

lm.inspect_history()

Este historial es muy largo, ya que incluye todos los ejemplos del proceso de compilación en los que DSPy probó sus instrucciones generadas. La última parte del historial muestra cómo el modelo llegó a la respuesta correcta y en el formato correcto:

[[ ## context ## ]] [1] «Orhan Pamuk | Ferit Orhan Pamuk (generally known simply as Orhan Pamuk; born 7 June 1952) is a Turkish novelist, screenwriter, academic and recipient of the 2006 Nobel Prize in Literature. One of Turkey's most prominent novelists, his work has sold over thirteen million books in sixty-three languages, making him the country's best-selling writer.» [2] «2006 Palanca Awards | The Carlos Palanca Memorial Awards for Literature winners in the year 2006 (rank, title of winning entry, name of author).» [3] «Miguel Donoso Pareja | Miguel Donoso Pareja (July 13, 1931 – March 16, 2015) was an Ecuadorian writer and 2006 Premio Eugenio Espejo Award-winner (Ecuador's National Prize in literature, given by the President of Ecuador).» [[ ## question ## ]] What country was the winner of the Nobel Prize in Literature in 2006 from and what was their name? Respond with the corresponding output fields, starting with the field `[[ ## reasoning ## ]]`, then `[[ ## answer ## ]]`, and then ending with the marker for `[[ ## completed ## ]]`. [31mResponse:[0m [32m[[ ## reasoning ## ]] The text mentions the 2006 Nobel Prize in Literature and states that Orhan Pamuk, a Turkish novelist, was the winner. [[ ## answer ## ]] Turkey, Orhan Pamuk [[ ## completed ## ]][0m

Puede ver que DSPy utilizó el modelo para generar la instrucción:

Responda con los campos de resultado correspondientes, comenzando por el campo [[ ## reasoning ## ]] , entonces [[ ## answer ## ]] y, a continuación, termine con el marcador de [[ ## completed ## ]] .

Esto conduce a la respuesta correcta y al encuadre adecuado.