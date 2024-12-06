La generación aumentada por recuperación (RAG, por sus siglas en inglés) es una arquitectura que optimiza los resultados de un modelo de lenguaje grande utilizando referencias de una base de conocimientos autorizada. Esto aumenta los datos de entrenamiento con fuentes verificadas antes de que el modelo de lenguaje genere una respuesta. Los LLM se entrenan en grandes corpus y utilizan miles de millones de parámetros para generar resultados, pero es posible que no puedan acceder a información actualizada o precisa de sus corpus de entrenamiento. La RAG amplía las ya potentes capacidades de los LLM a un dominio específico sin necesidad de volver a entrenar el modelo. Es una forma poderosa y potencialmente rentable de mejorar los resultados de los LLM para que sigan siendo relevantes, precisos y útiles en diversos contextos.

En DSPy, se utiliza una arquitectura de RAG agregando un paso de contexto en el archivo Signature. Este paso recopila el contexto del modelo de recuperación y lo agrega a la instrucción del modelo de lenguaje para, con suerte, generar una mejor respuesta.

class GenerateAnswer(dspy.Signature):

“””Answer questions with short factoid answers.”””



context = dspy.InputField(desc=”may contain relevant facts”)

question = dspy.InputField()

answer = dspy.OutputField(desc=”often between 1 and 5 words”)

Esa firma newGenerateAnswer se puede usar con su modelo de RAG. Se pasa GenerateAnswer al módulo `ChainOfThought` para que el contexto recuperado y la pregunta y respuesta utilicen un enfoque de Chain of Thought.

También actualiza el método forward para generar pasajes de contexto a partir de la RAG y utilizar esos pasajes contextuales para generar respuestas. DSPy llamará a este método `forward` cada vez que genere una nueva respuesta a una pregunta, recopilando tanto el contexto del conjunto de datos de resúmenes de ColBERT Wiki 17 como luego pasando ese contexto al modelo de lenguaje, en este caso, Llama 3.1. A medida que se genera cada respuesta, DSPy comparará el resultado con el resultado deseado para garantizar que las instrucciones ayuden al modelo a generar las respuestas correctas.

class RAG(dspy.Module):

def __init__(self, num_passages=3):

super().__init__()



self.retrieve = dspy.Retrieve(k=num_passages)

self.generate_answer = dspy.ChainOfThought(GenerateAnswer)



def forward(self, question):

context = self.retrieve(question).passages

prediction = self.generate_answer(context=context, question=question)

return dspy.Prediction(context=context, answer=prediction.answer)

Para ayudar a DSPy a diseñar las mejores instrucciones para nosotros, necesita un conjunto de datos de prueba que pueda usar para probar las instrucciones y luego evaluarlas.

Para dar preguntas de prueba de DSPy, cargará el conjunto de datos de HotPotQA. HotpotQA es un conjunto de datos de respuesta a preguntas que presenta preguntas naturales multi-hop que requieren múltiples recuperaciones e inferencias para llegar a la respuesta correcta. Es una gran herramienta para probar qué tan bien los modelos generan hechos de apoyo para entrenar y probar sistemas de respuesta a preguntas más explicables.

Por ejemplo, una pregunta del conjunto de datos es: "¿A quién nombró el presidente Franklin Roosevelt como responsable de transmitir los votos del Colegio Electoral al Congreso?" Puede ver que esta pregunta requiere varios datos para responder correctamente.

The answer is: “Robert Digges Wimberly Connor”.

El contexto de apoyo proviene de páginas de Wikipedia sobre Robert Digges Wimberly Connor y sobre la National Archives and Records Administration.

HotPotQA es recopilado y publicado por un equipo de investigadores de PLN de la Universidad Carnegie Mellon, la Universidad de Stanford y la Universidad de Montreal. Hay más información sobre HotPotQA en su sitio de GitHub.

Después de cargar el conjunto de datos, divídalo en conjuntos de entrenamiento y de prueba. Esto le permite probar la cadena de recuperación y ayudar a DSPy a localizar las mejores instrucciones para el modelo de lenguaje.

# Load the dataset.

dataset = HotPotQA(train_seed=1, train_size=20, eval_seed=2023, dev_size=50, test_size=0)



# Tell DSPy that the ‘question’ field is the input. Any other fields are labels and/or metadata.

trainset = [x.with_inputs(‘question’) for x in dataset.train]

devset = [x.with_inputs(‘question’) for x in dataset.dev]

A continuación, pondrá en marcha más ejemplos para que DSPy tenga más oportunidades de generar instrucciones y evaluarlas. Callingcompile es lo que utiliza toda la arquitectura que ha configurado, así como el conjunto de datos de HotPotQA para generar y probar instrucciones y obtener el mejor rendimiento de su modelo de lenguaje.

from dspy.teleprompt import BootstrapFewShot



# Validation logic: check that the predicted answer is correct.

# Also check that the retrieved context does actually contain that answer.

def validate_context_and_answer(example, pred, trace=None):

answer_EM = dspy.evaluate.answer_exact_match(example, pred)

answer_PM = dspy.evaluate.answer_passage_match(example, pred)

return answer_EM and answer_PM



# Set up a basic DSPy optimizer, which will compile your RAG program.

bfs_optimizer = BootstrapFewShot(metric=validate_context_and_answer)



# Compile!

compiled_rag = bfs_optimizer.compile(RAG(), trainset=trainset)

Ahora que DSPy ha realizado la ingeniería rápida para usted, la probará con la pregunta personalizada sobre el Premio Nobel 2006 que utilizó anteriormente. Debido a que el modelo de recuperación utiliza extractos de Wikipedia de 2017, funcionará mejor con el conocimiento que podría estar presente en ese corpus:

# Get the prediction. This contains `pred.context` and `pred.answer`.

pred = compiled_rag(test_question)



# Print the contexts and the answer.

print(f”Question: {test_question}”)

print(f”Predicted Answer: {pred.answer}”)

Ahora obtiene la respuesta correcta.

Pregunta: ¿De qué país era el ganador del Premio Nobel de Literatura en 2006 y cuál era su nombre? Respuesta prevista: Turquía, Orhan Pamuk

Orhan Pamuk es de Turquía, por lo que esta respuesta es correcta. La versión compilada de DSPy no solo obtuvo la respuesta correcta, sino que también la enmarcó correctamente, respondiendo con una respuesta breve y clara. Veamos el contexto de esta respuesta prevista para ver cómo el modelo llegó a la respuesta correcta:

pred.context

Esto devuelve:

["Orhan Pamuk | Ferit Orhan Pamuk (generalmente conocido simplemente como Orhan Pamuk; nacido el 7 de junio de 1952) es un novelista, guionista, académico y ganador del Premio Nobel de Literatura 2006 turco. Uno de los novelistas más destacados de Turquía, su obra ha vendido más de trece millones de libros en sesenta y tres idiomas, lo que lo convierte en el escritor más vendido del país"., 'Premios Palanca 2006 | Los ganadores de los Premios Carlos Palanca Memorial de Literatura en el año 2006 (rango, título de la entrada ganadora, nombre del autor).', "Miguel Donoso Pareja | Miguel Donoso Pareja (13 de julio de 1931 - 16 de marzo de 2015) fue un escritor ecuatoriano y ganador del Premio Eugenio Espejo 2006 (Premio Nacional de Literatura de Ecuador, otorgado por el Presidente de Ecuador)."]

La respuesta está en el primer fragmento de contexto devuelto. Puede ver cómo DSPy diseñó instrucciones óptimas observando el historial del modelo de lenguaje utilizando el método inspect_history() del modelo de lenguaje.

lm.inspect_history()

Esta historia es muy larga, ya que incluye todos los ejemplos del proceso de compilación en los que DSPy probó las instrucciones generadas. La última parte del historial muestra cómo el modelo llegó a la respuesta correcta y en el formato correcto:

[[ ## context ## ]] [1] «Orhan Pamuk | Ferit Orhan Pamuk (generalmente conocido como Orhan Pamuk; nacido el 7 de junio de 1952) es un novelista, guionista, académico turco y ganador del Premio Nobel de Literatura 2006. Uno de los novelistas más destacados de Turquía, su obra ha vendido más de trece millones de libros en sesenta y tres idiomas, lo que lo convierte en el escritor más vendido del país.» [2] «Premios Palanca 2006 | Los ganadores de los Premios Carlos Palanca Memorial de Literatura en el año 2006 (rango, título de la obra ganadora, nombre del autor).» [3] «Miguel Donoso Pareja | Miguel Donoso Pareja (13 de julio de 1931 - 16 de marzo de 2015) fue un escritor ecuatoriano y ganador del Premio Eugenio Espejo 2006 (Premio Nacional de Literatura de Ecuador, otorgado por el Presidente de Ecuador).» [[ ## question ## ]] ¿De qué país era el ganador del Premio Nobel de Literatura en 2006 y cuál era su nombre? Responda con los campos de salida correspondientes, comenzando con el campo `[[ ## reasoning ## ]]`, then `[[ ## answer ## ]]`, y luego terminando con el marcador para `[[ ## completaded # # ]]`. [31mResponse:[0m [32m[[ ## reasoning ## ]] El texto menciona el Premio Nobel de Literatura 2006 y afirma que Orhan Pamuk, un novelista turco, fue el ganador. [[ ## answer ## ]] Turquía, Orhan Pamuk [[ ## completed ## ]][0m

Puede ver que DSPy utilizó el modelo para generar la instrucción:

Responda con los campos de salida correspondientes, comenzando con el campo [[ ## reasoning ## ]] , entonces [[ ## answer ## ]] , y luego termina con el marcador para [[ ## completed ## ]] .

Esto lleva a la respuesta y al encuadre correctos.