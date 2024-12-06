Pembuatan respons dengan pengambilan data yang ditingkatkan (RAG) adalah arsitektur yang mengoptimalkan output model bahasa besar menggunakan referensi dari basis pengetahuan otoritatif. Kerangka kerja ini meningkatkan data pelatihan dengan sumber terverifikasi sebelum model bahasa menghasilkan respons. LLM dilatih pada korpus besar dan menggunakan miliaran parameter untuk menghasilkan output, tetapi mereka mungkin tidak dapat mengakses informasi terkini atau akurat dari korpus pelatihan mereka. RAG memperluas kemampuan LLM yang sudah sangat tangguh ke domain tertentu tanpa mengharuskan pelatihan ulang pada model. Ini adalah cara yang ampuh dan berpotensi hemat biaya untuk meningkatkan output LLM sehingga tetap relevan, akurat, dan berguna dalam berbagai konteks.

Di DSPy, Anda menggunakan arsitektur RAG dengan menambahkan langkah konteks di Deskripsi Spesifik. Langkah ini mengumpulkan konteks dari model pengambilan dan menambahkannya ke dalam prompt pada model bahasa dan berharap mendapatkan respons yang lebih baik.

class GenerateAnswer(dspy.Signature):

“””Answer questions with short factoid answers.”””



context = dspy.InputField(desc=”may contain relevant facts”)

question = dspy.InputField()

answer = dspy.OutputField(desc=”often between 1 and 5 words”)

Deskripsi spesifikasi NewGenerateAnswer tersebut dapat digunakan dengan model RAG Anda. Anda meneruskan GenerateAnswer ke modul `ChainOfThought` agar konteks yang diambil dan pertanyaan serta jawabannya menggunakan pendekatan Rantai Pemikiran.

Anda juga memperbarui metode theforward untuk menghasilkan bagian konteks dari RAG dan menggunakan bagian kontekstual tersebut untuk menghasilkan jawaban. DSPy akan memanggil metode `forward` ini setiap kali membuat jawaban baru untuk menanggapi sebuah pertanyaan, mengumpulkan konteks dari kumpulan data abstrak ColBERT Wiki 17, kemudian meneruskan konteks tersebut ke model bahasa, dalam hal ini Llama 3.1. Seiring dengan pembuatan setiap jawaban, DSPy akan membandingkan output dengan output yang diinginkan untuk memastikan bahwa prompt membantu model membuat respons yang benar.

class RAG(dspy.Module):

def __init__(self, num_passages=3):

super().__init__()



self.retrieve = dspy.Retrieve(k=num_passages)

self.generate_answer = dspy.ChainOfThought(GenerateAnswer)



def forward(self, question):

context = self.retrieve(question).passages

prediction = self.generate_answer(context=context, question=question)

return dspy.Prediction(context=context, answer=prediction.answer)

Untuk membantu DSPy merekayasa prompt terbaik untuk kita, Anda memerlukan kumpulan data pengujian yang dapat digunakannya untuk menguji prompt dan kemudian mengevaluasinya.

Untuk memberikan pertanyaan pengujian kepada DSPy, Anda akan memuat kumpulan data HotPotQA. HotPotQA adalah kumpulan data untuk menjawab pertanyaan yang memiliki pertanyaan multi-hop alami yang memerlukan beberapa pengambilan dan kesimpulan untuk sampai pada jawaban yang benar. Ini adalah alat yang hebat untuk menguji seberapa baik model membuat fakta pendukung untuk melatih dan menguji sistem menjawab pertanyaan yang lebih dapat dijelaskan.

Sebagai contoh, salah satu pertanyaan dari kumpulan data tersebut adalah: "Siapa yang ditunjuk oleh Presiden Franklin Roosevelt yang bertanggung jawab untuk mengirimkan suara Kolese Elektoral ke Kongres?" Anda dapat melihat bahwa pertanyaan ini membutuhkan beberapa informasi untuk dijawab dengan benar.

The answer is: “Robert Digges Wimberly Connor”.

Konteks pendukung berasal dari halaman Wikipedia tentang Robert Digges Wimberly Connor dan National Archives and Records Administration.

HotPotQA dikumpulkan dan diterbitkan oleh tim peneliti NLP di Carnegie Mellon University, Stanford University, dan Universite de Montreal. Informasi lebih lanjut tentang HotPotQA tersedia di situs GitHub mereka.

Setelah Anda memuat kumpulan data, bagi menjadi kumpulan data pelatihan dan pengujian. Ini memungkinkan Anda untuk menguji rantai pengambilan dan membantu DSPy menemukan prompt terbaik untuk model bahasa.

# Load the dataset.

dataset = HotPotQA(train_seed=1, train_size=20, eval_seed=2023, dev_size=50, test_size=0)



# Tell DSPy that the ‘question’ field is the input. Any other fields are labels and/or metadata.

trainset = [x.with_inputs(‘question’) for x in dataset.train]

devset = [x.with_inputs(‘question’) for x in dataset.dev]

Selanjutnya, Anda akan melakukan bootstrap pada lebih banyak contoh untuk memberi DSPy lebih banyak kesempatan untuk membuat prompt dan mengevaluasinya. Callingcompile menggunakan semua arsitektur yang telah Anda konfigurasikan serta kumpulan data HotPotQA untuk membuat dan menguji prompt dan mendapatkan kinerja terbaik dari model bahasa Anda.

from dspy.teleprompt import BootstrapFewShot



# Validation logic: check that the predicted answer is correct.

# Also check that the retrieved context does actually contain that answer.

def validate_context_and_answer(example, pred, trace=None):

answer_EM = dspy.evaluate.answer_exact_match(example, pred)

answer_PM = dspy.evaluate.answer_passage_match(example, pred)

return answer_EM and answer_PM



# Set up a basic DSPy optimizer, which will compile your RAG program.

bfs_optimizer = BootstrapFewShot(metric=validate_context_and_answer)



# Compile!

compiled_rag = bfs_optimizer.compile(RAG(), trainset=trainset)

Setelah DSPy melakukan rekayasa prompt, Anda akan mengujinya dengan pertanyaan khusus tentang Hadiah Nobel 2006 yang Anda gunakan sebelumnya. Karena model pencarian menggunakan ekstrak Wikipedia dari tahun 2017, model ini akan bekerja paling baik dengan pengetahuan yang mungkin ada dalam korpus tersebut:

# Get the prediction. This contains `pred.context` and `pred.answer`.

pred = compiled_rag(test_question)



# Print the contexts and the answer.

print(f”Question: {test_question}”)

print(f”Predicted Answer: {pred.answer}”)

Sekarang Anda mendapatkan kembali jawaban yang benar.

Pertanyaan: Dari negara mana pemenang Hadiah Nobel Sastra pada tahun 2006 dan siapa nama mereka? Prediksi Jawaban: Turki, Orhan Pamuk

Orhan Pamuk berasal dari Turki, jadi jawaban ini benar. Versi kompilasi DSPy tidak hanya mendapatkan jawaban yang benar, tetapi juga membingkainya dengan benar, menjawab dengan respons yang singkat dan jelas. Mari kita lihat konteks prediksi respons ini untuk melihat bagaimana model sampai pada jawaban yang benar:

pred.context

Memberikan hasil:

["Orhan Pamuk | Ferit Orhan Pamuk (dikenal luas sebagai Orhan Pamuk; lahir 7 Juni 1952) adalah seorang novelis, penulis skenario, akademisi, dan penerima Hadiah Nobel Sastra 2006 dari Turki. Salah satu novelis paling terkemuka di Turki, karyanya telah terjual lebih dari tiga belas juta buku dalam enam puluh tiga bahasa, membuatnya menjadi penulis terlaris di negara tersebut.", '2006 Palanca Awards | Pemenang Penghargaan Carlos Palanca Memorial untuk Sastra pada tahun 2006 (peringkat, judul entri pemenang, nama penulis).', "Miguel Donoso Pareja | Miguel Donoso Pareja (13 Juli 1931 – 16 Maret 2015) adalah seorang penulis Ekuador dan pemenang Penghargaan 2006 Premio Eugenio Espejo (Penghargaan Nasional Ekuador di bidang sastra, yang diberikan oleh Presiden Ekuador)."]

Jawaban berada di potongan konteks pertama yang dihasilkan. Anda dapat melihat bagaimana DSPy merekayasa prompt optimal dengan melihat riwayat model bahasa menggunakan metode theinspect_history() pada model bahasa.

lm.inspect_history()

Riwayat ini sangat panjang karena mencakup semua contoh dari proses kompilasi di mana DSPy menguji prompt yang dihasilkannya. Bagian terakhir dari riwayat ini menunjukkan bagaimana model sampai pada jawaban yang benar dan dalam format yang benar:

[[ ## context ## ]] [1] «Orhan Pamuk | Ferit Orhan Pamuk (umumnya dikenal sebagai Orhan Pamuk; lahir 7 Juni 1952) adalah seorang novelis, penulis skenario, akademisi, dan penerima Hadiah Nobel Sastra 2006 dari Turki. Salah satu novelis paling terkemuka di Turki, karyanya telah terjual lebih dari tiga belas juta buku dalam enam puluh tiga bahasa, membuatnya menjadi penulis terlaris di negara tersebut.» [2] «2006 Palanca Awards | Penghargaan Carlos Palanca Memorial untuk pemenang Sastra pada tahun 2006 (peringkat, judul entri yang menang, nama penulis).» [3] «Miguel Donoso Pareja | Miguel Donoso Pareja (13 Juli 1931 – 16 Maret 2015) adalah seorang penulis Ekuador dan pemenang Penghargaan Premio Eugenio Espejo 2006 (Penghargaan Nasional Ekuador di bidang sastra, yang diberikan oleh Presiden Ekuador).» [[ ## question ## ]] Dari negara manakah pemenang Hadiah Nobel Sastra pada tahun 2006 dan siapakah namanya? Respond with the corresponding output fields, starting with the field `[[ ## reasoning ## ]]`, then `[[ ## answer ## ]]`, and then ending with the marker for `[[ ## completed ## ]]`. [31mResponse:[0m [32m[[ ## reasoning ## ]] The text mentions the 2006 Nobel Prize in Literature and states that Orhan Pamuk, a Turkish novelist, was the winner. [[ ## answer ## ]] Turkey, Orhan Pamuk [[ ## completed ## ]][0m

Anda dapat melihat bahwa DSPy menggunakan model untuk menghasilkan prompt:

Respond with the corresponding output fields, starting with the field [[ ## reasoning ## ]] , then [[ ## answer ## ]] , and then ending with the marker for [[ ## completed ## ]] .

Ini mengarah pada jawaban dan pembingkaian yang benar.