DSPy dapat membantu dalam beberapa jenis alur kerja dan skenario yang berbeda. Beberapa yang paling umum digunakan adalah pembuatan dengan pengambilan data yang ditingkatkan, penjawaban pertanyaan multihop, dan perangkuman dokumen.

Rantai pemikiran

Prompting rantai pemikiran (CoT) menyimulasikan proses penalaran seperti manusia dengan meminta model untuk menguraikan tugas-tugas kompleks menjadi urutan langkah logis menuju resolusi akhir. Langkah-langkah penalaran ini dimasukkan ke dalam jendela konteks model yang memberikannya lebih banyak landasan dalam tugas yang dihadapi dan sering kali menghasilkan respons yang lebih baik bahkan dalam skenario yang kompleks. DSPy membantu dengan membuat model bahasa menghasilkan prompt dan strategi rantai pemikiran serta mengujinya dengan model bahasa untuk menghasilkan prompt CoT yang paling efektif untuk model yang diberikan.

Pembuatan dengan pengambilan data yang ditingkatkan

Pembuatan dengan pengambilan data yang ditingkatkan (RAG) adalah pendekatan yang memungkinkan LLM memanfaatkan kumpulan besar pengetahuan dari sumber dan menanyakan penyimpanan pengetahuannya untuk menemukan potongan teks atau konten yang relevan dan menghasilkan respons yang disempurnakan dengan baik. RAG memastikan LLM dapat secara dinamis menggunakan pengetahuan real-time meskipun pada awalnya tidak dilatih dalam bidang tersebut dan memberikan jawaban yang benar. Kekuatan tambahan ini menyebabkan kompleksitas yang lebih besar saat menyiapkan saluran RAG. DSPy menawarkan pendekatan tanpa hambatan untuk menyiapkan saluran prompting dan menghasilkan prompt yang efektif (penyetelan prompt), atau dalam kasus model yang lebih kecil, menyempurnakan sendiri bobot model.

Saluran RAG dapat dioptimalkan dengan DSPy dalam dua cara: menggunakan contoh berlabel atau melakukan bootstrap pada contoh. Contoh berlabel adalah contoh yang diberi label secara manual dan telah ada sebelumnya, yang digunakan untuk melatih model pelatihan secara langsung. Bootstrap dalam konteks DSPy berarti menggunakan mode bahasa dalam paradigma pelatih dan model yang dilatih. Pelatih menghasilkan contoh pelatihan baru berdasarkan prompt yang diberikan oleh beberapa pengguna. Contoh yang menerima teknik bootstrap ini kemudian digunakan sebagai tambahan atau pengganti contoh yang diberi label secara manual untuk melatih model yang dilatih sampai memberikan jawaban yang benar. Prompt yang menghasilkan respons benar kemudian diperbarui secara berulang di seluruh saluran DSPy.

Menjawab pertanyaan multihop

Sering kali, satu permintaan pencarian tidak cukup untuk tugas menjawab pertanyaan yang kompleks. Kumpulan data HotPot Question Answering yang populer terdiri dari berbagai pertanyaan yang membutuhkan penguraian dan pengambilan beberapa pertanyaan sebelum dapat dijawab. Misalnya: “Bill Nelson terbang sebagai Spesialis Payload di pesawat ulang-alik yang diluncurkan untuk pertama kalinya pada tahun berapa?” Jawaban ini membutuhkan pengetahuan bahwa Bill Nelson pernah terbang dengan Pesawat Ulang-Alik Columbia dan kemudian dapat menentukan bahwa Columbia pertama kali terbang pada tahun 1981.

Pendekatan standar pada tantangan ini dalam literatur pengambilan data yang ditingkatkan adalah membangun sistem pencarian multihop. Sistem ini membaca hasil yang diambil dan kemudian menghasilkan kueri tambahan untuk mengumpulkan informasi tambahan bila diperlukan sebelum mendapatkan jawaban akhir. Dengan menggunakan DSPy, Anda dapat membuat sistem yang sama dalam beberapa baris kode dengan cara yang tangguh, di mana Anda dapat memperbarui model dan cukup menjalankan kembali saluran Anda.

Perangkuman

Perangkuman memadatkan potongan teks yang lebih panjang menjadi versi yang lebih pendek namun tetap mempertahankan informasi penting dan gagasan utama. Ini adalah keterampilan LLM yang penting untuk berfungsi baik, penerapannya beragam mulai dari membuat abstrak artikel hingga membuat laporan ringkas dari dokumen yang panjang.

Mengevaluasi kualitas ringkasan yang dihasilkan oleh model bahasa menghadirkan tantangan yang signifikan. Tidak seperti tugas dengan jawaban benar atau salah yang jelas, kualitas perangkuman sering kali bersifat subjektif dan bergantung pada konteks. Model ini perlu menyeimbangkan retensi dengan kepadatan informasi sambil mempertahankan intonasi dan maksud teks asli, serta memastikan akurasi yang faktual tanpa menimbulkan kesalahan. Beradaptasi dengan berbagai jenis bahan sumber dan tujuan ringkasan menghadirkan tantangan lain. DSPy memungkinkan Anda menggunakan data berlabel untuk menyetel prompt perangkuman agar mendapatkan respons terbaik.