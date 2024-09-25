Apa yang dimaksud dengan prompting dengan beberapa contoh?

Apa yang dimaksud dengan prompting dengan beberapa contoh?

Prompting dengan beberapa contoh (few-shot prompting) adalah proses penyediaan beberapa contoh tugas kepada model AI untuk memandu kinerjanya. Metode ini sangat berguna dalam skenario ketika data pelatihan ekstensif tidak tersedia.

Dalam teknik lain seperti prompting tanpa contoh yang tidak memerlukan contoh atau prompting dengan satu contoh yang bergantung pada satu contoh, prompting dengan beberapa contoh menggunakan beberapa contoh untuk meningkatkan akurasi dan kemampuan beradaptasi. Selain itu, kerangka kerja rekayasa prompt tingkat lanjut lainnya seperti prompting rantai pemikiran dan prompting pohon pemikiran juga menggunakan berbagai contoh untuk mendapatkan output yang diinginkan dan mengoptimalkan output model.

Pembelajaran dengan beberapa contoh sangat penting dalam situasi untuk AI generatif di mana mengumpulkan data berlabel dalam jumlah besar merupakan hal yang menantang. Metode prompting mengubah input menjadi format terstruktur, sehingga model seperti seri Granite IBM, model Llama dari Meta, serta GPT-3 dan GPT-4 dari OpenAI dapat mengisi kekosongan dengan respons yang sesuai, melakukan tugas secara efektif tanpa kumpulan data berlabel yang luas.[1] Teknik ini juga mendukung untuk mendapatkan format output yang sudah ditentukan sebelumnya dengan memandu model melalui berbagai contoh spesifik, memastikan konsistensi dan akurasi dalam struktur yang diinginkan.

Di bidang kecerdasan buatan (AI), machine learning (ML), dan pemrosesan bahasa alami (NLP) yang berkembang pesat, prompting dengan beberapa contoh muncul sebagai teknik yang tangguh. Metode ini memungkinkan model melakukan tugas dengan contoh terbatas, membedakannya dari metode prompting lainnya seperti prompting tanpa contoh dan prompting dengan satu contoh. Memahami prompting dengan beberapa contoh sangat penting untuk memanfaatkan potensi penuh sistem AI canggih seperti GPT-3/GPT-4 dari OpenAI dan model bahasa besar (LLM) lainnya seperti model IBM Granite atau model Llama dari Meta.

Gambar-1 menggambarkan proses pembelajaran dengan beberapa contoh untuk klasifikasi sentimen menggunakan model bahasa besar. Prompt memberikan contoh teks berlabel "positif" atau "negatif". Setelah melihat semua contoh berlabel ini model kemudian ditugaskan untuk mengklasifikasikan sepotong teks baru ("Produk ini sangat hemat biaya") sebagai "positif." Hal ini menunjukkan, bagaimana pembelajaran dengan beberapa contoh memungkinkan model untuk melakukan generalisasi dari sejumlah kecil contoh untuk melakukan tugas tertentu.

Bagaimana cara kerja prompting dengan beberapa contoh?

Prompting dengan beberapa contoh beroperasi dengan menyajikan beberapa contoh tugas yang diinginkan dalam prompt kepada model. Teknik ini memanfaatkan pengetahuan yang telah dilatih sebelumnya tentang model bahasa besar (LLM) untuk melakukan tugas-tugas tertentu secara efisien, bahkan dengan data yang terbatas.

Kueri pengguna: Proses dimulai dengan kueri pengguna, misalnya "Produk ini sangat hemat biaya".

Penyimpanan vektor: Semua contoh disimpan dalam penyimpanan vektor, basis data yang dioptimalkan untuk pencarian semantik. Ketika kueri pengguna diterima, sistem melakukan pencocokan semantik untuk menemukan contoh yang paling relevan dari penyimpanan vektor.

Mengambil contoh yang relevan: Hanya contoh paling relevan yang diambil dan digunakan untuk membentuk prompt. Dalam contoh ini, Pembuatan dengan Pengambilan Data yang Ditingkatkan (RAG) digunakan untuk mengambil contoh dari penyimpanan vektor, yang membantu menyesuaikan prompt dengan kueri tertentu. Meskipun RAG tidak selalu diperlukan untuk prompting dengan beberapa contoh, RAG dapat secara signifikan meningkatkan proses dengan memastikan bahwa contoh yang paling relevan secara kontekstual digunakan, sehingga meningkatkan kinerja model dalam skenario tertentu.

Pembuatan prompt: Prompt dibuat dengan contoh yang diambil dan kueri pengguna. Misalnya, prompt mungkin terlihat seperti ini:

Pemrosesan LLM: Prompt yang dibangun kemudian dimasukkan ke dalam LLM. Model memproses prompt dan menghasilkan output, dalam hal ini mengklasifikasikan sentimen permintaan pengguna.

Output: LLM mengeluarkan output berupa klasifikasi, seperti "negatif" untuk contoh yang diberikan.

Penelitian telah menyoroti keefektifan pendekatan pembelajaran dengan beberapa contoh yang mengurangi ketergantungan pada rekayasa prompt yang ekstensif. Tidak seperti penyempurnaan tradisional yang melibatkan penyesuaian parameter model menggunakan kumpulan data besar sebelum memerintahkan, penyempurnaan dalam pengaturan beberapa contoh mengacu pada proses mengadaptasi model yang telah dilatih sebelumnya hanya dengan beberapa contoh yang diberikan langsung di dalam prompt. Pendekatan ini memungkinkan model untuk memanfaatkan pengetahuannya yang sudah ada sebelumnya secara lebih efektif tanpa memerlukan pelatihan tambahan pada kumpulan data besar.[2] Studi ini menunjukkan bahwa bahkan ketika menggunakan "prompt kosong"—prompt yang tidak berisi templat khusus tugas atau contoh berlabel apa pun—model ini masih dapat mencapai akurasi yang kompetitif di berbagai tugas. Misalnya, prompt kosong mungkin hanya mengajukan pertanyaan seperti "Apa sentimen dari teks berikut?" tanpa memberikan contoh atau instruksi spesifik tentang cara mengklasifikasikan sentimen. Terlepas dari tidak adanya struktur, model ini dapat bekerja dengan baik, menunjukkan kekuatan pembelajaran dengan beberapa contoh.

Secara keseluruhan, penelitian ini menunjukkan bahwa pembelajaran dengan beberapa contoh adalah strategi yang sangat efektif, terutama apabila digunakan prompt terstruktur. Meskipun prompt kosong dapat memberikan hasil yang baik, menambahkan beberapa contoh yang dipilih dengan baik dapat lebih meningkatkan kinerja model, menjadikannya pendekatan yang serbaguna dan efisien, terutama dalam skenario dengan data berlabel terbatas. [1]

Keuntungan dan keterbatasan dari prompting dengan beberapa contoh

Prompting dengan beberapa contoh adalah teknik ampuh dalam pemrosesan bahasa alami (NLP) yang memungkinkan model melakukan tugas dengan contoh minimal. Pendekatan ini memiliki beberapa keuntungan dan keterbatasan yang memengaruhi efektivitas dan penerapannya.

Keuntungan

  1. Efisiensi dan Fleksibilitas: Prompting dengan beberapa contoh secara signifikan mengurangi jumlah data berlabel yang diperlukan untuk pelatihan, yang menjadikannya sangat efisien dan mudah beradaptasi untuk tugas-tugas baru. Dengan memanfaatkan model bahasa besar terlatih, prompting dengan beberapa contoh dapat menghasilkan kinerja yang kompetitif, bahkan dengan data terbatas. Sebagai contoh, dalam kutipan studi berikut, penulis menunjukkan bahwa penyempurnaan model bahasa dengan metode few-shot dapat mengurangi kebutuhan akan rekayasa prompt yang ekstensif dan dapat mencapai akurasi tinggi di berbagai tugas.[2]
  2. Peningkatan Kinerja dalam Berbagai Aplikasi: Prompting dengan beberapa contoh telah menunjukkan peningkatan yang signifikan dalam berbagai aplikasi, mulai dari klasifikasi teks hingga terjemahan mesin dan banyak lagi. Misalnya, penulis dalam studi yang dikutip berikut mengusulkan TransPrompt, kerangka kerja prompting dapat ditransfer yang menangkap pengetahuan lintas tugas, meningkatkan kinerja secara signifikan pada tugas klasifikasi teks dengan beberapa contoh.[3]
  3. Kekuatan pada Prompt yang Berbeda: Kekuatan prompting dengan beberapa contoh pada formulasi prompt yang berbeda adalah keuntungan utama lainnya. Unified Prompt Tuning (UPT), seperti yang dijelaskan oleh Feihu Jin et al., memperkaya prompt dengan informasi khusus tugas dan bergantung pada instans, mencapai peningkatan kinerja yang signifikan di berbagai tugas NLP.[4]
  4. Penurunan Overhead Komputasi: Kemajuan terbaru menjadikan prompting dengan beberapa contoh lebih efisien. Sebagai contoh, Lewis Tunstall et al. memperkenalkan SetFit, kerangka kerja yang efisien untuk penyempurnaan dengan beberapa contoh pada Sentence Transformers, yang mencapai akurasi tinggi dengan parameter yang jauh lebih sedikit dan penurunan waktu pelatihan dibandingkan dengan metode yang ada.[5]

Batasan

  1. Ketergantungan pada Kualitas Prompt: Kualitas dan desain prompt berdampak secara signifikan pada kinerja prompting dengan beberapa contoh. Membuat prompt yang efektif sering kali membutuhkan rekayasa yang cermat dan keahlian domain. Penulis Timo Schick dan rekan peneliti menyoroti variabilitas dalam kinerja berkat kualitas prompt, menekankan perlunya penanganan cerdas dari banyak prompt untuk mencapai hasil yang dapat diandalkan.[6]
  2. Kompleksitas Komputasi: Model bahasa besar yang digunakan dalam prompting dengan beberapa contoh membutuhkan sumber daya yang sangat banyak. Ini bisa menjadi penghalang bagi banyak organisasi, sehingga membatasi aksesibilitas semua model ini. Morteza Bahrami et al. mencatat bahwa model dengan jumlah parameter yang sangat banyak membutuhkan perangkat keras tangguh yang dapat menjadi kendala dalam adopsi yang ekstensif.[1]
  3. Tantangan Generalisasi: Generalisasi prompt di berbagai tugas dan kumpulan data tetap menjadi tantangan besar. Meskipun prompting dengan beberapa contoh dapat berfungsi dengan baik pada tugas-tugas tertentu, diperlukan teknik canggih untuk memastikan kinerja yang konsisten di berbagai aplikasi. Sebagai contoh, penelitian yang dilakukan oleh Feihu Jin dan beberapa penulis lainnya membahas masalah ini dalam penalaran numerik dengan memanfaatkan sejumlah besar data pelatihan untuk meningkatkan generalisasi dalam pembelajaran berbasis prompt.[4]
  4. Kemampuan Tanpa Contoh Terbatas: Meskipun prompting dengan beberapa contoh unggul dengan contoh minimal, kinerjanya dalam kondisi tanpa contoh bisa jadi kurang dapat diandalkan. Studi tentang kemajuan dalam NER memperkenalkan QaNER, metode berbasis prompt untuk named entity recognition yang mengatasi keterbatasan kemampuan tanpa contoh dengan meningkatkan kekuatan prompt.[7]

Oleh karena itu, prompting dengan beberapa contoh menawarkan sangat banyak manfaat dari segi efisiensi, fleksibilitas, dan kinerja di berbagai aplikasi. Namun, ketergantungannya pada kualitas prompt, kompleksitas komputasi, tantangan dalam generalisasi, dan kemampuan tanpa contoh yang terbatas menyoroti area di mana kemajuan lebih lanjut diperlukan untuk memaksimalkan potensinya.

Contoh penggunaan

Prompting dengan beberapa contoh telah terbukti sebagai alat yang serbaguna dan tangguh dengan sejumlah contoh di berbagai aplikasi, memanfaatkan kekuatan model bahasa besar untuk melakukan tugas-tugas kompleks dengan contoh terbatas. Prompting ini populer di berbagai contoh penggunaan AI gen kreatif seperti pembuatan konten atau pembelajaran dalam konteks. Berikut adalah penjelasan terperinci beberapa contoh penggunaan yang menonjol:

Analisis Sentimen
Prompting dengan beberapa contoh terutama berguna dalam analisis sentimen di mana model mengklasifikasikan sentimen suatu teks dengan data berlabel terbatas. Integrasi prompting dengan beberapa contoh dan pencocokan semantik, seperti yang ditunjukkan pada gambar-2, adalah salah satu contohnya. Integrasi ini memungkinkan model untuk mengklasifikasikan sentimen secara akurat berdasarkan contoh relevan dari penyimpanan vektor.[1]

Pengenalan Tindakan dalam Video
Prompting dengan beberapa contoh juga telah diterapkan pada pengenalan tindakan dalam video. Yuheng Shi et al. memperkenalkan prompting pengetahuan, yang memanfaatkan pengetahuan akal sehat dari sumber daya eksternal untuk memerintahkan model visi-bahasa. Metode ini mengklasifikasikan secara efektif tindakan dalam video dengan pengawasan minimal, mencapai kinerja yang canggih sekaligus mengurangi biaya overhead pelatihan secara signifikan.[8]

Pembuatan Dialog Tertanam
Dalam pembuatan dialog tertanam atau chatbot, prompting dengan beberapa contoh memperkuat model dialog dengan mengintegrasikan sumber informasi eksternal. Studi ini menunjukkan bahwa metode prompting dengan beberapa contoh dapat secara signifikan meningkatkan kinerja model dialog, membuatnya lebih koheren dan relevan secara kontekstual.[9]

Named Entity Recognition (NER)
Prompting dengan beberapa contoh dapat meningkatkan tugas pengenalan entitas bernama dengan memberikan contoh yang membantu model mengenali dan mengelompokkan entitas dalam teks. Pada kutipan studi berikut, penulis mengembangkan metode pembelajaran few-shot berbasis prompt yang sadar entitas untuk tugas menjawab pertanyaan, yang dapat disesuaikan untuk tugas NER, sehingga meningkatkan kinerja model secara signifikan.[10]

Tugas Pembuatan Kode
Prompting dengan beberapa contoh juga berlaku untuk tugas terkait kode seperti pembuatan pernyataan pengujian dan perbaikan program. Dalam penelitian mereka, Noor Nashid et al. mengembangkan teknik yang secara otomatis mengambil demonstrasi kode untuk membuat prompt efektif yang menunjukkan peningkatan substansial dalam akurasi tugas.[11]

Contoh penggunaan ini menunjukkan penerapan dan efektivitas yang luas dari prompting dengan beberapa contoh di berbagai bidang dan tugas, membuktikan potensinya untuk mendorong inovasi dan efisiensi dalam aplikasi AI dan NLP.

Prompting dengan beberapa contoh menunjukkan lompatan signifikan dalam AI dan NLP, menawarkan efisiensi, fleksibilitas, dan peningkatan kinerja dengan contoh terbatas. Seiring dengan perkembangan teknologi, teknologi ini akan memainkan peran penting dalam berbagai aplikasi, mendorong inovasi dan efisiensi di berbagai bidang.

