Kerangka kerja pohon pemikiran (ToT) dan rantai pemikiran (CoT) berfungsi sebagai algoritma konseptual untuk memahami organisasi dan perkembangan pembuatan teks dalam model bahasa (LM) seperti transformer pra-latih generatif (misalnya, GPT-3 dan GPT-4). Teknik penulisan prompt ini merupakan bagian dari rekayasa prompt, yang melibatkan penyusunan input (prompt) untuk memandu LM secara efektif dalam menghasilkan hasil yang diinginkan.
Penulisan prompt pohon pemikiran: Kerangka kerja ini beroperasi berdasarkan kemampuan model untuk menghasilkan teks secara hierarkis, dengan topik atau ide utama yang mengarah ke subtopik dan detail yang bercabang. Pendekatan ini mencerminkan bagaimana sebuah model dapat memperluas prompt tertentu dengan menghasilkan teks yang makin spesifik dan terkait, mirip dengan struktur pohon. Pendekatan ini memungkinkan untuk strategi lookahead dan pencarian pohon, di mana model ini dapat menjelajahi beberapa cabang sebelum berkomitmen pada suatu jalur, sehingga cocok untuk pemecahan masalah umum dan skenario yang membutuhkan pengambilan keputusan yang kompleks. Metode ini menggabungkan penalaran akal sehat dan heuristik untuk mengevaluasi kualitas setiap cabang. Mekanisme konsistensi diri digunakan untuk memberikan evaluasi yang andal dengan memberikan prompt kepada model beberapa kali.
Penulisan prompting rantai pemikiran: Sebaliknya, konsep ini sesuai dengan kapasitas model untuk menghasilkan teks secara linier, dari kiri ke kanan, di mana setiap token berikutnya secara langsung dipengaruhi oleh token sebelumnya. Perkembangan berurutan ini mencerminkan pendekatan yang lebih sederhana dan lebih mudah untuk pembuatan teks. CoT efektif untuk tugas-tugas yang membutuhkan alur logis langkah demi langkah yang jelas. Pembelajaran dengan sedikit contoh, di mana model dilengkapi dengan beberapa contoh untuk dipelajari, dapat menyempurnakan metode ini dengan memberikan pemahaman kontekstual. CoT berfungsi sebagai teknik dasar dalam rekayasa prompt, menawarkan metode dasar yang lebih sederhana untuk diterapkan tetapi mungkin tidak memiliki kedalaman dan kompleksitas ToT.
Perbandingan dan aplikasi: Sementara prompt ToT mewakili pendekatan yang lebih rumit dan saling berhubungan untuk pembuatan teks, dengan menggunakan strategi pencarian pohon dan lookahead, CoT mencerminkan perkembangan yang lebih sederhana dan berurutan. Sifat hirarkis ToT membuatnya cocok untuk tugas-tugas yang membutuhkan eksplorasi terperinci dari berbagai solusi, seperti skenario pembelajaran penguatan, di mana pelacakan kembali dan strategi alternatif sangat penting. Namun, perkembangan linier CoT sangat ideal untuk tugas-tugas yang membutuhkan urutan pemikiran yang jelas dan logis.
Dalam aplikasi praktis, API untuk LMs, termasuk GPT-3 dan GPT-4, menggunakan teknik prompting seperti ToT dan CoT untuk meningkatkan kinerjanya dalam berbagai tugas, mulai dari penulisan kreatif hingga pemecahan masalah yang kompleks.[2] Rekayasa prompt terus berkembang, menyediakan peralatan yang andal untuk memanfaatkan kemampuan transformer yang canggih dalam model bahasa.