Apa itu ReWOO?

Penulis

David Zax

Staff Writer

IBM Think

ReWOO (singkatan dari “penalaran tanpa pengamatan”) adalah kerangka kerja yang membuat model bahasa besar (LLM) lebih hemat biaya dan akurat dalam beberapa aplikasi penalaran yang kompleks. Model dengan ReWOO terlibat dalam proses penalaran seputar masalah sebelum mencoba menyelesaikannya, yang mengarah pada efisiensi, akurasi, dan ketangguhan yang jauh lebih besar dalam skenario kegagalan alat.

LLM pertama (seperti model GPT-1 dan GPT-2 OpenAI) memberikan jawaban secara langsung; gelombang model rantai pemikiran berikutnya yang memulai debutnya pada tahun 2022 menambahkan elemen penalaran eksternal, dengan model yang pada dasarnya "berpikir dengan keras" saat mereka mencapai sebuah respons yang meningkatkan akurasi dan kemampuan menjelaskan. 

Berikutnya adalah generasi model bahasa tambahan (“sistem ALM”) dan agen AI, yang menambahkan kemampuan panggilan alat selain penalaran ini. Kerangka kerja ALM awal—seperti ReAct—menggunakan pola pikiran-tindakan-pengamatan, di mana sistem akan mengamati apa yang dihasilkannya sebelum mulai berpikir lagi. Meskipun umumnya efektif, kerangka kerja seperti ReAct dapat memerlukan konsumsi token yang besar, karena setiap panggilan alat berikutnya harus menyertakan semua riwayat percakapan yang mendahuluinya—biaya yang meningkat dengan setiap langkah. 

ReWOO melepaskan diri dari pola berpikir-bertindak-mengamati dengan memisahkan penalaran dari pengamatan eksternal, sehingga model dapat merencanakan rantai penalarannya secara internal sebelum secara selektif menggunakan alat atau mengambil informasi. Pemisahan ini mengurangi bolak-balik yang tidak perlu dan memungkinkan model untuk mempertahankan rencana di seluruh tugas.

Tren AI terbaru, dipersembahkan oleh para pakar

Dapatkan kurasi insight tentang berita AI yang paling penting dan menarik. Berlangganan buletin Think mingguan. Lihat Pernyataan Privasi IBM.

Terima kasih! Anda telah berlangganan.

Langganan Anda akan dikirimkan dalam bahasa Inggris. Anda akan menemukan tautan berhenti berlangganan di setiap buletin. Anda dapat mengelola langganan atau berhenti berlangganan di sini. Lihat Pernyataan Privasi IBM kami untuk informasi lebih lanjut.

Cara kerja ReWOO

ReWOO menggunakan tiga modul berbeda, yang membagi dan menaklukkan tugas-tugas kompleks. Pertama, modul Perencana akan memetakan cetak biru untuk bagaimana model akan berperilaku berdasarkan prompt pengguna. Kedua, modul Pekerja akan mengeksekusi rencana tersebut, memanggil alat eksternal (tanpa mengulangi panggilan API LLM yang mahal untuk "berpikir", seperti dalam ReAct). Terakhir, modul Pemecah Masalah akan mengambil rencana dan bukti, menggabungkan respons akhir. 

Meskipun perbedaan dalam pendekatan mungkin tampak kecil, hasilnya dramatis: ReWOO memiliki kinerja baik (atau sedikit lebih baik) daripada ReAct terhadap beberapa tolok ukur—semua ini menggunakan sekitar 80% lebih sedikit token. (Token adalah unit makna semantik untuk model AI; semakin banyak token, semakin tinggi biaya operasi.) Misalnya, pada kumpulan data HotpotQA (satu baterai pertanyaan yang digunakan untuk mengevaluasi sistem AI), ReWOO mencapai 42,4% akurasi menggunakan 2.000 token, sementara ReAct mencapai 40,8% akurasi menggunakan 10.000 token.  

Yang terpenting, pengoptimalan efisiensi token ini membuat model penalaran menjadi layak secara ekonomi dalam skala besar.

ReAct vs ReWOO: contoh dunia nyata

Untuk mengilustrasikan perbedaan antara dua kerangka kerja AI generatif umum ini, mari kita periksa contoh penggunaan tertentu. Pertimbangkan berbagai cara bagaimana sistem ReAct vs ReWOO akan menangani permintaan pengguna yang meminta bantuan pengemasan pakaian untuk perjalanan yang melibatkan penerbangan antara New York dan Chicago besok, diikuti dengan perjalanan dengan berkendara ke Milwaukee sehari kemudian.

Sistem ReAct akan menguraikan masalah menjadi urutan tiga siklus pemikiran-tindakan-pengamatan sebelum memberikan jawaban akhir. Pada siklus pertama, ia akan berpikir, “Saya perlu memeriksa cuaca besok di New York,” menggunakan Retrieval-Augmented Generation (RAG) untuk mencari cuaca tersebut (tindakan), dan terakhir mengamati hasil. Hasil itu kemudian berfungsi sebagai input bagi siklus tiga langkah lainnya berpikir-bertindak-mengamati untuk cuaca Chicago. Ketiga, pustaka ini akan melakukan hal yang sama untuk cuaca Milwaukee. Terakhir, ia akan menyusun temuannya menjadi sebuah output (mis. “Kemas pakaian tebal, karena semakin dingin di setiap lokasi”). 

Diagram ReACT

Sebaliknya, sistem bergaya ReWOO akan mendapatkan efisiensi dengan melakukan semua perencanaan di muka. Pertama, ia akan merencanakan, "Saya harus mendapatkan cuaca New York besok, cuaca Chicago besok, dan cuaca Milwaukee sehari setelahnya." Selanjutnya, kerangka kerja ini akan bekerja dengan memanggil API cuaca dalam satu urutan yang ketat (atau mungkin secara paralel), tanpa melakukan "pemikiran" yang mahal pada langkah kerja keras ini. Terakhir, ia akan menyelesaikan, mengumpulkan bukti, dan memberikan jawaban akhir.  

Diagram ReWOO
Agen AI

5 Jenis Agen AI: Fungsi Otonom & Aplikasi Dunia Nyata

Pelajari bagaimana AI berbasis tujuan dan berbasis utilitas beradaptasi dengan alur kerja dan lingkungan yang kompleks.

Manfaat dan kerugian dari ReWOO

Selain efisiensi token, ReWOO menunjukkan manfaat tambahan: ketahanan di bawah skenario kegagalan alat. Jika sebuah alat gagal dalam ReAct, misalnya, sistem dapat terjebak dalam lingkaran tak terbatas (karena LLM, misalnya, berulang kali menanyakan cuaca di Chicago pada basis data yang rusak).

ReWOO lebih tangkas. Bahkan jika sebuah alat gagal memberikan satu bukti tertentu, rencana menyeluruh awal masih tersedia: Modul Pekerja dapat terus berjalan dan modul Pemecah Masalah akan dapat memberikan setidaknya sebagian jawaban. Dalam contoh cuaca, alih-alih terjebak dalam lingkaran tak terbatas atau berlebihan dalam menanyakan cuaca Chicago pada basis data, modul Pemecah Masalah setidaknya akan memberikan jawaban yang menginformasikan kepada pengguna tentang cuaca New York dan Milwaukee (dengan asumsi bahwa modul Pekerja dapat mengambil potongan bukti tersebut), yang pada akhirnya mungkin cukup membantu untuk kebutuhan perencanaan pengguna. 

Terlepas dari manfaat ReWOO, kerangka kerja ini tidak unggul secara universal; kerangka kerja ini hanya lebih baik untuk jenis pekerjaan tertentu, terutama ketika jenis dan jumlah bukti yang dibutuhkan bersifat teratur dan dapat diprediksi. Namun, kegagalan ReWOO terjadi pada masalah yang kurang dapat diprediksi atau terstruktur yang mungkin memerlukan kreativitas, eksplorasi, atau improvisasi. ReWOO unggul dalam hal-hal tidak diketahui yang diketahui dan gagal dalam hal-hal tidak diketahui yang tidak diketahui.

Misalnya, ReWOO tidak akan optimal untuk melakukan debug pada kode Python, suatu proses eksplorasi dan iteratif di mana setiap perbaikan dapat menghasilkan kesalahan dan petunjuk baru, dan tidak memerlukan rencana yang dibuat dengan sangat saksama. Kerangka kerja yang lebih mudah beradaptasi seperti ReAct meskipun secara umum kurang efisien dalam hal penggunaan token, pada akhirnya akan lebih cocok untuk masalah seperti itu. 

Cara menerapkan ReWOO

Seperti kebanyakan sistem dan kerangka kerja AI, berbagai pendekatan tersedia untuk implementasi alur kerja ReWOO. Implementasi "resmi" dari kerangka kerja ini, yang pertama kali dijelaskan oleh peneliti Binfeng Xu (bersama dengan rekan-rekannya pada tahun 2023[1]) tersedia di Github. Kerangka kerja gen AI seperti LangGraph (yang menyebut modulnya sebagai "node") dan kerangka kerja LangChain yang terkait juga populer. Dan metodologi penalaran dengan banyak langkah bergaya ReWOO juga tersedia menggunakan Granite dari IBM.

Seseorang dapat memulai dengan ReWOO pada tingkat konseptual di lingkungan LLM apa pun dengan prompt yang dibuat dengan baik, yang hanya mendorong AI untuk menyusun rencana langkah demi langkah untuk menjawab pertanyaan berikutnya sebelum melanjutkan ke input alat apa pun. 

Makalah ini menguraikan tentang ReWOO terlebih dahulu, misalnya, menyertakan contoh prompt, termasuk prompt yang dimulai seperti ini: "Untuk tugas berikut ini, buatlah rencana yang dapat menyelesaikan masalah langkah demi langkah. Untuk setiap rencana, tunjukkan alat eksternal mana serta input alat yang digunakan untuk mengambil bukti." Namun, penulis studi menambahkan bahwa "ReWOO adalah paradigma umum dan prompt tidak harus tetap. Kami mendorong pembaca dan pengguna untuk menyelaraskan prompt yang disesuaikan dengan kebutuhan mereka sendiri.”1

Solusi terkait
Agen AI untuk bisnis

Bangun, terapkan, dan kelola asisten dan agen AI yang kuat yang mengotomatiskan alur kerja dan proses dengan AI generatif.

    Menjelajahi watsonx Orchestrate
    Solusi agen AI IBM

    Bangun masa depan bisnis Anda dengan solusi AI yang dapat Anda percaya.

    Jelajahi solusi agen AI
    Layanan AI IBM Consulting

    Layanan IBM Consulting AI membantu merancang ulang cara kerja bisnis dengan AI untuk transformasi.

    Jelajahi layanan kecerdasan buatan
    Ambil langkah selanjutnya

    Baik Anda memilih untuk menyesuaikan aplikasi dan keterampilan yang dibangun sebelumnya atau membangun dan menerapkan layanan agen khusus menggunakan studio AI, platform IBM watsonx siap membantu Anda.

    Menjelajahi watsonx Orchestrate Jelajahi watsonx.ai
    Catatan kaki

    1. "ReWOO: Decoupling Reasoning from Observations for Efficient Augmented Language Models," Binfeng Xu, Zhiyuan Peng, Bowen Lei, Subhabrata Mukherjee, Yuchen Liu, Dongkuan Xu. Arxiv.org, 23 Mei 2023.