Kerangka kerja ReAct terinspirasi dari cara manusia menggunakan bahasa alami secara intuitif—sering kali melalui monolog pikiran kita—dalam perencanaan langkah demi langkah dan pelaksanaan tugas-tugas yang kompleks.
Sebagai alternatif dari implementasi alur kerja berbasis aturan atau yang telah ditentukan sebelumnya, agen ReAct mengandalkan kemampuan analisis LLM-nya untuk secara dinamis menyesuaikan pendekatan mereka berdasarkan informasi baru atau hasil dari langkah-langkah sebelumnya.
Bayangkan Anda berkemas untuk perjalanan singkat. Anda mungkin memulai dengan mengidentifikasi pertimbangan utama (“Bagaimana cuaca di sana saat saya berada di sana?”), lalu secara aktif berkonsultasi dengan sumber eksternal (“Saya akan memeriksa ramalan cuaca lokal”).
Dengan menggunakan informasi baru tersebut (“Suhunya akan dingin”), Anda menentukan pertimbangan (“Baju hangat apa saja yang saya miliki?”) dan tindakan (“Saya akan memeriksa lemari saya”) selanjutnya. Setelah mengambil tindakan tersebut, Anda mungkin akan menemui kendala yang tidak terduga (“Semua baju hangat saya ada di gudang”) dan menyesuaikan langkah selanjutnya (“Baju apa saja yang dapat saya kenakan secara berlapis?”).
Dengan cara yang sama, kerangka kerja ReAct menggunakan rekayasa prompt untuk menyusun aktivitas agen AI dalam pola formal pemikiran, tindakan, dan pengamatan secara bergantian:
Tindakan yang telah ditentukan sebelumnya memungkinkan model untuk menggunakan alat, melakukan panggilan antarmuka pemrograman aplikasi (API) , dan mengumpulkan lebih banyak informasi dari sumber eksternal (seperti mesin pencarian) atau basis pengetahuan (seperti docstore internal).
Setelah melakukan suatu tindakan, model kemudian mengevaluasi kembali kemajuannya dan menggunakan pengamatan tersebut untuk memberikan jawaban akhir atau menginformasikan pemikiran berikutnya. Pengamatan tersebut idealnya juga mempertimbangkan informasi sebelumnya, baik dari jendela konteks standar model terdahulu maupun dari komponen memori eksternal.
Karena kinerja agen ReAct sangat bergantung pada kemampuan LLM pusatnya untuk berpikir “secara verbal” dalam menangani tugas-tugas yang kompleks, agen ReAct akan sangat diuntungkan dengan adanya model berkemampuan tinggi yang memiliki penalaran canggih dan kemampuan mengikuti instruksi.
Untuk meminimalkan biaya dan latensi, kerangka kerja ReAct multiagen dapat mengandalkan model yang lebih besar dan berkinerja lebih baik untuk bertindak sebagai agen pusat, dengan proses penalaran atau tindakan yang mungkin mencakup pendelegasian subtugas ke lebih banyak agen yang dibangun dengan menggunakan model yang lebih kecil dan lebih efisien.