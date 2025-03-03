Cara kerja bagian dalam model bahasa besar (LLM) secara tradisional tidak jelas. Sebuah model akan menerima prompt dan menghasilkan respons, tanpa mengungkapkan langkah-langkah penalaran internalnya.

Penalaran hybrid mengubah dinamika ini dengan mengekspos proses berpikir langkah demi langkah model. Ketika diaktifkan, sistem seperti Granite 3.2 menunjukkan pekerjaan mereka, membuat jalur logis yang mereka ikuti terlihat.

"Keputusan kami untuk membuat proses penalaran Claude terlihat mencerminkan pertimbangan berbagai faktor. Salah satu faktor tersebut termasuk peningkatan pengalaman pengguna dan transparansi kepercayaan dalam proses penalaran Claude," kata juru bicara Anthropic. "Proses ini memberi pengguna insight tentang bagaimana kesimpulan dicapai, menumbuhkan tingkat kepercayaan dan pemahaman yang sesuai. Pengguna umumnya lebih mempercayai output ketika mereka dapat mengamati rantai pemikiran. Kami berharap visibilitas ini memungkinkan pengguna untuk mengevaluasi kualitas dan ketelitian penalaran Claude dengan lebih baik, dan membantu pengguna lebih memahami kemampuan Claude. Selain itu, kami berharap pengguna dan pengembang dapat membuat prompt yang lebih baik dengan membaca output pemikiran Claude dan memberikan masukan yang ditargetkan pada langkah-langkah penalaran tertentu."

"Mampu mengekspos pemikiran aktual model sangat bagus untuk penjelasan," kata Daniels. "Sebelum dapat menunjukkan penalaran rantai pemikiran (CoT), itu benar-benar hanya probabilitas token berikutnya. Jadi sedikit kotak hitam."

Teknologi ini memiliki aplikasi bisnis yang meluas di banyak industri. "Keuangan dan hukum cocok secara alami karena mereka berurusan dengan dokumentasi terstruktur," kata Daniels, menambahkan bahwa "setiap industri yang diatur akan mendapatkan nilai luar biasa" dari model pemikiran canggih ini.

Tetapi penalaran hybrid dapat sangat berguna dalam domain yang membutuhkan analisis kompleks.

"Matematika dan kode benar-benar dua titik fokus yang saya lihat dalam hal tolok ukur untuk penalaran," kata Daniels. Untuk pengembangan perangkat lunak, manfaatnya bisa sangat besar: "Menggunakan model pemikiran akan dapat membingkai seperti apa ruang lingkup proyek yang seharusnya terlihat mengingat persyaratan yang telah Anda tetapkan," katanya.

LLM Standard menghasilkan respons dengan memprediksi kata berikutnya yang paling mungkin berdasarkan pola dalam data pelatihan mereka. Pendekatan ini bekerja dengan baik untuk banyak tugas, tetapi model ini dapat berjuang dengan masalah penalaran multi-langkah.

Model penalaran hybrid dapat beralih ke mode intensif komputasi, secara eksplisit menghasilkan langkah-langkah penalaran menengah sebelum memberikan jawaban akhir. Model menggunakan langkah-langkah ini untuk menyelesaikan masalah yang kompleks, mirip dengan cara manusia menuliskan langkah-langkah perantara saat mengerjakan soal matematika yang sulit.

Arsitektur yang memungkinkan penalaran hibrida dibangun di atas apa yang disebut oleh para peneliti sebagai "test-time compute," yang melibatkan dedikasi sumber daya komputasi selama inferensi dan bukan hanya selama pelatihan.

"Seringkali, secara tradisional, semua daya Anda akan digunakan untuk melatih model, dan kemudian menyimpulkan model akan relatif ringan dalam hal persyaratan komputasi," kata Daniels.

Tetapi ketika sistem AI tumbuh lebih kompleks, tantangannya bukan hanya kekuatan pemrosesan—tetapi juga mengetahui kapan menggunakannya secara efisien. Itulah sebabnya batas berikutnya dalam penalaran hybrid, ujar Daniels, adalah kemampuan regulasi diri yang lebih cerdas: mengajarkan AI untuk mengetahui kapan harus mengaktifkan mode berpikir mendalamnya sendiri, tanpa perlu arahan dari manusia.

"Langkah selanjutnya dalam hal model penalaran, atau model penalaran hybrid, adalah bagaimana kita dapat lebih memahami atau lebih baik triase input dalam komputasi waktu uji, atau dalam kerangka kerja," katanya.