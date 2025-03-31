Ketika model penalaran seperti o1 OpenAI, Deepseek-R1, dan Gemini 2.5 Google bersaing untuk mengungguli tolok ukur kecerdasan AI, perusahaan yang ingin mengintegrasikan AI menjadi semakin waspada terhadap sesuatu yang disebut “model kembung”—fenomena di mana model menjadi terlalu besar atau kompleks, mendorong biaya komputasi dan waktu pelatihan model, serta mengurangi kecepatan dalam memberikan respons yang dibutuhkan perusahaan.

o1 OpenAI dan Deepseek-R1 menggunakan penalaran rantai pemikiran (CoT) untuk memecah masalah kompleks menjadi beberapa langkah, mencapai tingkat kinerja yang belum pernah terjadi sebelumnya dan akurasi yang lebih besar daripada semua model sebelumnya. Tetapi CoT juga menuntut sumber daya komputasi yang substansif selama inferensi, yang mengarah ke output yang panjang dan latensi yang lebih tinggi, kata Volkmar Uhlig, VP dan AI Infrastructure Portfolio Lead di IBM, dalam sebuah wawancara dengan IBM Think.

Muncul kelas baru teknik perintah, yang dijelaskan dalam berbagai makalah baru, mulai dari atom pemikiran (AoT) hingga rantai draf (CoD), berusaha meningkatkan efisiensi dan akurasi CoT dengan membantu model memecahkan masalah lebih cepat, sehingga mengurangi biaya dan latensi.

Ilmuwan AI dan pendiri perusahaan rintisan Lance Elliott melihat cabang baru dari rantai pemikiran sebagai variasi dalam kotak peralatan seorang insinyur prompt. “Kotak peralatan standar Anda di rumah mungkin memiliki palu biasa—itulah CoT”, katanya kepada IBM Think. “AoT mirip dengan menggunakan palu khusus yang digunakan untuk situasi yang melibatkan pemotongan dan penyesuaian drywall. Anda dapat menggunakan palu biasa untuk mengerjakan drywall tetapi disarankan untuk menggunakan palu drywall jika punya dan tahu cara menggunakannya dengan benar.”

Vyoma Gajjar, Arsitek Solusi Teknis AI di IBM, melihat potensi dalam saudara CoT baru ini, terutama untuk perusahaan yang “mencari cara yang lebih hemat biaya untuk prompt model kecil untuk mendapatkan jawaban yang akurat untuk contoh penggunaan mereka”, katanya.