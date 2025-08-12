Separuh lain dari hasil penelitian ini sama menariknya: para pengembang mengharapkan AI untuk mempercepat pekerjaan mereka sebesar 24% sebelum mereka mulai. Namun bahkan setelah mereka mengalami perlambatan 19%, mereka masih percaya AI telah mempercepat mereka sebesar 20%.

Jadi apa yang ada di balik kesenjangan persepsi ini? Kami menghubungi Nate Rush dari METR, salah satu penulis studi ini. “Ini adalah pertanyaan besar, dan pertanyaan yang tidak sepenuhnya dibicarakan oleh pekerjaan kami,” kata Rush kepada IBM® Think. “Idealnya, pekerjaan di masa depan akan Jelajahi lebih lanjut bagaimana harapan pengembang tentang kegunaan AI memengaruhi cara mereka menggunakan alat [dan] mengapa kesenjangan persepsi ini ada.”

Di luar masalah persepsi, penelitian ini menimbulkan sejumlah pertanyaan penting: apakah penghematan waktu adalah satu-satunya cara kita harus mengukur produktivitas pengembang? Bagaimana metrik seperti kualitas kode dan dampak tim cocok dengan gambaran keseluruhan?

“Studi kami hanya berbicara tentang penghematan waktu, yang hanya merupakan ukuran dari satu aspek produktivitas,” kata Rush. “Tidak ada ‘satu metrik yang tepat,‘ tetapi kemungkinan kumpulan metrik yang informatif tentang dampak alat AI.” Dia menambahkan bahwa sementara penelitian ini berfokus pada waktu, timnya telah menemukan kerangka kerja SP ACE produktivitas pengembang (SPACE adalah kependekan dari Kepuasan, Kinerja, Aktivitas, Komunikasi dan Efisiensi) berguna untuk memikirkan arah masa depan.

Pertanyaan lain: dapatkah versi model—dalam hal ini, Claude 3.5 dan 3.7 Sonnet—telah memengaruhi waktu kinerja? “Inilah kenyataannya,” kata Hay. “Saya pikir versi itu penting. Claude 4 Sonnet jauh lebih baik. Claude 4 Opus secara signifikan lebih baik. Kami tidak berbicara sedikit tentang yang lebih baik. Kami berbicara banyak hal yang lebih baik.”

Menurut Quentin Anthony, salah satu dari 16 peserta penelitian, unsur manusia adalah pertimbangan penting lainnya. ”Kami suka mengatakan bahwa LLM adalah alat, tetapi perlakukan mereka lebih seperti peluru ajaib,” tulisnya di X. ”LLM adalah tombol pintas dopamin besar yang dapat menyelesaikan masalah Anda. Apakah Anda terus menekan tombol yang memiliki peluang 1% untuk memperbaiki semuanya? Ini jauh lebih menyenangkan daripada alternatif yang melelahkan, setidaknya bagi saya." (Anthony menambahkan bahwa gangguan media sosial adalah cara lain yang mudah untuk menyebabkan penundaan).

Jadi, seiring dengan perkembangan dan peningkatan asisten pengodean AI, di manakah mereka akan memiliki dampak jangka panjang yang paling berkelanjutan pada pengembangan perangkat lunak? “Begitu mereka menjadi stabil, dapat dipercaya, dan berguna, saya pikir tempat terbaik Code Assistant adalah di lapisan QA — pengujian, jaminan kualitas, aksesibilitas,” kata Hagerty. “Hal-hal yang dibatasi dan berbasis aturan adalah aplikasi terbaik dari alat ini.”

Itu karena, katanya, menulis kode pada dasarnya berbeda dengan memeriksanya. ”Pengodean itu sendiri adalah kegiatan kreatif. Ini membangun sesuatu dari ketiadaan dalam ekosistem yang unik. Asisten AI melewatkan nuansa itu. Tetapi mereka mungkin dapat menguji menggunakan sistem aturan yang lebih umum dan universal.”