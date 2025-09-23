Inovasi lain oleh tim IBM adalah "Studio Evaluasi." Fitur ini memberikan dua kemampuan utama:

Optimasi prompt dengan membandingkan versi prompt yang berbeda secara berdampingan dan Pelacakan eksperimen untuk Agen

Studio evaluasi membantu pengembang mengevaluasi berbagai versi prompt pada kumpulan data dan membandingkan hasilnya dalam antarmuka pengguna yang intuitif. Fitur ini juga memberikan dukungan untuk peringkat khusus yang unik di mana pengguna dapat membuat skema peringkat khusus dengan memilih metrik dan memberikan bobot berdasarkan tingkat kepentingan. Ini membantu pengguna dengan mudah mengoptimalkan prompt yang akan digunakan dalam alat atau agen.

watsonX.governance, studio evaluasi juga mendukung pelacakan eksperimen yang merupakan alat yang ampuh untuk membangun sistem AI agen yang lebih baik. Anda dapat dengan cepat menyiapkan eksperimen, mencoba berbagai varian (agen) dan menandainya dengan detail seperti model, retriever, atau prompt yang Anda gunakan. Perbandingan berdampingan berdasarkan latensi, biaya, dan kualitas (seperti kesetiaan) memudahkan Anda untuk melihat mana yang bekerja paling baik. Yang terpenting, platform ini membantu Anda menyimpan kode yang tepat untuk setiap proses, membebaskan waktu pengembang dari menyimpan setiap versi dan membiarkan mereka berfokus membangun dan meningkatkan agen.