Sekarang GA: Pantau agen saat menjalankan waktu proses dengan watsonx Orchestrate

Rilis ini membawa visibilitas waktu proses ke agen langsung Anda, sehingga Anda dapat dengan percaya diri meningkatkan otomatisasi agen di seluruh perusahaan Anda.

diterbitkan 11 Desember 2025
By Suzanne Livingston

Agen AI beralih dari prototipe ke beban kerja produksi nyata dan langsung. Tetapi tidak seperti aplikasi tradisional, agen bersifat non-deterministik, multi-langkah, dan berbasis oleh alat—jadi “waktu aktif” saja tidak memberi tahu Anda apakah agen berperilaku andal, aman, atau hemat biaya.

Itulah sebabnya kami dengan senang hati mengumumkan ketersediaan umum (GA) pemantauan agen di IBM® watsonx Orchestrate, didukung oleh integrasi dengan IBM watsonx.governance.

Apa yang baru dengan pemantauan agen

Pemantauan agen di watsonx Orchestrate memungkinkan pembangun untuk memahami bagaimana pengguna berinteraksi dengan agen dan bagaimana kinerja agen. Fitur utamanya adalah kemampuan untuk memantau agen pada waktu proses melalui dasbor yang menampilkan metrik yang paling penting setelah agen tersedia.

Dengan pemantauan, tim dapat:

  • Melihat sekilas kinerja agen secara real-time di masing-masing agen atau seluruh katalog agen Anda.
  • Memantau KPI, seperti tingkat keberhasilan, latensi, penggunaan token, dan pendorong biaya.
  • Menjelajahi detail tingkat transaksi untuk memahami dengan tepat apa yang terjadi dalam interaksi antara agen dan pengguna tertentu.
  • Mendeteksi masalah lebih awal menggunakan sinyal yang didukung jejak yang menyoroti di mana aliran putus, alat gagal diaktifkan, atau kinerja menurun.

Mengapa pemantauan penting bagi agen

Pemantauan tradisional mengasumsikan sistem yang deterministik. Agen berbeda dalam 3 cara:

  • Agen merangkai panggilan LLM, langkah-langkah pengambilan, dan alat, sehingga kesalahan dapat muncul di mana saja di jalur penalaran.
  • Kualitas outputnya dapat berubah seiring waktu karena data, prompt, atau model yang mendasarinya berubah.
  • Biayanya dapat melonjak secara tak terduga tergantung pada jalur percakapan dan penggunaan alat.

Pemantauan produksi memberi Anda “kebenaran waktu proses,” bukan hanya waktu aktif. Anda dapat memverifikasi bahwa agen tetap akurat, aman, dan efisien saat agen melayani pengguna nyata, dan Anda dapat merespons dengan cepat jika agen tidak melakukannya.

Cara kerja pemantauan waktu proses

Setelah agen diterapkan ke produksi, watsonx Orchestrate secara otomatis menangkap telemetri yang kaya dari setiap interaksi. UI pemantauan waktu proses mengatur data itu menjadi 3 lapisan:

  1. Kesehatan tingkat agen: Tampilan ringkasan di seluruh agen yang diterapkan membantu Anda dengan cepat menemukan agen mana yang berkembang dan mana yang perlu perhatian—berdasarkan volume penggunaan, tingkat keberhasilan/kegagalan, dan pola latensi.
  2. Insight tingkat pesan dan alat: Diagram Time-series (deret waktu) menunjukkan bagaimana kinerja berkembang pada panggilan giliran dan alat—sehingga Anda dapat menentukan dengan tepat apakah perlambatan atau kegagalan berasal dari LLM, pengambilan, atau sistem hilir.
  3. Insight tingkat percakapan: Lihat bagaimana kinerja agen di seluruh percakapan multi-giliran penuh—bukan hanya interaksi tunggal. Tampilan agregat menyoroti di mana pengguna berhenti dan giliran mana yang mendorong kegagalan atau eskalasi. Ini membantu tim menemukan pola hambatan berulang, mengukur keberhasilan keseluruhan, dan memprioritaskan peningkatan yang meningkatkan penyelesaian tugas dunia nyata.

Agent Ops untuk mengelola seluruh siklus hidup agen

Pemantauan waktu proses adalah bagian penting dari strategi Agent Ops kami dan bagian penting dari siklus hidup pengembangan agen. Agent Ops menghadirkan kemampuan untuk mengamati, mengevaluasi, dan mengoptimalkan agen yang aman dan patuh—dibangun di mana saja, berjalan di mana saja.

  • Observabilitas: Pelanggan membutuhkan visibilitas yang jelas tentang bagaimana agen mereka berperilaku—langkah apa yang dijalankan, alat apa yang digunakan, dan respons apa yang dihasilkan—baik selama pengembangan maupun produksi.  
  • Evaluasi: Uji stres pra-produksi masih bersifat manual dan rapuh; tim membutuhkan cara yang mudah dan otomatis untuk menguji agen mereka, terhadap berbagai contoh penggunaan dan di berbagai metrik—dari ketepatan hingga relevansi panggilan alat hingga penghitungan token.
  • Optimasi: Organisasi kesulitan untuk membuat insight dari semua data ini. Untuk meningkatkan skala dengan cepat, mereka memerlukan deteksi masalah berbasis AI, analisis akar masalah, dan rekomendasi yang dapat ditindaklanjuti untuk meningkatkan kinerja agen dan biaya.

Memulai

Tingkatkan skala otomatisasi agen di seluruh perusahaan Anda dengan percaya diri dan aman dengan pemantauan untuk agen Anda dalam produksi.

Suzanne Livingston

Vice President, Product Management

IBM watsonx Orchestrate