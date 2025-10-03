Kecerdasan Buatan Otomatisasi bisnis

Pemantauan agen dan insight plus metrik keamanan di watsonx.governance

diterbitkan 10/03/2025

Penulis

Neil Leblanc

watsonx.governance Go-To-Market Lead

IBM

Pemimpin risiko dan kepatuhan, tim keamanan, dan pemilik AI sering mengajukan dua pertanyaan ini: “Dapatkah saya melihat apa yang sebenarnya dilakukan agen AI saya dalam produksi?” “Bisakah saya mendapatkan pandangan terpadu tentang Tata Kelola AI dan postur keamanan AI saya?”

Dengan watsonx.governance, jawaban untuk keduanya sekarang adalah ya.

  1. Pemantauan dan insight agen: Memberikan informasi tentang perilaku, tindakan, dan keputusan AI agen dalam produksi untuk perusahaan.
  2. Metrik keamanan di konsol tata kelola: Membawa insight Guardium AI Security langsung ke dalam alur kerja tata kelola Anda.

Bersama-sama, fitur-fitur ini akan memberikan solusi komprehensif untuk kepercayaan AI—kebijakan, perlindungan, dan kinerja—tanpa beralih spreadsheet atau berpindah tab.

Pemantauan agen: Buat agen yang transparan, terapkan dengan percaya diri

Perusahaan beralih ke agen AI sebagai batas produktivitas berikutnya. Tidak seperti model tradisional yang hanya menghasilkan output, agen dapat melakukan tugas-tugas yang berantai dan memanfaatkan beberapa sistem. Hal ini membuka peluang untuk mengotomatiskan alur kerja yang berulang, mempercepat pengambilan keputusan, dan membebaskan tim untuk fokus pada pekerjaan yang bernilai lebih tinggi.

Tetapi dengan janji ini muncul risiko baru. Agen beroperasi dengan lebih banyak otonomi, sehingga lebih sulit untuk melihat bagaimana keputusan dibuat dan untuk memastikan agen berperilaku seperti yang diinginkan. Pemantauan saat ini seringkali lambat, manual, dan terfragmentasi, karena pengembang tidak memiliki alat yang mereka butuhkan untuk memercayai, melacak, atau menyempurnakan sistem mereka. Dan tanpa infrastruktur tata kelola yang dapat diskalakan, perusahaan kesulitan untuk mengevaluasi, mengontrol, dan meningkatkan skala AI agen dengan percaya diri.

Untuk mengatasi tantangan ini, dalam rilis mendatang kami, watsonx.governance akan memperkenalkan Agent Monitoring dan Agent Insights di watsonx.governance. Kemampuan baru ini memantau aplikasi agen dalam produksi. Dengan melacak keputusan, perilaku, dan kinerja secara real time, Agent Insights mengeluarkan peringatan ketika metrik melewati ambang batas. Hal ini memungkinkan manajemen proaktif, pemecahan masalah yang lebih cepat, dan kepercayaan yang lebih tinggi pada hasil yang diberikan oleh agen.

Perbaikan utama tata kelola agen

  • Evaluasi dalam siklus: Metrik yang diperbarui untuk menilai kinerja (kualitas dan perilaku) agen AI secara akurat. Kemampuan ini menghemat waktu dengan meningkatkan efisiensi dengan melihat semua metrik kinerja yang digabungkan pada tingkat Percakapan, Interaksi, dan Alat di satu tempat, melukiskan gambaran lengkap tentang kinerja agen. 
  • Mendorong kualitas dan presisi: Pada Q1 2026, kami memperkenalkan insight yang dapat ditindaklanjuti melalui analisis akar masalah. Hal ini akan membantu tim memiliki kemampuan untuk mengukur apa yang berhasil, membandingkan kinerja dari waktu ke waktu, dan terus mengoptimalkan dan menyempurnakan AI dan agen mereka.
  • Pelacakan eksperimen real-time: Evaluasi dan bandingkan beberapa proses aplikasi agen Anda, dengan semua perubahan, metrik, dan output di satu tempat. Hal ini tidak hanya mempercepat waktu produksi—memperoleh struktur dan informasi tentang proses pengembangan agen dengan semua perubahan, metrik, dan output—tetapi juga meningkatkan efisiensi, yang mengurangi kebisingan dengan hanya berfokus pada metrik yang paling penting bagi proyek Anda melalui peringkat khusus yang disesuaikan dengan metrik keberhasilan proyek Anda, sehingga memastikan keputusan yang lebih cepat dan kinerja agen yang lebih baik.
  • Laporan: Dasbor bawaan dan peringatan otomatis saat agen AI keluar dari batas operasi yang dimaksudkan, untuk membantu tim menguji, mengadopsi, dan menskalakan agen lebih cepat. Hal ini memastikan manajemen proaktif dengan Dasbor Agent Insights, dan melacak tren kinerja dari waktu ke waktu. Hal ini juga memitigasi risiko secara real-time, meningkatkan kepercayaan diri dengan memastikan Anda segera diberi tahu jika agen membuat kesalahan atau berhalusinasi, sehingga memungkinkan intervensi dan koreksi yang tepat waktu.

Bagaimana ini membantu

  • Risiko dan kepatuhan mendapatkan jaminan bahwa agen tetap beroperasi dalam lingkup yang disetujui dan keputusan dapat diaudit.
  • Operasi AI/ML dan pengembang memecahkan masalah lebih cepat, meningkatkan efisiensi, dan memastikan hasil yang andal.
  • Para pemimpin bisnis mendapatkan kepercayaan diri yang lebih tinggi untuk menskalakan program AI agen secara bertanggung jawab untuk mendapatkan ROI maksimum.

Contoh dunia nyata:

Agen AI yang mengotomatiskan pengadaan mungkin mencoba menyetujui kontrak vendor di luar ruang lingkupnya. Dengan pemantauan yang diaktifkan, tindakan itu ditandai secara real time, memungkinkan tim untuk menyelidiki, menyesuaikan kebijakan, atau memperbaiki agen sebelum menyebabkan masalah hilir.

Metrik keamanan: Lihat risikonya, putuskan lebih cepat

Tata kelola AI dan keamanan AI terlalu sering diperlakukan sebagai aliran kerja paralel. Pendekatan itu berubah dengan integrasi baru Guardium AI Security ke konsol watsonx.governance. Pemimpin risiko dan kepatuhan dapat melihat postur keamanan langsung di tempat mereka menyetujui dan mengelola contoh penggunaan.

Cara kami menyatukan tata kelola dan keamanan:

  • Panel keamanan per contoh penggunaan: Setiap contoh penggunaan AI menampilkan kartu keamanan ringkas: hasil pemindaian kerentanan dan uji penetrasi, deteksi real-time (misalnya, upaya injeksi prompt), dan tren 7/30 hari.
  • Dasbor keamanan tingkat program: Tampilan gabungan seluruh contoh penggunaan, temuan terbuka berdasarkan tingkat keparahan, aktivitas serangan dari waktu ke waktu, dan status remediasi.
  • Peta Jalan Perluasan Cakupan: Metrik Hari Pertama berfokus pada kerentanan, uji penetrasi, dan deteksi, dengan kesalahan konfigurasi dan lebih banyak sinyal yang segera hadir.

Bagaimana ini membantu:

  • Risiko dan kepatuhan mempercepat ulasan dengan data keamanan langsung yang memberikan informasi real-time tentang kerentanan penting.
  • Tim keamanan yang menggunakan Guardium untuk penemuan dan perlindungan mendalam dapat dengan mudah berbagi metrik utama dengan para pemangku kepentingan tata kelola AI. Pemilik AI melihat metrik yang dapat ditindaklanjuti terkait dengan contoh penggunaan mereka, memberikan pandangan lengkap tentang kerentanan keamanan dan risiko yang harus diperbaiki.

Contoh dunia nyata:

Agen AI yang mengelola tiket TI terdaftar dan dikelompokkan berdasarkan tingkat risiko dalam tata kelola. Guardium terus menguji penyalahgunaan atau kebocoran pada agen AI. Kini, temuan dengan tingkat keparahan tinggi, tanggal uji penetrasi, dan upaya yang diblokir muncul langsung di sebelah catatan risiko, sehingga persetujuan dapat dilakukan lebih cepat dengan konteks yang lengkap.

Satu peta jalan, satu sumber kebenaran

Kedua fitur baru dipandu oleh prinsip yang sama: program AI Anda harus berjalan pada sumber kebenaran tunggal yang terpadu. Pemantauan agen akan berkembang dengan katalog agen yang diatur, kontrol penyempurnaan, dan observabilitas yang lebih menyeluruh untuk memastikan agen AI tetap dapat diandalkan, bertanggung jawab, dan selaras.

Metrik keamanan akan terus berkembang melebihi kerentanan dan deteksi kesalahan konfigurasi dan integrasi Guardium yang lebih dalam.

Bersama-sama, fitur-fitur ini akan membawa keamanan dan tata kelola ke dalam aliran terpadu sehingga perusahaan dapat mengatur dan meningkatkan skala AI dengan cepat, aman, dan percaya diri.

Bersiaplah untuk membangun AI yang terkendali, aman, dan dapat dipercaya

Jika Anda sudah menggunakan watsonx.governance, tunggu rilisnya dan bersiaplah untuk mengaktifkan fitur-fitur ini pada contoh penggunaan AI Anda yang paling penting saat fitur-fitur tersebut tersedia.

 Tim IBM Anda dapat membantu Anda mengidentifikasi pilihan yang tepat dan bersiap untuk membangun AI yang terkendali, aman, dan dapat dipercaya dengan kemampuan yang akan datang ini.

