watsonx.governance 中的智能体监控和洞察分析以及安全指标

两人在办公桌前,共同观看一台笔记本电脑,背景是城市景观窗景

作者

Neil Leblanc

watsonx.governance Go-To-Market Lead

IBM

风险与合规负责人、安全团队与 AI 系统负责人常常提出以下两个问题:“我能精确查看我的 AI 智能体在生产环境中的实际行为吗?”“我能否获得关于 AI 治理与 AI 安全状况的统一视图?”

有了 watsonx.governance,这两个问题现在的答案都是肯定的。

  1. 智能体监控和洞察:让企业能够了解生产中的智能体 AI 行为、操作和决策。
  2. 治理控制台中的安全指标:将 Guardium AI Security 洞察直接融入您的治理工作流。

这些功能将共同构成一套完整的 AI 信任解决方案,集策略、防护与性能于一体,让您彻底告别繁琐的表格追踪与多标签页切换。

智能体监控:让智能体透明化,从容自信地进行部署

企业正在将 AI 智能体作为生产力的下一个前沿。与传统模型仅能生成输出不同,智能体能够执行行动,它可串联多项任务并调用多个系统。这为自动化重复性工作流程、加速决策制定以及解放团队使其专注于更高价值的工作敞开了大门。

但是,这种承诺也带来了新的风险。智能体以更高的自主性运作,这使得洞察其决策过程、确保其行为符合预期变得愈发困难。如今的监控通常速度缓慢、手动且分散,导致开发人员缺乏信任、跟踪或微调其系统所需的工具。如果没有可扩展的治理基础设施,企业就很难评估、控制和自信地扩展智能体式 AI。

为了应对这一挑战,在即将发布的 watsonx.governance 版本中,watsonx.governance 将在 watsonx.governance 中引入智能体监控和洞察分析。此新功能可监控生产中的智能体式应用程序。通过实时追踪决策、行为与性能表现,“智能体洞察”系统能在指标越界时即时发出警报。这便实现了前瞻性管理、更快速的故障排查,并对智能体驱动的结果拥有更高置信度。

关键智能体式治理改进

  • 循环评估:更新指标以准确评估 AI 智能体的性能(质量和行为)。通过在单一位置查看会话、交互和工具层级聚合的所有性能指标,完整呈现智能体表现,此举通过提升效率节省了时间。
  • 提高质量和精度:2026 年第一季度,我们将通过根本原因分析引入可操作的洞察分析。这将帮助团队衡量有效的方法、比较一段时间内的性能,并不断优化和微调他们的 AI 和智能体。
  • 实时实验跟踪:评估和比较智能体应用程序的多次运行,所有更改、指标和输出都集中在一个位置。这不仅加速了投产进程,通过整合所有变更、指标与输出,为智能体开发流程赋予结构与可见性,同时还提升了效率,该效率通过依据项目成功指标定制的排名,仅关注对您项目最关键的指标,从而滤除干扰,以此确保更快的决策与更精细优化的智能体性能。
  • 报告:当 AI 智能体超出预期操作范围时,内置仪表板和自动警报,以帮助团队更快地测试、采用和扩展智能体。这确保了前瞻性主动管理,通过智能体洞察分析仪表板推动主动管理,并跟踪一段时间内的性能趋势。它还可以实时降低风险,确保在智能体犯错或出现幻觉时及时通知您,从而获得信心,从而能够及时干预和纠正。

它如何提供帮助

  • 风险与合规部门可获得保障,确保各智能体在批准的范围内操作,并且其决策可审计。
  • AI/ML 运营人员和开发人员可以更快排除故障,提高效率并确保结果可靠。
  • 商业领导者更有信心地负责任地扩展智能体 AI 计划,以获取最大化的投资回报率。

实际示例:

自动化采购的 AI 智能体可能会尝试批准其范围之外的供应商合同。启用监控后,该操作会实时被标记,团队可以及时调查、调整策略或优化智能体,以防其引发后续问题。

安全指标:查看风险,更快地做出决策

人工智能治理和人工智能安全常常被视为并行的工作流。随着 Guardium AI 安全性与 watsonx.governance 控制台的整合,这种情况发生了变化。风险与合规主管可以在批准和管理用例时直接查看实时安全状况。

我们将治理和安全结合在一起的方法:

  • 按用例的安全面板:每个 AI 用例都会显示一张简明的安全卡片,包括漏洞扫描和渗透测试结果、实时检测(例如提示注入尝试)以及 7 天/30 天趋势。
  • 程序级安全仪表板:跨用例的汇总视图,包括按严重性分类的未解决问题、随时间变化的攻击活动以及修复状态。
  • 覆盖范围扩展路线图:第一天的指标侧重于漏洞、渗透测试和检测,配置错误及更多信号将很快加入。

它如何提供帮助:

  • 风险与合规部门通过实时安全数据加速审查,为关键漏洞提供实时可视化。
  • 使用 Guardium 进行深度发现和保护的安全团队可以轻松地与人工智能治理利益相关者分享关键指标。AI 所有者可以看到与其用例相关的可操作的指标,从而提供必须补救的安全漏洞和风险的完整视图。

实际示例:

一个管理 IT 工单的 AI 智能体已在治理体系中注册并进行风险分级。Guardium 会持续对其进行滥用或泄露测试。现在,高严重性问题、渗透测试日期和被阻止的尝试会直接显示在风险记录旁,这样在完整背景下审批可以更快速地进行。

一份路线图,一个真相来源

这两项新功能都遵循同一原则:您的 AI 程序应该在一个统一的事实来源上运行。智能体监控将随着受治理的智能体目录、微调控制和更丰富的可观测性不断演进,以确保 AI 智能体保持可靠、可追责并符合规范。

安全指标将继续从漏洞和检测扩展到错误配置和更深层次的 Guardium 集成。

他们将共同把安全和治理纳入统一的流程,以便企业能够快速、安全、自信地管理和扩展 AI。

为构建受管控、安全、值得信赖的 AI 做好准备

如果您已经在使用 watsonx.governance,请关注新功能的发布,并准备在最关键的 AI 用例中启用这些功能。

您的 IBM 团队可以帮助您确定正确的前进方向,并利用这些即将推出的功能,为构建受治理、安全的值得信赖的 AI 做好准备。

使用 watsonx.governance 扩展可信的 AI