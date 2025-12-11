人工智能 IT 自动化

GA 现在时：借助 watsonx Orchestrate 在运行时监控智能体

此版本可提供针对实时智能体的运行时可见性，以便您能自信地在整个企业中扩展智能体自动化。

发布日期 2025年12月11日
By Suzanne Livingston

AI 智能体正从原型转向真正的实时生产工作负载。但与传统应用程序不同，智能体是非确定性、多步骤且由工具驱动的，因此仅凭“正常运行时间”无法获悉它们的行为是否可靠、安全或经济。

因此，我们很高兴地宣布 IBM watsonx Orchestrate 中智能体监控功能已正式推出 (GA)，而该功能由与 IBM watsonx.governance 的集成来提供支持。

智能体监控新增功能

借助 watsonx Orchestrate 中的智能体监控功能，构建者可了解用户如何与智能体交互，以及智能体的运行情况。其核心功能是通过直观的仪表板在运行时监控智能体，而该仪表板会在智能体上线后显示最重要的指标。

通过监控，团队可：

  • 一目了然地查看各个智能体或整个智能体目录的实时智能体性能
  • 跟踪 KPI，如成功率、延迟、令牌使用情况和成本驱动因素。
  • 深入了解事务级详细信息，以便准确了解特定“用户与智能体”交互中发生的情况。
  • 利用可追溯的信号及早检测问题，而这些信号会凸显出现流程中断、工具出错或性能下降的位置。

为什么监控功能对智能体很重要

传统监控会假定系统是确定性的。智能体在 3 方面有所不同：

  • 它们会串联 LLM 调用、检索步骤和工具，因此错误可能会出现在推理路径的任何位置。
  • 随着数据、提示或底层模型的变化，其输出质量也可能会随时间推移而下降。
  • 根据对话路径和工具使用情况，其成本可能会意外飙升。

生产监控可为您提供“运行时真相”，而不仅仅是正常运行时间。您可验证智能体在服务真实用户时是否保持准确、安全和高效，并在智能体出现问题时能迅速做出响应。

运行时监控功能的工作原理

一旦将智能体部署到生产环境中，watsonx Orchestrate 便会自动从每次交互中获取丰富的遥测数据。运行时监控用户界面会将该数据组织为 3 个层：

  1. 智能体级运行状况：根据使用量、成功/失败率和延迟模式，提供已部署智能体的摘要视图，从而帮助您快速发现哪些智能体运行良好，哪些又需要关注。
  2. 消息级与工具级洞察分析：时序图表可显示性能如何随轮次和工具调用进行变化，以便您可确定减慢或故障是源自 LLM、检索还是下游系统。
  3. 对话级洞察分析了解智能体在完整的多轮对话（而不仅仅是单次互动）中的表现。汇总视图可突出显示用户流失的位置以及导致故障或升级的原因。此功能可帮助团队发现反复出现的摩擦模式、衡量端到端的成功率，并优先采用可提升实际任务完成度的改进功能。

通过智能体运维管理整个智能体生命周期

运行时监控是我们智能体运维战略的关键组成部分，同时也是智能体开发生命周期中的关键组成部分。智能体运维能观察、评估和优化安全、合规的智能体，以便支持实现“随时构建，随处运行”。

  • 可观测性：客户需要清楚地了解智能体的行为—在开发期间和生产过程中执行了哪些步骤、调用了哪些工具以及生成了哪些响应。
  • 评估：生产前压力测试仍需手动进行且十分脆弱；团队需要一种简单的自动化方法以根据各种用例并跨一系列指标（从忠诚度到工具调用相关性，再到令牌计数）来测试其智能体。
  • 优化：各组织都在努力从所有这些数据中获得洞察分析。为实现快速扩展，它们需要 AI 驱动式问题检测、根本原因分析以及可操作的建议，从而提升智能体和成本绩效。

开始使用

通过监控生产过程中的智能体，自信、安全地在整个企业范围内扩展智能体自动化。

