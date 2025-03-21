“智能体 AI”一词在媒体上的热度飙升，或许会让你产生这样的疑问：这难道只是一个新的营销噱头吗？毕竟，“智能体”（或称虚拟代理）这一术语在 AI 领域早已被广泛使用，指代的是各类自动化辅助程序，例如应用于客户服务或人力资源场景的聊天机器人。
从更广义的范畴来看，在机器人流程自动化领域中，软件机器人可以充当用户或应用程序的智能代理，执行各类特定任务。其用例十分广泛，例如供应链管理、薪资核算以及数据库运维等，不胜枚举。微服务也可以被视为多智能体系统。
AI 诞生伊始，各类智能体便已随之出现。而如今的智能体 AI 有一个全新的定义特征，它的运行依赖于生成式 AI 技术。这一概念之所以备受热议，源于其具备的潜力：能够将大语言模型所拥有的、通过涌现机制形成的概率性能力，拓展至全新的行动场景。生成式 AI 的作用是生成答案或内容，而智能体 AI 则能基于这些成果自主采取行动。这类全新能力引发了一系列亟待探讨的伦理风险与治理层面的新问题，下文将对此展开深入分析。
智能体 AI 的优势十分突出。“智能体 AI 正带领我们逐步实现那些不久前还被视为科幻场景的应用案例，在这类场景中，机器能够在极少人工干预的情况下，完成包含复杂工作流、数据驱动型决策与主动执行操作在内的各类复杂任务。”IBM 的 Cole Stryker 撰文指出。
AI 智能体能够对可供调用的各类工具展开分析，借助 AI 助手获取相关主题的更多信息，并引导用户完成一系列操作步骤。与此同时，多模态 AI 也在推动智能体的落地应用，它提升了智能体系统的多项核心能力，使其可以跨多种媒介分析各类信息、预判多步操作流程，并代表用户自主采取行动。
在传统的多智能体架构中，由人类设计控制逻辑，用以解决那些定义明确的问题。相比之下，AI 智能体（或称大语言模型智能体）所采用的控制逻辑由生成式 AI 生成，大语言模型在其中扮演任务编排者或协调者的角色。全新的 IBM® Granite 3.0 8B Instruct 模型正是这种技术路线的典范，它能够支持需要调用工具的智能体应用场景；而 IBM watsonx Orchestrate 则进一步拓展了这类能力，可为人力资源及对话功能提供智能体相关的技术支撑。
完全成熟的智能体 AI 系统具备自主能力，能够设计工作流并调用各类工具，解决各类复杂问题，无论这些问题是可预见的、定义模糊的，还是前所未有的。借助应用程序编程接口 (API)，这些工具既可以与外部环境进行交互，又能够调取训练模型时所用的底层数据。
IBM 的研究人员写道：“智能体系统具备规划、循环、反思等控制结构相关能力，这些结构会深度利用模型本身的推理能力，以端到端的方式完成任务。再结合工具调用、插件集成与函数调用的能力，智能体得以胜任更多通用型工作。”
我们可以看看金融服务领域的若干用例：智能体 AI 系统能够自主优化客户沟通方式、定制专属的客户对接策略。可以开展信用资质评估、个性化定制贷款方案，还能自主管理高风险账户。同时也能追踪实时市场风险，并给出风险缓释建议。这类系统有望显著提升生产效率，但前提是必须妥善解决安全性与可观测性方面的相关问题。
智能体 AI 放大了传统 AI、预测式 AI 以及生成式 AI 所存在的各类风险，原因在于更强的智能主体性意味着更高的自主性，进而导致人机交互的减少。
要化解这些风险，既需要借助技术手段，也需要明确人类在测试环节与结果层面的责任。为此，我们需要一套完善的治理与生命周期管理运营框架。
IBM 研究院技术产品经理 Maya Murad 表示：“赋予大语言模型更多与外部世界交互的自主权，有可能会放大其潜在风险。当你授予智能体权限，使其在响应查询的过程中既可以生成代码、又能够运行代码时，很可能会引发诸多问题。最终的后果可能是整个文件系统被删除，或是企业专有信息被泄露。”
IBM 研究人员指出：“事实已明确证明，智能体相比大语言模型，‘鲁棒性更弱、更易产生有害行为，且能够生成更隐蔽的内容，这凸显出其存在重大的安全挑战’。”
Murad 建议通过多种方式降低此类风险：在安全沙盒中执行代码、设置安全防护规则，并开展攻击性安全研究——借助对抗性模拟、恶意软件分析以及红队演练进行。此外，企业还必须严格执行关于数据分享方式与分享范围的相关政策。
针对智能体 AI 系统的测试与监控，各类新策略正在不断涌现，其中包括对抗性攻击模板以及追踪技术，例如监护智能体。但必须对这些策略进行评估，使其与企业在伦理、安全及风险方面的治理要求保持一致。
覆盖开发、部署与运维全流程的 AI 自动化治理体系，有助于确保 AI 模型的运行始终符合预设目标。而像 IBM® watsonx.governance 这类灵活的端到端工具套件，能够助力企业构建负责任的工作流，并辅助其满足监管合规要求。
智能体 AI 的发展速度极为迅猛，组织或许难以找到可借鉴的先例或最佳实践来降低其潜在危害。鉴于该技术有可能放大偏见性数据或算法的负面影响，组织必须主动承担起伦理层面的责任，在构建 AI 自动化治理体系的同时，审慎制定符合自身需求的 AI 治理框架。
正如我们此前所阐述的，以人为本是所有 AI 工作的根基。组织层面的治理体系，既需要明确 AI 模型的引入与资产盘点流程，也需要管理并维护员工沟通机制与知识普及项目，同时还要指定专人负责监督治理工作的推进，并及时跟进监管政策的动态变化。
要实现 AI 治理体系高效、负责任的落地应用，需遵循若干特定步骤，同时还必须重点关注智能体 AI 所特有的相关考量因素。具体的步骤与考量因素如下：
智能体人工智能系统所产生影响的责任主体范围甚广，涵盖大语言模型的创建者、模型的适配者、系统的部署者以及人工智能应用的终端用户。目前，相关的安全最佳实践正在逐步形成（详见 PDF 文档），具体包括：
智能体架构在放大生成式 AI 应用机遇的同时，也会加剧其潜在风险。面对这一复杂性，智能体 AI 的试点项目应优先选择组织内部风险最低的用例。
全面的风险评估需要结构化的方法。去年，麻省理工学院的研究人员构建了 AI 风险信息库，这一数据库收录了 AI 相关文献中提及的 700 余项风险。该信息库从科研机构、行业企业及政府组织发布的 43 个 AI 框架中提取风险点并进行分类，同时提供了实用的风险分类体系，可用于界定风险的发生方式、发生时间与成因。风险分类共涵盖七大领域，且每个领域下均设有细分子领域，具体如下：
智能体 AI 治理的起步阶段特征，在一份作者附注（PDF 文档）中有所体现：
“多个风险领域的研究似乎仍不够深入……（AI 智能体）仅在两份纳入统计的文献中被提及。智能体 AI 的相关考量或许尤为重要，因为它带来了一类全新风险，这类风险与危险能力的持有及应用相关，例如递归式自我改进……”
建议参与风险排查工作的人员熟悉这类风险分类体系与风险框架。同时需要明确的是，鉴于部分领域的风险研究仍存在不足，他们基于实际业务场景所积累的风险经验与形成的风险认知，同样具备参考价值。
组织若想充分释放智能体 AI 的巨大潜力，就必须进行周密的投入规划与部署。要知道，生成式 AI 项目从启动到实现广泛落地，耗费了数年时间。Gartner 指出：“到 2025 年底，至少 30% 的生成式 AI 项目会在完成概念验证后宣告终止，其原因包括数据质量低劣、风险控制措施不到位、成本持续攀升以及商业价值不明确。”2
组织应如何在 AI 发展的下一阶段冲破困局、脱颖而出？Gartner 的一份报告指出：“生成式 AI 咨询与实施服务能够加速产出可量化、低风险、普惠化且贴合采购组织具体需求的成果。”3
该报告提出以下建议：
我们相信 IBM® Consulting 符合所有这些标准。我们凭借围绕战略规划、数据治理、架构搭建、安全防护及治理体系所构建的成熟方法论与科学决策流程，助力客户落地 AI 项目。若贵组织有意探索或部署智能体 AI 解决方案，我们的专业团队可协助你降低潜在风险，并进一步提升其商业价值。
在本期 "Mixture of Experts "节目中，我们的专家将深入探讨 AI 智能体的未来等问题，与您一起保持领先地位。
