什么是智能体控制平面？

By Matthew Finio , Amanda Downie

智能体控制平面的定义

智能体控制平面是在整个组织中部署、运行、监控并治理 AI 智能体的系统。

每个智能体都在“数据平面”中运行：执行任务、与工具交互。控制平面位于该层之上，作为集中式控制中心，负责设置智能体的部署方式、协同工作方式以及行为引导规则。控制平面不关注单个智能体的行为，而是聚焦于多个智能体作为整个 AI 系统的组成部分如何工作。

IBM 商业价值研究院最近的一项研究显示，96% 的企业表示他们已经在某种程度上使用 AI 智能体。随着 AI 智能体在不同团队和用例中采用，碎片化问题从一开始就存在。智能体通常使用不同的框架构建，连接不同的数据源，治理规则也不一致。控制平面提供了一种统一方式来协调和监督这些活动，让组织能够在规模化应用过程中对智能体进行一致管理。

在实践中，控制平面充当智能体与其所依赖的系统之间的中介。在智能体执行操作前，控制平面负责路由请求、执行权限校验并应用策略。它还提供智能体在生产环境中的行为可见性，包括其表现、使用情况和结果。

这种方法让智能体能作为一个协同系统运行，而不是一系列孤立的组件。团队可以应用一致的策略，控制工具和数据的访问，并持续监控智能体的行为方式。在企业 AI 环境中，这种结构支持多个 AI 系统在其中的更广泛的智能体式 AI 生态系统。控制平面还通过在智能体的演进过程中启用版本控制、测试和可控部署来支持迭代。

区分智能体控制平面和模型上下文协议 (MCP) 是有用的，因为它们在不同的层上运行：

智能体控制平面负责编排和治理跨智能体和服务的系统级协调、控制和生命周期管理。
MCP 定义在单次交互中如何结构化处理上下文、工具和数据并将其传入模型中。

控制平面关注智能体在更大系统中的运行情况，而 MCP 关注模型如何处理特定请求。

开发人员使用它来构建和测试智能体工作流。平台团队使用它来管理基础设施和执行标准。业务和运营团队使用它来支持合规性、安全性和问责制。

智能体控制平面为以结构化和可扩展的方式运行智能体奠定了基础。它帮助实现跨系统协调、建立一致控制，并使智能体行为持续可观测、可管理。

专家为您带来最新的 AI 趋势

获取有关最重要且最有趣的 AI 新闻的精选洞察分析。订阅我们的每周 Think 时事通讯。请参阅 IBM 隐私声明。

为什么 AI 智能体控制平面很重要

智能体控制平面决定了在依赖 AI 智能体的环境中，工作如何组织与执行，尤其是在组织采用多智能体系统的情况下。在这些系统中，工作由多组智能体协同完成，而不是由孤立的工具或工作流处理。控制平面定义了任务如何分配、智能体如何交互以及输出结果如何验证。这种结构改变了团队设计流程和管理结果的方式。

没有控制平面，组织将面临 AI 智能体蔓延的问题——智能体以不协同、未加管理的方式扩张。在 IBV 的研究中，94% 的企业表示，AI 蔓延正在加剧安全风险和复杂性。随着团队试图简化使 AI 扩展困难的碎片化环境，这还会增加供应商整合的压力。采用控制平面的常见挑战包括：

碎片化与孤岛化的 AI ：智能体部署在人力资源、财务或 IT 等相互独立的职能部门，但业务流程跨部门协同。这种脱节导致企业难以交付端到端的成果。
缺乏协调和编排：随着智能体的数量增加，管理它们如何交互变得更加困难。这会导致重复工作、行为不一致以及用户体验碎片化。
治理不善的风险：如果没有一致的防护措施，智能体可能会访问错误的数据或执行意外的操作。这可能会导致安全问题和失去控制。

智能体控制平面通过引入统一标准、协调和监督来解决这些挑战。它为智能体跨团队、跨系统运行提供了一致的方式，减少了重复并提高了一致性。这种结构也使跟踪行为、分配责任变得更容易。

智能体控制平面还决定了组织的变更管理方式。当智能体更新或扩展时，控制平面有助于确保变更遵循既定流程。该系统允许团队以受控的方式测试、批准和部署更新。随着系统的发展，它可以减少中断，支持更可预测的运营。

AI 学院

成为 AI 专家

获取相关知识，以确定 AI 投资的优先级，从而推动业务增长。立即开始观看我们的免费 AI 学院视频，引领 AI 在组织中的未来应用。

观看系列视频

智能体控制平面的关键能力

智能体控制平面由一组核心能力定义，它们管理智能体的发现、运行、治理和维护方式。它们支持跨系统的 AI 智能体编排，并有助于确保自主智能体能够可靠地运行。

这些能力通常被归类为架构层（例如编排、治理或可观测性），但在实践中，它们作为一个内聚系统协同工作。了解智能体控制平面的能力可以更清晰、更直接地了解其运行情况。

访问控制

帮助确保智能体和用户经过身份验证并获得授权，从而跨系统、跨数据源执行权限。这种控制包括应用最小权限原则来限制对敏感数据的访问。

智能体和工具注册表

维护可用智能体和工具的集中式目录，支持发现、重复使用和一致调用。该能力还支持跨不同智能体平台引入新的 AI 智能体，并且可以包含预定义的模板来实现标准化设置。

执行管理

处理智能体操作和工具调用的执行，包括输入处理、输出处理、重试和错误管理。它管理运行时的行为，并有助于确保在需要时实时处理操作。

生命周期管理

支持智能体和工具的完整生命周期，包括版本控制、测试、部署和更新。它还维护审计追踪，以跟踪随时间的变化情况。

策略执行

应用智能体行为的治理规则，例如可以使用哪些工具、可以访问哪些数据以及允许执行哪些操作。这些策略有助于降低风险，限制漏洞暴露风险。

请求路由

根据上下文、意图和系统规则，将传入请求导向合适的智能体、工具或工作流。

状态管理

管理智能体如何在任务、会话和工作流之间存储、检索和共享记忆。

遥测

捕获日志、指标和跟踪，从而为 AI 智能体监控和调试提供对系统行为、性能和结果的可见性。该能力对 AI 智能体可观测性至关重要。

智能体控制平面的技术要求和功能

上一节中描述的能力概述了智能体控制平面可以做什么事情。在实践中，这些能力是通过一组核心平台组件实现的，这组平台组件有时被描述为智能体操作系统，定义智能体如何大规模构建、部署和运行。

它们共同确保在复杂性增加的情况下，工作流仍能保持可靠、安全且具有适应性。控制平面协调执行，而底层运行时系统则执行任务。

运行时编排：系统必须接收并解析传入请求，然后协调这些请求在智能体、模型和外部工具之间的执行方式。这种编排通常通过应用程序编程接口 (API)、事件驱动的架构和管理多步流程和依赖关系的工作流引擎来实现。
执行与工具访问：平台为执行智能体操作及与外部工具和服务交互提供了受控环境。该环境包括标准化的接口、输入和输出验证，以及错误处理和重试机制。
访问和集成层：统一网关为智能体提供访问数据、工具和外部系统的一致方式。该层简化了跨异构环境的集成，并集中管理请求的处理方式。
安全性与授权：智能体、用户和系统之间的所有交互都必须经过身份认证并获得授权。这种安全性通常通过身份系统、基于令牌的访问和动态应用权限来实现。
状态和上下文管理：跨交互维护上下文对于保持智能体行为的一致性至关重要。这包括短期工作上下文和长期存在的状态，由在整个工作流中将信息持久化并检索信息的系统提供支持。
可观测性与评估：控制平面必须提供清晰的系统行为可见性。这种可见性包括收集日志、指标和跟踪，并让这些信息可用于监控、调试和分析。
策略执行：必须在执行过程中积极执行策略，而不是将其视为静态定义。执行需要根据已定义的规则，对智能体行为进行运行时评估，以确保其行为始终符合运行与安全约束条件。
生命周期和版本管理：这些组件支持智能体的完整生命周期，从设计和开发到测试、部署、运行和监控。版本控制和受控发布机制有助于确保在不中断现有系统的情况下安全地引入更新。
可扩展性和可靠性：控制平面必须能在需求不断增长及系统发生局部故障的情况下继续运行。这种能力需要分布式系统设计、有效工作负载管理以及组件故障时的平稳恢复机制。
智能体和资产注册表：控制平面维护智能体、工具和依赖项的注册表。注册表让团队能够集中发现、重复使用和管理这些资产，从而提高一致性并减少组织内部的重复。

智能体控制平面用例

当多个 AI 智能体需要以协调、受治理和可扩展的方式运行时，就会使用智能体控制平面。在可靠性、安全性和监督至关重要的环境中，智能体控制平面尤其重要。以下用例说明了控制平面如何塑造实际工作流。

持续改进

控制平面会捕获有关智能体表现的数据，并利用这些数据来持续优化系统行为。例如，如果支持智能体频繁将某些问题升级，控制平面会识别该模式并更新路由，让更合适的智能体来处理类似请求。

客户支持运营

控制平面管理多个客服智能体，它们跨不同的应用和 Copilot 接口处理不同类型的请求。它们路由查询、执行响应准则并跟踪表现，以支持跨渠道提供一致的服务。如果客户通过聊天提交账单问题，控制平面会将请求路由至专门处理账单的智能体。此操作可限制对相关账户数据的访问，并记录交互以供审查。

企业工作流自动化

组织使用智能体控制平面协调跨系统（例如客户关系管理 (CRM)、企业资源规划 (ERP) 和内部工具）、多步骤业务流程中的智能体。控制平面有助于确保每一步都以正确的顺序执行并遵循定义的规则。

例如，在采购工作流中，一个智能体收集供应商估价，另一个智能体评估定价，第三个智能体提交审批。控制平面负责编排这些步骤，执行审批策略，并记录决策以供审计。

治理与合规执行

控制平面有助于确保智能体行为符合内部政策和外部法规，这一治理能力在受监管行业尤为重要。例如，在金融服务业，生成投资建议的智能体必须遵循合规规则。控制平面会限制数据使用，并记录输出以供监管审查。

多智能体协作

在更复杂的场景中，多个智能体会共同完成同一任务。控制平面管理任务如何分配、信息如何交换，以及输出结果如何组合。这种形式的多智能体协作支持跨智能体协同解决问题。

例如，在研究工作流中，一个智能体收集数据，另一个智能体总结调查结果，第三个智能体生成报告。控制平面协调数据流，并帮助确保最终输出符合质量标准。

工具和 API 编排

智能体通常依赖外部系统完成任务。控制平面控制工具和 API 的选择与使用，确保正确排序和安全执行。

例如，销售智能体更新客户记录并发送跟进电子邮件。控制平面协调 CRM 更新并触发电子邮件服务，应用访问权限和格式规范的规则。

智能体控制平面的优势

智能体控制平面为跨系统、跨团队扩展的 AI 智能体提供了一种结构化的管理方式。其价值在于改进了在生产环境中控制、协调和观察智能体的方式。这些优势有助于支持以企业规模运行的企业级系统。

集中治理：策略在一个位置定义并执行，而不是嵌入到每个智能体中，更易于维持合规。
责任清晰：所有操作可以追溯到特定智能体，支持审计和责任追溯。
行为一致：使用相同的规则减少了智能体执行任务方式的差异，提高了可靠性。
持续适应：通过监控和反馈，持续优化路由决策和智能体行为。
高效资源利用：将任务路由至合适的智能体和工具，减少重复，提高效率。
更快迭代：智能体可以通过受控流程更新和部署，实现功能优化而不中断正在运行的系统。
提升可见性：团队可以查看智能体的操作和表现，更容易识别问题并理解系统行为。这种可见性也支持长期评估 AI 投资回报率。
运行更安全：访问控制和策略执行限制了智能体的操作权限，降低了意外操作风险。
可扩展性：随着智能体数量增长，控制平面提供管理架构，防止碎片化和失控。

实施智能体控制平面的最佳实践

构建智能体控制平面不是简单的组件拼装，它需要在系统边界、治理和长期运营方面做出深思熟虑的决策。以下实践有助于确保系统在扩展过程中保持高效运行。

定义清晰的边界：明确哪些属于控制平面，哪些属于单个智能体，以避免重叠和困惑。
模块化设计：将路由和策略执行等关注点分享，以便各组件可以独立演进。
实现互操作性：控制平面的设计需考虑跨不同模型和工具运行，包括 LangChain 等开源框架，以及基于大语言模型 (LLM) 架构的系统。互操作性还包括支持 OpenAI 和 Anthropic 等多家提供商，避免厂商锁定。
尽早建立治理机制：从一开始就制定访问与数据使用策略，避免后续再补救控制。
在需要时引入人工监督：在高风险或有歧义的场景中，允许引入人工审查，提升可靠性和信任度。
为扩展而规划：这些系统应支持跨环境（例如 AWS 或 Microsoft 平台）部署，与 GitHub 等工具集成，并支持通过命令行界面 (CLI) 或仪表板等接口进行访问。这些能力可支持更大范围的组织计划以及与 LinkedIn 等企业工具的集成。
优先考虑可观测性：捕获智能体活动中的日志和指标，以支持调试和性能分析。
安全守护每一步：在整个系统中应用身份验证和验证，降低安全风险。
标准化注册：确保所有智能体和工具通过一致的流程完成注册，以提高可发现性和集成度。
支持生命周期管理：包括版本控制、测试和部署流程，帮助实现安全、可预测的更新。
利用反馈回路：根据系统数据和用户反馈优化路由和行为。