什么是多智能体系统？

作者

AI Engineer, Developer Advocate

IBM

多智能体系统 (MAS) 由多个人工智能 (AI) 智能体组成，它们共同工作，代表用户或其他系统执行任务。

MAS 内的每个智能体都有单独的属性，但所有智能体都协同工作，以实现所需的全局属性。¹多智能体系统能够在完成大规模、复杂的任务方面大显身手，这些任务可能涉及数百甚至数千个智能体。²

这一理念的核心是人工智能 (AI) 智能体。AI 智能体是指一个系统或程序，它能够通过设计其工作流和利用可用工具，代表用户或其他系统自主执行任务AI 智能体的核心是大型语言模型 (LLM)。这些智能体使用 LLM 的先进自然语言处理技术理解和响应用户输入。智能体逐步解决问题，并确定何时调用外部工具。AI 智能体与传统 LLM 的不同之处在于工具的使用以及设计行动计划的能力。智能体可用的工具可能包括外部数据集、Web 搜索和应用程序编程接口 (API)。与人类决策类似，AI 智能体也可以在获取新信息时更新其内存。信息共享、工具使用和自适应学习使 AI 智能体比传统 LLM 更具通用性。

有关单智能体系统的更多信息，请参阅我们详细的 AI 智能体内容。

行业时事通讯

专家为您带来最新的 AI 趋势

获取有关最重要且最有趣的 AI 新闻的精选洞察分析。订阅我们的每周 Think 时事通讯。请参阅 IBM 隐私声明。

单智能体系统与多智能体系统

单智能体智能系统与它们的环境互动，以自主规划、调用工具和生成响应。智能体可用的工具提供了智能体无法获得的信息。如前所述，这些信息可以是通过 API 或其他智能体获取的数据库。单智能体系统与多智能体系统之间是有区别的。当调用另一个智能体作为工具时，这个辅助智能体是原始智能体环境刺激的一部分。获取这些信息之后，将不再开展进一步合作。而多智能体系统有所不同，它利用环境内的所有智能体对彼此的目标、记忆和行动计划进行建模。⁴智能体之间可以直接进行通信，也可以通过改变共享环境来间接进行通信。

在某种程度上，多智能体系统内的每个实体都是一个自主智能体。这一自主性通常体现在智能体的规划、工具调用和一般推理上。在多智能体系统中，智能体保持自主性，但也会在智能体结构中进行合作和协调。³要解决复杂的问题，智能体通信和分布式问题解决方法至关重要。这种智能体交互可称为多智能体强化学习。通过这种学习形式共享的信息可能包括通过传感器或行动获取的即时信息。此外，还可以共享事件信息形式的智能体体验。这些事件可以是感觉、行动和习得策略的序列。最后，智能体可以实时共享它们的体验，以防止其他智能体重复学习相同的策略。⁵

单独的智能体本身就很强大。它们可以创建子任务、使用工具并通过它们的交互进行学习。多智能体系统的集体行为提高了准确性、适应性和可扩展性的潜力。由于拥有更大的共享资源池以及优化和自动化功能，多智能体系统的性能往往优于单智能体系统。智能体无需多个智能体学习相同的策略，而是可以共享习得的体验，以优化时间复杂性和效率。⁵

AI 智能体

5 种类型的 AI 智能体：自主功能与现实世界的应用

了解目标驱动和基于效用的 AI 如何适应工作流和复杂环境。

构建、部署和监控 AI 智能体

多智能体系统架构

集中式网络

多智能体系统可以在不同的架构下运行。在集中式网络中，一个中央单元包含全球知识库、连接各个智能体并监督它们的信息。这种结构的优点在于智能体之间易于通信、知识统一。中心化的缺点是依赖中央单元；如果中心单元失效，整个智能体系统也会失效。⁶

分散式网络

分散式网络中的智能体与其邻近的智能体共享信息，而不是与全球知识库共享信息。分散式网络的一些优点包括稳健性和模块化。由于没有中央单元，当一个智能体失效时，并不会导致整个系统失效。分散式智能体面临的一个挑战是协调它们的行为，以使合作的其他智能体受益。⁷

多智能体系统的结构

在多智能体系统内组织智能体的方法也有很多，包括：

分层结构

分层结构是树状的，包含具有不同自主级别的智能体。在简单的分层结构内，一个智能体可以拥有决策权。在统一的分层结构中，可以将责任分配给多个智能体。⁸

子整体结构

在这种架构内，智能体被分组成子整体。子整体是一个没有组件就无法运行的实体。例如，人体是一个子整体，因为它没有工作器官就无法运作。⁹ 同样，在子整体多智能体系统中，主导智能体可以有多个子智能体，同时看起来是一个单一实体。⁸ 这些子智能体也可以在其他子整体中发挥作用。这些分层结构自行组织，并通过子智能体的协作实现目标。

联盟结构

当一个组中的单一智能体表现不佳时，联盟会很有帮助。在这些情况下，智能体会暂时联合起来，以提高效用或性能。达到预期性能之后，联盟将会解散。在动态环境中维持这些联盟可能会变得困难。为了提高性能，通常需要重新分组。⁹

团队

团队在结构上类似于联盟。在团队中，智能体合作以提高团队的性能。与联盟不同，团队中的智能体不独立工作。团队中的智能体彼此更加依赖，它们的结构比联盟更加层次分明。⁸

多智能体系统的行为

多智能体系统内的智能体的行为通常反映了自然界中出现的行为。以下智能体行为既适用于多软件智能体，也适用于多机器人智能体。

聚集

多智能体系统中的集体行为可能类似于鸟类、鱼类和人类的行为。在这些系统中，智能体共享一个目标，并需要某个组织来协调它们的行为。聚集涉及定向同步，可以通过如下启发式方法描述这些群体的结构：¹⁰

分离：尝试避免与邻近的智能体发生碰撞。
协调：尝试匹配邻近智能体的速度。
内聚：尝试始终靠近其他智能体。

当使用软件智能体时，这种协调对于管理铁路系统等交通网络的多智能体系统至关重要。

群行

多智能体系统中的智能体的空间定位类似于自然界中发生的群行。例如，鸟类通过调整与邻近鸟类的位置实现同步飞行。从技术角度来看，群行是采用分散式控制的软件智能体之间的应急自我组织和聚合。¹¹ 群行的一个优点是，可以训练一个操作员来管理一组智能体。这种方法的计算成本更低，而且比为每个智能体训练一个操作员更可靠。¹²

多智能体系统的用例

多智能体系统可以解决现实世界中的很多复杂任务。适用领域的一些示例包括：

运输物联网

多智能体系统可用于管理交通系统。多智能体系统的特点是能够协调复杂交通系统的通信、协作、规划和实时信息访问。可能受益于 MAS 的分布式系统包括铁路系统、卡车分配以及驶入同一批港口的船舶。¹³

医疗保健和公共卫生

多智能体系统可用于执行医疗保健领域的多种特定任务。这些基于智能体的系统可以通过基因分析来帮助预测和预防疾病。关于癌症的医学研究可能是其中一种应用。¹⁴ 此外，多智能体系统还可以用作预防和模拟疫情传播的工具。这种预测可以通过使用基于流行病学信息的神经网络和机器学习 (ML) 技术来管理大型数据集而实现。这些发现可以影响公共健康和公共政策。¹⁵

供应链管理

影响供应链的因素有很多。从商品的生产到消费者的购买，这些因素千差万别。多智能体系统可以利用它们庞大的信息资源、多功能性和可扩展性，将供应链管理工作的各个方面联系起来。为了最好地驾驭这种智能自动化，虚拟智能体应该相互协商。这种协商对于与具有冲突目标的其他智能体合作的那些智能体来说非常重要。¹⁶

防御系统

多智能体系统可以帮助加强防御系统。潜在威胁可能包括物理国家安全问题和网络攻击。多智能体系统可以使用它们的工具模拟潜在的攻击。一个示例是海上攻击模拟。这种情景会让智能体分组工作，以捕获来犯的恐怖船只与国防舰艇之间的交互。¹⁷此外，通过以合作团队方式工作，智能体可以监控网络的不同区域，以检测传入的威胁，例如分布式拒绝服务 (DDoS) 洪流攻击。¹⁸

多智能体系统的优点

多智能体系统的几个特征提供了一些优点，包括：

灵活性

多智能体系统可以添加、移除或调整智能体，以适应不同的环境。

可扩展性

多个智能体的合作可以实现更大的共享信息池。与单智能体系统相比，这一协作使多智能体系统能够解决更复杂的问题和任务。

领域专业化

单智能体系统需要一个智能体执行各个领域的任务，而多智能体系统中的每个智能体都可以拥有特定领域的专业知识。

更高的性能

多智能体框架往往优于单个智能体。¹¹ 这是因为智能体可用的行动计划越多，学习和反思就越多。一个 AI 智能体如果能从其他相关领域的专业 AI 智能体那里获得知识和反馈，对信息合成非常有用。AI 智能体的这种后端协作和填补信息空白的能力是智能体框架所独有的，这使它们成为人工智能的强大工具和有意义的进步。