什么是智能体式架构?

作者

Vanna Winland

AI Advocate & Technology Writer

Jess Bozorg

Lead, AI Advocacy

IBM

Cole Stryker

Staff Editor, AI Models

IBM Think

什么是智能体式架构?

智能体架构指的是智能体式 AI 框架的结构与设计。智能体架构是一种在智能体式 AI 系统中塑造虚拟空间和工作流结构以实现 AI 模型自动化的架构。

智能体式 AI 是一种使用 AI 智能体 代表用户或其他系统自主执行任务的系统或程序。智能体式架构旨在支持和规范在生成式人工智能(生成式 AI)系统中运行的 AI 驱动智能体的行为。智能体式人工智能系统要求其智能体具有适应性并能导航动态环境以实现预期结果。

该模型与人类心理学没有太大区别,智能体是指根据一个人的行为有意识地使某事发生的能力。1为了实现预期的结果,必须使用计划、行动、记忆和反思。这些特征与单智能体和多智能体框架中使用的现代 AI 智能体的特征一致。

机器学习 (ML) 算法和大型语言模型 (LLM)(例如 OpenAI 的 GPT)的进步推动了 AI 智能体的发展。智能体式架构的目标是为 LLM 提供一种结构,以自动执行智能体来完成复杂的任务。

AI 智能体的自主或决策行为取决于使其成为可能的基础设施。智能体式架构旨在适应动态环境,提升互操作性。

例如,智能体可以与各种数据源和格式、应用程序编程接口 (API) 或系统进行交互。这种适应性强的行为使智能体能够做出明智的决策。

专家为您带来最新的 AI 趋势

获取有关最重要且最有趣的 AI 新闻的精选洞察分析。订阅我们的每周 Think 时事通讯。请参阅 IBM 隐私声明

谢谢!您已订阅。

您的订阅将以英语提供。您会在每份时事通讯中找到一个取消订阅链接。您可以在此处管理您的订阅或取消订阅。有关更多信息,请参阅我们的 IBM 隐私声明

智能体式架构如何运作

智能体式人工智能架构应由能够应对智能体核心要素的组件构成:意向性(规划)、预见性、自我反应性和自我反思性。2这些因素为人工智能智能体提供了自主权,以便它们可以设定目标、制定计划、监控其性能并进行反思以实现特定目标。

智能体技术使用后端工具调用来收集最新信息,执行复杂工作流程的优化并自动生成任务以实现复杂目标。

在运行过程中,自主智能体会随着时间的推移适应用户的偏好,提供更加个性化的体验并提供更详细的响应。该工具调用过程无需人工输入即可运行,为现实世界的 AI 应用程序解锁了更广阔的可能性。

AI 智能体

5 种类型的 AI 智能体:自主功能与现实世界的应用

了解目标驱动和基于效用的 AI 如何适应工作流和复杂环境。

智能体式与非智能体式

智能体式架构支持人工智能智能体内的智能体式行为。AI 智能体是由机器学习驱动的适应性系统,可以与外部环境交互并使用工具来完成特定目标。并非所有 AI 智能体都是智能体式的。这取决于编排框架或系统的复杂性和能力。

智能体式架构使 AI 智能体能够以一定程度的自主性行事,并根据目标做出决策,而无需不断接受人类的输入。3AI 智能体几乎不需要人工干预即可完成其特定任务。

在非智能体式架构中,LLM 能够执行单一或线性任务。4非智能体式架构中,AI 模型的功能是根据输入和上下文提供输出。

如果没有显式编排,LLM 就无法实时保留新信息,并且由于上下文有限,经常难以解决复杂的问题。例如,一些不需要复杂的智能体工作流的常见 AI 应用程序包括语义分析、聊天机器人和文本生成。

理想的智能体架构取决于应用程序和用例的要求。单智能体系统在解决专注、特定的问题方面表现出色,本质上相当于独立的问题解决者。

然而,有些挑战可能需要具备独特专长的专门智能体来解决,而另一些挑战则可能更适合由多个智能体协同合作、以团队方式共同完成。

智能体式架构类型

该表清晰地比较了不同的 AI 智能体架构系统类型:垂直型、水平型和混合型。该表重点介绍了系统结构、主要功能、优缺点和最佳用例,以帮助确定最适合各种任务的方法。 

单智能体架构

单智能体架构的特点是在一个环境中由单一自主实体集中决策。

  • 结构

    • 单智能体式架构是指单个 AI 智能体独立运行,以感知环境、做出决策并采取行动以实现目标的系统。

  • 主要功能

    • 自主性:智能体独立运行,不需要与其他智能体交互。
  • 优势

    • 简单性:与多智能体系统相比,更易于设计、开发和部署。需要更少的资源,因为它不需要管理多个智能体或通信协议。
    • 可预测性:更易于调试和监控,因为智能体独立运行。
    • 速度:多个智能体之间无需进行谈判或建立共识。
    • 成本:与复杂的多智能体架构相比,维护和更新成本更低。在企业应用程序中部署时,整合挑战更少。
  • 缺点

    • 可扩展性有限:在处理大量任务或复杂任务时,单个智能体可能会成为瓶颈。
    • 僵化性:在需要多步骤工作流程或跨不同领域协调的任务中表现不佳。
    • 局限性:通常只针对某一特定功能或领域而设计。
  • 最佳用例

    • 简单聊天机器人:聊天机器人能够独立运行,无需与其他智能体进行协调,并在结构化、独立的用户交互场景中表现出色。
    • 推荐系统:个性化内容推荐(如流媒体服务中的内容推荐)对于单智能体架构来说非常简单。

多智能体式架构

多智能体架构超越了传统单智能体设置的 AI 功能,带来了多种独特的优点。每个智能体专注于一个特定领域,例如性能分析、损伤预防或市场研究,同时无缝地协作以解决复杂问题。

智能体根据不断变化的任务调整其角色,有助于确保动态场景中的灵活性和响应能力。

多智能体系统更加灵活。一个智能体可能使用自然语言处理 (NLP),另一个智能体可能专注于计算机视觉。智能体可能会使用检索增强生成 (RAG) 从外部数据集中提取数据。

有许多多智能体框架提供商,例如 crewAI,这是一个基于 Python 的多智能体框架,在 LangChain 之上运行。另一个 AI 解决方案是 DeepWisdom,它提供 MetaGPT,这是一个使用由标准操作程序指导的工作流的框架。

垂直 AI 架构

  • 结构

    • 在垂直架构中,一个主智能体负责监督子任务和决策,其他智能体需要汇报以实现集中化控制。5 分层式 AI 智能体清楚自身的角色,并根据需要向其他智能体汇报或对其进行监督。
       
  • 主要功能

    • 层级结构:角色职责明确界定。
    • 集中通信:智能体向主智能体报告。
  • 优势

    • 任务效率:适合顺序工作流。
    • 明确责任:主智能体明确目标。
  • 缺点

    • 瓶颈:对主智能体的过度依赖可能阻碍进展。

    • 单点故障:易受主智能体问题影响。

  • 最佳用例

    • 工作流自动化:多步审批。

    • 文档生成:由主智能体监督的部分。

横向 AI 架构

  • 结构

    • 对等协作模式:智能体在去中心化系统中平等工作,自由协作解决任务。6

  • 主要功能

    • 分布式协作:所有智能体分享资源和想法。

    • 去中心化决策:由群体驱动的协作自主决策。

  • 优势

    • 动态问题解决:促进创新。

    • 并行处理:智能体同时处理任务。

  • 缺点

    • 协调挑战:管理不善会导致效率低下。

    • 决策缓慢:过度权衡。

  • 最佳用例

    • 头脑风暴:产生多样化的想法。

    • 解决复杂问题:应对跨学科挑战。

混合 AI 架构

  • 结构

    • 将结构化领导力与协作灵活性相结合;主智能体根据任务要求进行转变。

  • 主要功能

    • 动态领导:领导方式会根据任务所处的阶段进行调整。

    • 协作领导:领导者公开与同行交互。

  • 优势

    • 多功能性:结合了两种模型的优势。

    • 适应能力:处理既需要结构又需要创造力的任务。

  • 缺点

    • 复杂性:平衡领导角色与协作需要强有力的机制。

    • 资源管理:要求更高。

  • 最佳用例

    • 多功能任务:战略规划或团队项目。

    • 动态流程:平衡结构化需求和创造性需求。

单智能体与多智能体架构图

智能体式框架

智能体式框架是指定义智能体(无论是人工的还是自然的)如何以自主、智能的方式执行任务、做出决策以及与环境交互的设计架构或模型。这些框架为智能体如何在各种环境中操作、推理和适应提供了结构和指南。

反应式架构

反应式架构将情况直接映射到动作。它们具有反射性,基于来自环境的即时刺激做出决策,而不是依赖记忆或预测能力。他们无法从过去中吸取教训,也无法为未来制定计划。

审慎型架构

审慎型架构是一种人工智能系统,它基于推理、规划以及对世界的内部模型来做出决策。与反应型代理不同,审慎型代理会分析环境、预测未来结果,并在行动前做出明智的决策。

认知型架构

认知型智能体式架构是一种先进的人工智能系统,模拟人类的思维、推理、学习和决策过程。

这些智能体包含感知、记忆、推理和适应等要素,每个要素由独立模块表示,使其能够在复杂且不确定的环境中运行,并随着时间不断提升性能。这是最先进的智能体式架构类型。

一种 BDI 架构(更常称为模型或框架)旨在模拟智能体的理性决策过程,其基础是信念-愿望-意图 (BDI) 框架。

此架构在 BDI 智能体中对类人推理进行建模,具有:

  • 信念 (B):智能体对世界的知识,可能包括其对环境的理解、当前状况以及任何感官数据。

示例:“门关上了。”

  • 愿望 (D):智能体的目标或目的,代表其希望实现的内容。愿望并不一定等同于行动,而是更高层次的目标。

示例:“我想进入房间。”

  • 意图 (I):智能体为实现其目标而承诺采取的行动路径。意图代表智能体考虑到其信念和愿望而积极追求的计划行动。

示例:“我会开门进入房间。”

脚注

1 Bandura A. “Social cognitive theory: an agentic perspective.” Annu Rev Psychol. 2001;52:1-26. doi: 10.1146/annurev.psych.52.1.1. https://pubmed.ncbi.nlm.nih.gov/11148297/.

2 Bandura A. “Social cognitive theory: an agentic perspective.”

3 T. Masterman, S. Besen, M. Sawtell, and A. Chao, "The Landscape of Emerging AI Agent Architectures for Reasoning, Planning, and Tool Calling: A Survey," arXiv preprint arXiv:2404.11584, Apr. 2024. [Online]. Available: https://arxiv.org/abs/2404.11584.

4 E. H. Durfee and V. Lesser, "Negotiating Task Decomposition and Allocation Using Partial Global Planning," in Distributed Artificial Intelligence Volume II, ed. L. Gasser and M. Huhns (London: Pitman Publishing; San Mateo, CA: Morgan Kaufmann, 1989), 229–244.

5 Masterman, et al, “, "The Landscape of Emerging AI Agent Architectures for Reasoning, Planning, and Tool Calling: A Survey."

6 Masterman, et al, “, "The Landscape of Emerging AI Agent Architectures for Reasoning, Planning, and Tool Calling: A Survey."

相关解决方案
IBM AI 智能体开发

借助 IBM watsonx.ai 开发平台,让开发人员能够构建、部署和监控 AI 代理。

深入了解 watsonx.ai
IBM AI 智能体和助手

借助在业界首屈一指的全面功能,帮助企业构建、定制和管理 AI 智能体和助手,从而在提高生产力方面取得突破性进展。

深入了解 AI 智能体
IBM Granite

借助专为提高开发人员效率而设计的 Granite 小型开放式模型,可实现 90% 以上的成本节约。这些企业就绪型模型可根据安全基准提供卓越的性能,且适用于多种企业任务,包括网络安全、RAG 等。

深入了解 Granite
采取后续步骤

借助在业界首屈一指的全面功能,帮助企业构建、定制和管理 AI 智能体和助手,从而实现复杂工作流自动化并在提高生产力方面取得突破性进展。

深入了解 watsonx.ai 智能体开发 探索 watsonx Orchestrate