智能体架构指的是智能体式 AI 框架的结构与设计。智能体架构是一种在智能体式 AI 系统中塑造虚拟空间和工作流结构以实现 AI 模型自动化的架构。
智能体式 AI 是一种使用 AI 智能体 代表用户或其他系统自主执行任务的系统或程序。智能体式架构旨在支持和规范在生成式人工智能(生成式 AI)系统中运行的 AI 驱动智能体的行为。智能体式人工智能系统要求其智能体具有适应性并能导航动态环境以实现预期结果。
该模型与人类心理学没有太大区别,智能体是指根据一个人的行为有意识地使某事发生的能力。1为了实现预期的结果,必须使用计划、行动、记忆和反思。这些特征与单智能体和多智能体框架中使用的现代 AI 智能体的特征一致。
机器学习 (ML) 算法和大型语言模型 (LLM)(例如 OpenAI 的 GPT)的进步推动了 AI 智能体的发展。智能体式架构的目标是为 LLM 提供一种结构,以自动执行智能体来完成复杂的任务。
AI 智能体的自主或决策行为取决于使其成为可能的基础设施。智能体式架构旨在适应动态环境,提升互操作性。
例如,智能体可以与各种数据源和格式、应用程序编程接口 (API) 或系统进行交互。这种适应性强的行为使智能体能够做出明智的决策。
智能体式人工智能架构应由能够应对智能体核心要素的组件构成:意向性(规划)、预见性、自我反应性和自我反思性。2这些因素为人工智能智能体提供了自主权,以便它们可以设定目标、制定计划、监控其性能并进行反思以实现特定目标。
智能体技术使用后端工具调用来收集最新信息,执行复杂工作流程的优化并自动生成任务以实现复杂目标。
在运行过程中,自主智能体会随着时间的推移适应用户的偏好,提供更加个性化的体验并提供更详细的响应。该工具调用过程无需人工输入即可运行,为现实世界的 AI 应用程序解锁了更广阔的可能性。
智能体式架构支持人工智能智能体内的智能体式行为。AI 智能体是由机器学习驱动的适应性系统,可以与外部环境交互并使用工具来完成特定目标。并非所有 AI 智能体都是智能体式的。这取决于编排框架或系统的复杂性和能力。
智能体式架构使 AI 智能体能够以一定程度的自主性行事,并根据目标做出决策,而无需不断接受人类的输入。3AI 智能体几乎不需要人工干预即可完成其特定任务。
在非智能体式架构中,LLM 能够执行单一或线性任务。4、非智能体式架构中,AI 模型的功能是根据输入和上下文提供输出。
如果没有显式编排,LLM 就无法实时保留新信息,并且由于上下文有限,经常难以解决复杂的问题。例如,一些不需要复杂的智能体工作流的常见 AI 应用程序包括语义分析、聊天机器人和文本生成。
理想的智能体架构取决于应用程序和用例的要求。单智能体系统在解决专注、特定的问题方面表现出色,本质上相当于独立的问题解决者。
然而,有些挑战可能需要具备独特专长的专门智能体来解决,而另一些挑战则可能更适合由多个智能体协同合作、以团队方式共同完成。
该表清晰地比较了不同的 AI 智能体架构系统类型:垂直型、水平型和混合型。该表重点介绍了系统结构、主要功能、优缺点和最佳用例,以帮助确定最适合各种任务的方法。
单智能体架构的特点是在一个环境中由单一自主实体集中决策。
多智能体架构超越了传统单智能体设置的 AI 功能,带来了多种独特的优点。每个智能体专注于一个特定领域,例如性能分析、损伤预防或市场研究,同时无缝地协作以解决复杂问题。
智能体根据不断变化的任务调整其角色,有助于确保动态场景中的灵活性和响应能力。
多智能体系统更加灵活。一个智能体可能使用自然语言处理 (NLP),另一个智能体可能专注于计算机视觉。智能体可能会使用检索增强生成 (RAG) 从外部数据集中提取数据。
有许多多智能体框架提供商,例如 crewAI,这是一个基于 Python 的多智能体框架,在 LangChain 之上运行。另一个 AI 解决方案是 DeepWisdom,它提供 MetaGPT,这是一个使用由标准操作程序指导的工作流的框架。
垂直 AI 架构
缺点
瓶颈:对主智能体的过度依赖可能阻碍进展。
单点故障:易受主智能体问题影响。
最佳用例
工作流自动化:多步审批。
文档生成:由主智能体监督的部分。
横向 AI 架构
结构
对等协作模式:智能体在去中心化系统中平等工作,自由协作解决任务。6、
主要功能
分布式协作:所有智能体分享资源和想法。
去中心化决策:由群体驱动的协作自主决策。
优势
动态问题解决:促进创新。
并行处理:智能体同时处理任务。
缺点
协调挑战:管理不善会导致效率低下。
决策缓慢:过度权衡。
最佳用例
头脑风暴:产生多样化的想法。
解决复杂问题:应对跨学科挑战。
混合 AI 架构
结构
将结构化领导力与协作灵活性相结合;主智能体根据任务要求进行转变。
主要功能
动态领导:领导方式会根据任务所处的阶段进行调整。
协作领导:领导者公开与同行交互。
优势
多功能性:结合了两种模型的优势。
适应能力:处理既需要结构又需要创造力的任务。
缺点
复杂性:平衡领导角色与协作需要强有力的机制。
资源管理:要求更高。
最佳用例
多功能任务:战略规划或团队项目。
动态流程:平衡结构化需求和创造性需求。
智能体式框架是指定义智能体(无论是人工的还是自然的)如何以自主、智能的方式执行任务、做出决策以及与环境交互的设计架构或模型。这些框架为智能体如何在各种环境中操作、推理和适应提供了结构和指南。
反应式架构将情况直接映射到动作。它们具有反射性,基于来自环境的即时刺激做出决策,而不是依赖记忆或预测能力。他们无法从过去中吸取教训,也无法为未来制定计划。
审慎型架构是一种人工智能系统,它基于推理、规划以及对世界的内部模型来做出决策。与反应型代理不同,审慎型代理会分析环境、预测未来结果,并在行动前做出明智的决策。
认知型智能体式架构是一种先进的人工智能系统,模拟人类的思维、推理、学习和决策过程。
这些智能体包含感知、记忆、推理和适应等要素,每个要素由独立模块表示,使其能够在复杂且不确定的环境中运行,并随着时间不断提升性能。这是最先进的智能体式架构类型。
一种 BDI 架构(更常称为模型或框架)旨在模拟智能体的理性决策过程,其基础是信念-愿望-意图 (BDI) 框架。
此架构在 BDI 智能体中对类人推理进行建模,具有:
信念 (B):智能体对世界的知识,可能包括其对环境的理解、当前状况以及任何感官数据。
示例:“门关上了。”
愿望 (D):智能体的目标或目的,代表其希望实现的内容。愿望并不一定等同于行动,而是更高层次的目标。
示例:“我想进入房间。”
意图 (I):智能体为实现其目标而承诺采取的行动路径。意图代表智能体考虑到其信念和愿望而积极追求的计划行动。
示例:“我会开门进入房间。”
1 Bandura A. “Social cognitive theory: an agentic perspective.” Annu Rev Psychol. 2001;52:1-26. doi: 10.1146/annurev.psych.52.1.1. https://pubmed.ncbi.nlm.nih.gov/11148297/.
2 Bandura A. “Social cognitive theory: an agentic perspective.”
3 T. Masterman, S. Besen, M. Sawtell, and A. Chao, "The Landscape of Emerging AI Agent Architectures for Reasoning, Planning, and Tool Calling: A Survey," arXiv preprint arXiv:2404.11584, Apr. 2024. [Online]. Available: https://arxiv.org/abs/2404.11584.
4 E. H. Durfee and V. Lesser, "Negotiating Task Decomposition and Allocation Using Partial Global Planning," in Distributed Artificial Intelligence Volume II, ed. L. Gasser and M. Huhns (London: Pitman Publishing; San Mateo, CA: Morgan Kaufmann, 1989), 229–244.
5 Masterman, et al, “, "The Landscape of Emerging AI Agent Architectures for Reasoning, Planning, and Tool Calling: A Survey."
6 Masterman, et al, “, "The Landscape of Emerging AI Agent Architectures for Reasoning, Planning, and Tool Calling: A Survey."
借助 IBM watsonx.ai 开发平台,让开发人员能够构建、部署和监控 AI 代理。
借助在业界首屈一指的全面功能,帮助企业构建、定制和管理 AI 智能体和助手,从而在提高生产力方面取得突破性进展。
借助专为提高开发人员效率而设计的 Granite 小型开放式模型,可实现 90% 以上的成本节约。这些企业就绪型模型可根据安全基准提供卓越的性能,且适用于多种企业任务,包括网络安全、RAG 等。