从微服务到 AI 智能体：应用程序架构的演变

应用程序架构再次迎来转折点。AI 智能体正作为现代系统的强大构建块迅速崛起，将补足、扩展甚至取代传统微服务。

这种架构转变保持了可组合组件的基本模式，同时显著提高了开发速度、适应性和集成能力。使用代理框架构建新应用程序的组织能够在快速发展的技术态势中建立竞争优势。

架构演变之旅

应用程序架构的历史揭示了分解成越来越智能的组件的一致模式。

1990年代：单体应用程序
单一代码库系统主导了企业计算，带来了重大运营挑战：

部署需要大量测试周期
扩展需要全系统复制
一个地方发生变化可能会破坏不相关的功能
开发周期可能持续数月甚至数年。

2000 年代初期：面向服务的架构 (SOA)
SOA 通过将应用程序分解为与业务相关的服务，解决了单体架构的局限性：

新架构提高了可复用性和集成能力
服务仍然占据相对较大的比重
编排复杂性导致系统十分脆弱
开发周期要以月为单位

2010 年代：微服务
微服务架构将应用程序分成更小的、可独立部署的单元：

每个微服务自主运行
服务是通过明确定义的应用程序编程接口 (API) 进行通信的
组件可独立扩展
容器化技术简化了部署
开发周期压缩为数周

Mixture of Experts | 12 月 12 日，第 85 集

解码 AI：每周新闻摘要

加入我们世界级的专家小组——工程师、研究人员、产品负责人等将为您甄别 AI 领域的真知灼见，带来最新的 AI 资讯与深度解析。

观看 Mixture of Experts 所有剧集

AI 智能体：新的架构范式

当今的前沿架构采用 AI 智能体：智能化自主组件，可增强传统微服务的功能。主要区别包括：

特征	微服务	AI 智能体
编程模型	强制规定明确的规则和逻辑	提供混合模型：经过编译的核心与推理层
适应性	需要修改代码	将优化与动态推理相结合
集成	使用 API 契约	采用双模式：具有语义理解能力的 API 契约
错误处理	有预设的响应	具有优化路径与自适应回退机制
开发工作	需要投入大量精力（单一用途代码）	更具战略性（关键路径和推理接口）

传统的支付处理微服务需要数千行代码来完成验证、处理、错误状态和整合工作。相比之下，高性能 AI 智能体将关键路径的预编译组件与复杂决策的推理能力相结合。这种混合方法有助于确保性能可靠性和自适应智能化。

例如，使用提前 (AOT) 编译在 C# 中实现 Semantic Kernel 智能体，这表明生产智能体系统在性能上可以匹敌或超过传统微服务，同时增加有价值的推理能力。

智能体框架：现代编排

正如微服务需要底层编排平台一样，AI 智能体需要专门的智能体框架。现代解决方案，如 Semantic Kernel 和 LangChain Enterprise，为智能体协调提供了所需的基础架构，确保获得企业级性能。

这些框架提供的能力超出了传统的服务编排，同时保持了预期的企业级性能标准：

高性能基础：智能体框架基于编译语言构建，采用 AOT 编译，实现可预测、低延迟的执行。
节省内存的设计：智能体框架针对高吞吐量系统进行了优化，有助于确保最低的资源消耗。
语义处理：智能体根据任务复杂度分配计算资源。
企业集成：智能体框架通过实施强大的契约约束，为现有系统提供类型安全的连接器。
混合规划：智能体框架的性能关键路径使用编译后逻辑，而复杂的场景则使用 AI 进行推理。

实际的业务优势

向智能体架构的迁移带来了可衡量的优势，例如：

智能驱动的性能：精心设计的 AI 智能体可提供卓越的性能。经过编译的智能体可以实现比传统微服务更高的吞吐量，并增加推理能力以进行复杂的欺诈检测。
企业级可靠性：智能体框架可实现稳健整合。供应链系统可以处理成千上万笔交易，并轻松处理数据不一致问题。
卓越的错误处理能力：AI 智能体将恢复路径与推理相结合。订单处理系统通过优化错误处理路径以及对新型故障进行推理来保持高可用性。
面向未来的架构：组织既能获益于当下，又能为未来谋篇布局。具有推理层的编译后智能体优化了当前性能，为未来的 AI 发展铺平了道路。

实施战略：性能优先的方法

组织需要切实可行的实施战略，在获取 AI 优势的同时保持企业标准：

性能：识别具有性能关键路径和复杂决策点的微服务，这些微服务将受益于推理能力。
架构设计：创建智能体设计，将性能关键路径（在编译后代码中实现）与处理边缘情况的推理组件分开。
框架选择：根据性能基准、与现有系统的语言兼容性以及编译选项评估智能体框架。
团队增强：建立将传统软件开发专业知识与 AI 工程技能相结合的工程团队。
系统化部署：实施和测试严格的性能基准以及推理能力。

实施性能优先的方法可以帮助组织实现运营优势，同时构建战略性 AI 功能。

评估和评估驱动型开发

AI 智能体的质量工程需要一种与传统软件测试截然不同的方法。在智能体架构方面处于领先地位的公司率先开创了评估驱动的开发，这种方法可确保智能体同时满足功能要求和推理标准。

评估框架

评估是专门的测试套件，旨在跨多个维度评估智能体行为：

功能评估：通过输入/输出断言验证核心业务功能。
推理评估：评估决策质量和问题解决方法。
行为评估：测试是否符合组织指南和伦理标准。
性能评估：衡量响应时间、吞吐量和资源使用情况。
对抗性评估：通过边缘案例和潜在故障模式对智能体进行压力测试。

在某些云、数据和 AI 提供商的内部数据显示，在为其智能体系统实施多维评估后，生产事件显著减少。

实施评估驱动型开发

成熟的评估驱动型开发流程包括以下关键要素：

1. 评估定义协议

首先，定义各个维度的期望。对于每个智能体：

记录预期的核心功能并明确成功标准
明确智能体应展现的推理模式
建立行为边界和防护机制
根据业务需求设定性能阈值

2. 持续评估管道

构建自动化管道，在整个开发生命周期内运行评估：

预提交评估可在代码整合前发现问题
整合评估可验证代理的交互
预发布评估可测试生产数据
生产监控可持续验证部署的智能体

3. 动态测试生成

利用动态生成的场景，打破静态测试用例的局限：

使用大语言模型 (LLM) 创建各种测试用例，对智能体的推理能力进行压力测试
生成已知边缘案例的变体
基于生产模式模拟新型输入

4. 人类与 AI 协作评估

将自动化测试与人类专业知识相结合：

专家评审员评估智能体在复杂场景下的推理能力
用户体验研究人员评估人机交互质量
领域专家验证业务逻辑的正确性

5. 回归预防

通过以下方式预防功能回归：

全面的评估套件，会随着发现的问题而不断完善。
智能体版本之间的 A/B 对比
关键性能指标的持续监测

斯坦福大学以人为本人工智能研究所 (HAI) 2024 年一项研究发现，采用综合评估框架的公司开发周期加快了 65%，生产回滚减少了 42%。

成功案例：金融服务实施

一家全球十大银行为其客户服务智能体实施了评估驱动型开发，并取得了令人印象深刻的结果。

他们的方法以三层评估框架为中心：用于功能验证的自动化测试套件、用于复杂决策场景的推理评估，以及用于高风险交互的人类专家评审。

该框架能够发现传统测试会遗漏的微妙问题。例如，某智能体按照政策正确批准了贷款申请，但在处理临界案例时，其推理过程无意中强化了偏见，这一问题正是通过部署前的推理评估发现的。

智能体架构的成本优化战略

智能体架构的经济可行性依赖于有效的成本管理战略。虽然 AI 智能体带来了显著的商业价值，但管理运营开支仍是关键的成功因素。

经济挑战

关于成本，组织面临两个主要考量：

令牌成本：与基础模型的每次互动都会产生令牌费用，在大规模应用后这些费用会迅速累积。具有多步骤推理的复杂智能体网络可能会生成比类似直接 API 调用多 10-15 倍的令牌。

计算成本：运行推理，特别是复杂推理，需要大量的计算资源。用于推理的本地部署 GPU 集群通常需要大量初始投资。对于中小规模部署，基于云的推理每月可能产生 10,000 美元至 50,000 美元的费用。

有效的优化方法

领先的组织已经开发出系统化的方法来管理这些成本。

1. 架构优化

混合智能体设计，将复杂决策引导至基础模型
生产部署模型的量化
针对常见查询的响应进行战略缓存

JPMorgan Chase 通过混合架构将其推理成本降低了 67%，该混合架构通过确定性路径处理 89% 的事务，为复杂场景保留了 LLM 资源。

2. 调整提示工程以提高效率

精准设计指令以最小化令牌使用
修剪上下文以消除不必要的信息
优化响应格式以减少令牌生成

3. 推理优化

用于重复交互的键值 (KV) 缓存实施
非时间敏感运营的批处理
根据工作负载模式调整部署基础架构的规模

4. RAG 实现

策略性检索增强生成，用于压缩上下文大小
矢量数据库优化，用于实现高效信息访问
上下文提炼技术，用于压缩相关信息

5. 针对领域专业化任务进行微调

创建参数数量减少的领域特定模型
将通用模型提炼成高效的专用变体
参数高效的调优方法，如 LoRA 和 QLoRA

麦肯锡 2024 年 AI 经济学报告指出，实施其中三个或更多战略可将 AI 运营成本平均降低 62%，同时保持或提高系统功能。

实施挑战

代理架构引入了新的实施考虑因素。

编排复杂度
协调自主智能体需要与传统微服务编排不同的方法：

去中心化的决策需要复杂的协调
多个智能体必须朝着共同目标努力
系统状态随着异步变化变得更加复杂

现代框架通过优先级系统和共享上下文来应对这些挑战。Microsoft 的 Semantic Kernel 可实现在智能体自主性与系统一致性之前取得平衡的编排。

可观察性和监测
传统监测方法必须与时俱进：

系统需要捕捉推理路径和决策标准
行为分析帮助识别智能体间交互的模式
预测性监测可以预测潜在的系统状态

安全与治理
代理架构引入了新的安全维度：

验证代理指令与组织政策一致的机制
用于在执行前验证智能体操作的系统
检测智能体推理合规性的功能

微服务与智能体系统的比较：一个实际的用例

为了说明微服务和智能体架构之间的区别，可以考虑金融服务交易平台。

传统微服务实施：

帐户服务负责管理客户信息和余额
交易服务根据明确的请求执行订单
市场数据服务在查询时提供价格
通知服务在预定义事件后发送警报
风险管理服务应用基于规则的检查

当客户发起交易时，系统会按照预先确定的路径运行，每一步都会在明确触发时进行。

智能体实施：

投资组合智能体持续监控持仓情况并及时提示再平衡机会
交易执行智能体根据市场状况选择最佳时机
风险评估智能体主动评估市场波动性
通信智能体通过优先通道传递相关信息

在实际操作中，智能体实施从根本上改变了客户体验。当市场波动性增加时，风险评估智能体可能会自主调整交易限额，并通知投资组合智能体，而该智能体会分析客户持仓中的潜在漏洞。该系统表现出的智能超出了明确编码的范围。

展望未来：运用平台工程，扩大智能体规模

从单体到服务到微服务再到智能体的进展遵循着清晰的历史模式。每一次演进都引入了更精细的组件，随之而来的是智能化和自主性的提升。

组织要大规模实施智能体架构，必须采用平台工程原则，在整个应用程序组合中实现始终如一的质量、成本效益和治理。

平台驱动的采用

有远见的组织利用内部开发者平台 (IDP) 加速智能体采用。

标准化智能体基础架构

预配置的智能体模板，内置监控功能
常见智能体类型的黄金路径实施模式
自动进行质量把控的自助部署

统一可观测性

对智能体的性能和行为进行集中监控
跨智能体交互追踪与可视化
自动化异常检测及根本原因分析

重视开发者体验

用于智能体开发和测试的自助服务工具
带有专用智能体调试功能的集成开发环境
开发过程中自动完成合规性检查

大规模治理

集中式政策管理和执行
根据标准自动评估智能体行为
所有智能体操作的全面审计追踪

Gartner 2024 年平台工程报告表示，成熟的平台方法可以使新智能体功能进入市场的时间加快 3.2 倍，开发者满意度提高 76%。

组织现在面临着一个选择：率先为适当的用例采用智能体架构，还是跟随占据早期优势的竞争对手。证据表明，早期实施平台驱动方法的企业在开发速度、系统灵活性和技术功能方面获得了显著的竞争优势。

了解更多信息并与 IBM® Consulting AI 专家交谈

资源

实现投资回报率：您企业中的 AI 智能体

与 IBM 携手参与网络研讨会，在此期间我们将展示如何通过智能体 AI 计划实现真正的投资回报率，并提供跨行业、用例的示例，甚至还有 IBM 自身的成功案例。

2024 年 AI 实际应用

我们对 2,000 家组织进行了调查，旨在了解他们的 AI 计划，以发现哪些方法有效、哪些方法无效，以及如何才能取得领先。

从推行 AI 项目到实现盈利：agentic AI 如何维持财务回报

了解组织如何从分散的 AI 试点，转向在核心业务中利用 AI 推动转型。

提升你的 AI 专业知识

立即购买单用户或多用户订阅，即可访问我们完整的包含 100 多个在线课程的目录，以低廉的价格扩展您的技能。

深入了解 IBM Granite

IBM® Granite® 是一系列开放、高性能且值得信赖的 AI 模型，专为企业量身定制，并经过优化以扩展您的 AI 应用程序。深入了解语言、代码、时间序列和防护措施选项。

IBM AI Academy

本课程由 IBM 资深思想领袖带领，旨在帮助企业领导者获得所需的知识，以便划分可以推动增长的 AI 投资的优先级。

2024 年 AI 实际应用

我们对 2,000 家组织进行了调查，旨在了解他们的 AI 计划，以发现哪些方法有效、哪些方法无效，以及如何才能取得领先。

2025 年 CEO 指南：加速业务增长的 5 大思维转变

激活这五种思维跃迁，以消除不确定性，推动业务重塑，并利用智能体式 AI 促进增长。

让 AI 充分发挥作用：利用生成式 AI 提高投资回报率

想要从 AI 投资中获得更好的回报吗？了解如何通过帮助您最优秀的人才构建和提供创新的新解决方案，在关键领域扩展生成式人工智能来推动变革。

解锁生成式 AI + ML 的强大功能

了解如何自信地将生成式 AI 和机器学习融入您的业务中。

树立信任，从容自信在 AI 新时代蓬勃发展

深入了解强大 AI 战略的 3 个关键要素：创造竞争优势、在整个企业中扩展 AI 以及推进值得信赖的 AI。