阅读时间
在科技媒体领域,几乎每走两步就会碰到一篇文章,宣扬2025年将是 AI 智能体之年。据说,智能体将改变我们的工作方式,影响我们生活和工作的方方面面。
我们才刚刚从 21 世纪 20 年代初的 NFT 和加密货币的疯狂炒作以及随后的元宇宙泡沫中走出来,媒体就开始大肆赞扬 生成式 AI (Gen AI),这一切伴随着 OpenAI 的 GPT 模型系列、Anthropic 的 Claude 和微软的 Copilot 等产品的发布。
虽然关于大型语言模型 (LLM) 的讨论并未完全退去,但在 2025 年,人们的关注点已从大型语言模型转了那些看似自主的人工智能 (AI) 智能体所取得的进展,这些智能体正引领着未来工作的变革。
尽管 Deepseek 的 R1 导致生成式 AI 的关注度暂时激增,因为它承诺在 ChatGPT 的基础上实现重大性能改进,但 2025 年的主导创新说法是 AI 智能体。
媒体报道强调智能体将带来的创新、自动化和效率承诺,但其中有多少表述是为了赚取点击率而进行的炒作?
广告支持的媒体世界依靠点击量发展壮大,因此我们有理由期待耸人听闻、吸引眼球的标题来吸引你的点击。但是,我们对 2025 年的agentic AI究竟有何现实期待?它将如何影响我们的生活?
为了拨开炒作的迷雾,我们采访了几位 IBM 专家,旨在就 AI 智能体及其未来发展方向进行更理性的探讨。我们经验丰富的内部人员团队包括:
Maria Danilevsky:Language Technologies 高级研究科学家
Vyoma Gajjar:AI 技术解决方案架构师
Chris Hay:杰出工程师
AI 智能体是一种能够自主理解、规划和执行任务的软件程序。AI 智能体由 LLM 驱动,可以根据需要与工具、其他模型以及系统或网络的其他方面进行交互,以实现用户目标。
我们不仅要求聊天机器人根据冰箱中的可用食材推荐晚餐食谱,智能体也不仅是自动发送客户体验电子邮件,通知您需要几天时间才能让真实世界的人收到您的查询,我们要做的远不止于此。
AI 智能体与传统 AI 助手不同,后者每次生成响应时都需要用户给出提示。理论上,用户只需给智能体一项高级任务,然后这个智能体就能自行找出完成任务的方法。
目前的产品仍处于实现这一理念的早期阶段。“市场上通常所说的‘智能体’是指在 LLM 中增加基本的规划和工具调用(有时称为函数调用)功能,”Ashoori 说,“这些使 LLM 能够将复杂的任务分解成 LLM 可以执行的较小步骤。”
Hay 乐观地认为,更强大的智能体即将出现:“你不需要在今天的模型上进行任何进一步的改进来构建未来 AI 智能体,”他说。
抛开这些不谈,未来一年关于智能体的讨论将聚焦哪些方面,我们又能认真对待其中的多少内容呢?
“IBM 和 Morning Consult 对 1,000 名为企业构建 AI 应用程序的开发人员进行了调查,其中 99% 的人表示他们正在深入了解或开发 AI 智能体,”Ahoori 解释道。 “所以,是的,答案是 2025 年将成为 AI 智能体之年。”然而,这一论断并非毫无细节差异。
在确立了当前市场将智能体视为具备函数调用功能的大型语言模型 (LLM) 这一观念后,Ashoori 将这一观点与真正自主的 AI 智能体区分开来。“(AI 智能体的)真正定义是具有推理和计划能力的智能实体,能够自主采取行动。不过,这些推理和规划能力仍有待深入讨论。这取决于你如何定义这些能力。”
“我确实看到 AI 智能体正朝着这个方向发展,但我们还没有完全实现这一目标,”Gajjar 说,“现在,我们看到了一些初步迹象:AI 智能体已经可以在一定程度上分析数据、预测趋势和自动化工作流。但是,构建能够自主处理复杂决策的 AI 智能体需要的不仅仅是更好的算法。我们需要在情境推理和边缘案例测试方面取得长足的飞跃,”她补充说。
Danilevsky 并不相信这是什么新鲜事。“我仍然很难真正相信这与单纯的编排有什么不同,”她说,“您对‘编排’进行重新命名,但现在叫‘智能体’,因为这是个很酷的词。但编排是我们在编程中一直在做的事情。”
对于“2025 年是智能体之年”这一说法,Danilevsky 持怀疑态度。“这取决于您所说的智能体是什么,您认为智能体将实现什么,以及您认为智能体将带来什么样的价值,”她说,“在我们还没有搞清楚更普遍的 LLM 技术的投资回报率 (ROI) 时,就提出这样的说法很不现实。”
而且,不仅是商业层面让她持谨慎态度。“人们热衷于想象这样一个场景:这个东西能替你思考,做出所有决策,并在你的电脑上采取行动。但老实说,这太可怕了。”
Danilevsky 将这种脱节归咎于沟通不畅。“[智能体]往往非常低效,因为人类的沟通能力非常差。我们仍然无法让聊天智能体始终正确地理解您的需求。”
尽管如此,即将到来的一年充满希望,是一个实验时代。“我坚信 [2025 年是智能体之年],”Hay 兴奋地说。
如今,每一家大型科技公司和数百家初创企业都在尝试开发智能体。例如,Salesforce 发布了 Agentforce 平台,使用户能够创建易于集成到 Salesforce 应用程序生态系统中的智能体。
“浪潮即将到来,我们将拥有大量的智能体。这仍然是一个非常新兴的生态系统,所以我认为很多人都会去开发智能体,而且,他们会从中获得很多乐趣。”
此说法假设当今的智能体符合本文引言中概述的理论定义。2025 年的智能体将是完全自主的 AI 程序,它们能够确定项目范围,并使用所有必要的工具完成项目,而无需人类合作伙伴的帮助。但这种说法缺少细微的差别。
Hay 认为,这种发展的基础已经奠定。“智能体的最大特点是它们有规划能力,”他概述道,“它们有能力进行推理、使用工具和执行任务,而且它们需要在速度和规模上做到这一点。”
他列举了 4 项进展,与 12 至 18 个月前的最佳模型相比,这些进展意味着 2025 年初的模型能够为支持这一叙事观点的人所设想的智能体提供动力:
更好、更快、更小的模型
思维链 (COT) 训练
增加上下文窗口
函数调用
“现在,这些技术大部分都已投入应用,” Hay 继续说道,“你可以让 AI 调用工具。它能进行规划,能够推理并给出不错的答案。它能利用推理时的计算能力。你将拥有更强大的思维链和更多的内存来处理信息。它会运行得更快,成本也会更低。这将引领你进入一个我认为可以拥有智能体的结构中。模型在不断改进,性能也在不断提升,所以这一切只会加速发展。”
Ashoori 谨慎地区分了智能体未来能做什么和现在能做什么。“有的是承诺,有的是智能体现在能够做的事情,”她说,“我认为答案取决于用例。对于简单的用例,智能体能够[选择正确的工具],但对于较复杂的用例,技术还有待成熟。”
Danilevsky 对这种说法进行了情境式表述。“如果某件事在某一时刻成立,并不意味着它总是成立。智能体可以做一些事情吗?当然能。但这是否意味着您可以将脑海中浮现的任何想法都智能体化?不可以。”
对于 Gajjar 来说,问题是风险和治理。“我们看到 AI 智能体从内容生成器演变为自主的问题解决者。这些系统必须在沙盒环境中进行严格的压力测试,以避免级联故障。设计回滚操作机制并确保审计日志是使这些智能体在高风险行业中生存下去不可或缺的一部分。
但她乐观地认为我们将积极应对这些挑战。“我确实认为,今年我们会在创建回滚机制和审计跟踪方面看到进展。这不仅涉及构建更智能的 AI,还涉及设计安全网,以便在出现偏离正轨时能够快速追踪并修复问题。”
虽然 Hay 对 2025 年智能体开发的潜力持乐观态度,但他看到了另一个领域的问题:“大多数组织还没有为智能体做好准备。有意思的一点是,要暴露出你今天在企业中拥有的 API。那将是令人兴奋的工作所在。而这并不取决于模型会有多好,而是取决于你为企业的智能体应用准备得有多充分。”
这种说法所设想的“新常态”是,AI 智能体团队被纳入管理整个项目工作流的协调器超级模型下。
企业将利用 AI 编排来协调多个智能体和其他机器学习 (ML) 模型协同工作,并利用特定的专业知识来完成任务。
Gajjar 认为这一预测不仅可信,而且很有可能实现。 “我们正处于这一转变的起步阶段,但进展迅速。今年,AI 编排器很容易成为企业 AI 系统的支柱,用于连接多个智能体、优化 AI 工作流以及处理多语言和多媒体数据。”她如此表示。不过,她警告说,在没有采取适当保障措施的情况下,切勿急于求成。
“与此同时,要扩大这些系统的规模,就需要强有力的合规框架来确保一切顺利运行,同时又不牺牲问责制,” Gajjar 警告说,“2025年可能是我们从实验阶段迈向大规模应用的年份,我迫不及待地想看看企业如何在速度与责任之间找到平衡。”
组织必须像采用最新创新一样,以同样的热情致力于数据和 AI 治理与合规。
“您将拥有一个 AI 编排器,而它们将与多个智能体协同工作,”Hay 概述道,“较大的模型将是一个编排器,而较小的模型将执行受限的任务。”
然而,随着智能体的发展和改进,Hay 预测,将会从协调的工作流转向单智能体系统。"随着单个智能体的能力越来越强,你会转而说'我有一个智能体,它能从头到尾完成所有事情'"。
Hay 预测,随着模型的发展,系统将经历一个反复的演变过程。“您会遇到[单个智能体所能达到的]极限,然后又会回到多智能体协作模式。您将在多智能体框架和单个神级智能体之间来回切换。”虽然 AI 模型将成为决定项目工作流的因素,但 Hay 认为,人类将始终处于主导地位。
对于 Ashoori 来说,元编排器的需求并非必然,而取决于预期的用例。“这是一个架构决策,”她解释道,“根据定义,每个智能体都应该能够确定是否需要与其他智能体进行编排、引入一系列工具,或者是否需要一些补充数据。您不一定需要一个居高临下、监控所有智能体并指示它们做什么的中间智能体。”
但是,在某些情况下,您可能需要。“您可能需要弄清楚如何根据您的目的使用专业智能体组合,”Ashoori 假设道,“在这种情况下,您可以决定创建自己的智能体来充当编排器。”
Danilevsky 建议企业首先了解哪些工作流可以且应该实现智能体化,以及预期的投资回报率程度,然后再据此制定 AI 战略。"是否会有一些编排流程涉及某些智能体?当然会。但是,组织中的所有事务是否都应该通过智能体流程来编排?不,这行不通。"
关于智能体技术未来一年被采用的主流观点是,智能体将增强人类员工的能力,但并不一定会取代他们。支持者说,智能体将成为人类主导的精简工作流中的贡献者。
然而,在围绕企业 AI 应用的持续讨论中,对 AI 导致失业的担忧始终是一个挥之不去的话题。随着智能体能力的提高,企业领导者是会鼓励智能体与人类员工之间的协作,还是会寻求用 AI 工具取代人类员工呢?
Ashoori 认为,最佳的前进道路在于信任员工,让他们决定如何在各自的工作中更好地利用 AI。“我们应该赋予员工权力,让他们决定如何充分利用智能体,但不必在所有情况下都取代人工客服,”她解释道。有些工作职能很适合交给智能体处理,而在另一些职能中,人类的投入则是不可替代的。“AI 智能体或许可以记录并总结会议内容,但你不会派智能体来跟我进行这场对话。”
Danilevsky 认同 Ashoori 的观点,并指出,在工作场所采用 AI 智能体并非一蹴而就。“你仍然会遇到这样的情况:一旦事情变得更加复杂,你就需要人工干预。” 尽管企业领导者可能会希望通过裁员来削减短期成本,但 AI 智能体的使用“……将更多地演变为一种增强型角色。你应该始终有人类参与其中,人类得到帮助,但最终决策仍由人类作出。” Danilevsky 在描述她对 AI 的“人在回路中” (HITL) 愿景时说道。
Hay 认为,在工作中采用 AI 是一条可持续发展的道路。"如果我们能正确做到这一点, AI 就能增强人类的能力,把事情做得更好。如果 AI 应用得当,那么它就能解放我们,让我们去做更有意思的事情。"但与此同时,他也能想象出另一个未来版本,即 AI 被过度优先。"确实存在一种风险,那就是如果我们做得不好、不正确,最终可能会变成人类去增强 AI,而不是 AI 来增强人类。"
Gajjar 也警告说不要过于依赖AI。"我认为 AI 智能体不会在一夜之间取代我们的工作,但它们肯定会重塑我们的工作方式。重复性、低价值的任务已经在被自动化,这让人们腾出手来从事更具战略性和创造性的工作。话虽如此,企业在引入 AI 时仍需有明确意图。AI 治理框架——比如那些注重公平性、透明度和问责制的框架——将是关键所在。”
对 Hay 来说,开源 AI 模型的一个优势是它们如何就未来的 AI 智能体市场以及后续盈利为创建者打开大门。“我认为开源智能体是关键,”Hay 说道,“因为开源,任何人都可以构建智能体,它可以执行有用的任务,而且您可以创建自己的公司。”
Hay 认为,权衡人工智能带来的潜在发展阵痛与组织结构调整,以及 AI 驱动的益处至关重要,尤其是在全球南方地区。
LLM 提供基于文本的输出,在没有可靠互联网连接的地区,这些输出可以通过短信传达给用户。“由于 AI 可以在低带宽场景下工作,而且成本越来越低,因此在[没有强大互联网接入的]国家或地区也能实现这一目标,这非常令人兴奋,”Hay 说道。
在这些对话中,我们的四位专家反复提到两个主题。除了我们讨论的四种说法之外,要想在当前的 AI 爆炸式增长中保持可持续发展,企业和商业领导者需要接受以下两个理念:
“随着这些智能体深入融入运营,公司需要治理框架来监控性能并确保问责制,”Gajjar 强调,“这正是 IBM 负责任的 AI 方法的真正优势所在。我们的重点是确保 AI 与人类合作,而不是对抗人类,并从第一天起构建值得信赖且可审计的系统。”
Ashoori 描绘了智能体式 AI 可能带来的一系列问题。“如今使用智能体,基本上就是拿到 LLM,然后让它替你采取行动。如果这个行动是连接到数据集并移除一堆敏感记录,该怎么办?”
“科技不会思考。它不可能负责,”Danilevsky 说道。就意外数据泄露或删除等风险而言,“风险的规模更大”,她说,“人类在有限的时间内只能做有限的事情,而科技可以在更短的时间内完成任务,而且我们可能察觉不到。”
当这种情况发生时,我们不能简单地把责任推卸给 AI,而免除责任人的责任。“组织中的某个人要为这些行为承担责任,”Hay 警告说。
"因此,这里的挑战就变成了透明度,"Ashoori 说,“以及智能体所采取的每一项行动的可追溯性。你需要确切知道正在发生什么,并能够跟踪、追溯并控制它。”
对于 Danilevsky 来说,自由实验是通过可持续发展的道路。 “让人们实际与技术互动、构建技术并尝试破解技术,[这具有很大价值。]”她还敦促开发人员在确定使用哪些模型以及向这些模型输入哪些数据时要谨慎。 “[有些提供商会]拿走你的所有数据。所以还是要小心一点。”
“当前的 AI 热潮绝对是由 FOMO 驱动的,当该技术变得更加常态化时,这种热潮就会平息下来,”Danilevsky 预测道,“我认为人们将开始更好地了解哪些东西有效,哪些无效。”“重点还应放在将 AI 智能体集成到生态系统中,使它们能够持续学习和适应,从而推动长期效率的提高,”Gajjar 补充说。
Danilevsky 很快就明确了大家的期望,并将对话重新聚焦到可证明的业务需求上。“企业需要小心谨慎,不要成为寻找钉子的锤子,”她开始说,“当 LLM 刚刚出现时,我们就遇到过这种情况。大家说,‘第一步:我们要使用 LLM。第二步:我们应该用它们做什么?”
Hay 鼓励企业提前为智能体做好准备。“那些能够利用自身私有数据,并以一种让智能体能够针对你的文档进行研究的方式来组织这些数据的组织,将获得价值。”每个企业都拥有大量有价值的专有数据,将这些数据转化为能够支持智能体工作流的动力,有助于实现积极的投资回报率。
“借助智能体,企业可以充分利用专有数据和现有的企业工作流来实现差异化和进行扩展,”Ashoori 说道,“去年是企业实验和探索的一年。他们需要扩大这种影响并最大限度地提高生成式 AI 的投资回报率。智能体是实现这一目标的关键。”
有关在企业中成功实施人 AI 的更多信息,请阅读 Maryam Ashoori 撰写的《代理式人工智能成本分析指南》 。此外,也别忘了收听 Vyoma Gajjar 和 Chris Hay 在 IBM 的 Mixture of Experts 播客节目中阐述的他们对 2025 年 AI 的预测。
1 2025 年 AI 的 5 大预测 ,Tharin Pillay 和 Harry Booth,《时代》杂志,2025 年 1 月 16 日。
2 Autonomous agents and profitability to dominate AI agenda in 2025, executives forecast,Katie Paul,路透社,2024 年 12 月 13 日。
3 2025:代理式人工智能与实体人工智能——一个价值数万亿美元的经济体正在崛起,Timothy Papandreou,福布斯,2025 年 1 月 15 日。
利用 watsonx Orchestrate 的自动化技术,简化工作流程,重新掌控日常。
借助值得信赖的 AI 解决方案,您可以勾勒未来业务发展蓝图。
IBM Consulting AI 服务有助于重塑企业利用 AI 实现转型的方式。