过去几年来,生成式 AI 一直是技术专家中的热门新事物,但最近有一个新术语悄然进入人工智能 (AI) 开发社区。“智能体式”是 AI 领域最新的流行语,在本示例中,相信这一流行语是合适的。智能体式 AI 结合了大型语言模型 (LLM) 的多功能性、灵活性以及传统编程的精确性。
AI 智能体是指一个系统或程序,它能够通过设计其工作流和利用可用工具,代表用户或其他系统自主执行任务该系统具有“自主性”,能够做出决策、采取行动、解决复杂问题,并与系统机器学习 (ML) 模型训练所依据的数据之外的外部环境进行交互。
AI 智能体不仅可以从数据库和网络中获取信息,还可以从用户行为中学习,随着时间的推移而不断改进。智能体的适应性使它们能够处理传统 AI 无法处理的复杂、多步骤 AI 应用,这使它们成为现代组织流程自动化战略的关键部分。
如果您向一个通用的 LLM 聊天机器人 (如 ChatGPT)询问购买哪种冰淇淋机,该模型的自然语言处理 (NLP) 能力将使其能够根据训练数据(可能包括从互联网上抓取的信息)给出建议。但您需要的不是过去的通用建议,而是考虑到实时信息的建议。
智能体式 AI 平台由一个编排多个智能体行为的 LLM 组成,这些智能体可以部署在各种应用中。这些智能体可能是更高级的 AI 模型,也可能是简单的搜索工具,能够快速在知识库或在线查找信息。继续前面的例子,想象一下,如果 LLM(如 GPT)也能访问实时电子商务数据和您的支付详情。
此类智能体式 AI 平台不仅可以告诉您人们喜欢某个特定零售商正在打折的特定冰淇淋机,而且理论上还可以代表您购买。智能体式 AI 让我们更接近直到最近还被视为科幻小说的场景,在这些场景中,机器可以完成涉及复杂工作流、数据驱动决策和行动等复杂任务,且几乎不需要人工干预。
有充分理由认为,围绕智能体式 AI 的热潮是合理的。以下是 4 个理由:
LLM 擅长处理和生成类人文本,使得用户能更轻松地使用自然语言命令与 AI 交互。这降低了对显式编程知识的需求。LLM 能够基于细致入微、依赖上下文的理解来生成响应或行动,这在传统编程可能难以覆盖所有边缘情况的场景中非常有用。除此之外,LLM 在内容生成、代码补全、摘要等任务上具有创造性。这种生成能力很难用传统的基于规则的编程来复制。
与此同时,传统编程具有高度的结构化、确定性和可靠性,使其非常适合需要精确性、可重复性和可验证性的任务。传统编程语言提供了对任务执行方式的精细控制,有助于确保复杂工作流、算法或特定系统要求可以被明确定义和优化。对于需要高性能或独特功能的任务,传统编程通常更高效。
智能体式 AI 系统实现了优势融合:既利用 LLM 处理需要灵活性与动态响应的任务,又将这种 AI 能力与传统编程相结合,以执行严格规则、逻辑运算与性能优化。这种混合方法使 AI 既直观又精确。智能体能够自主执行任务,同时适应新数据或动态环境——这对于静态代码而言颇具挑战。与此同时,关键流程(如安全或计算)可以依赖于确定性的传统算法。
一个智能体式 AI系统可能包含简单的反射智能体,这些智能体能够出色且始终如一地执行简单任务。更复杂的基于规则的智能体可以利用当前感知并依赖记忆,使它们能够接收和存储新信息,从而能够执行更广泛的任务。学习智能体还可以采集新数据,并利用这些数据来指导后续决策,随着时间的推移提高准确性。一个强大的智能体式 AI 平台可能涉及数十甚至数百个不同能力的智能体的协同工作。
LLM 通常在静态数据集上进行训练,这些数据集代表截至特定时间点的信息快照。LLM 无法在训练期后主动从网络上收集新信息。它们只能根据自身已经“知道”的内容生成响应。它们无法自行访问或更新来自外部来源的实时数据。
LLM 无法直接与外部工具或数据处理系统(例如电子表格、云平台或分析软件)交互,也无法自主设置系统来监控和收集持续数据(例如物联网传感器、业务流程或系统日志),因为它们并非为执行持续任务而设计。
智能体式 AI 可被设计用于搜索网络、调用 应用程序编程接口 (API) 或查询数据库。智能体能够获取实时信息、检索更新或提取对决策至关重要的特定数据点。智能体可以启动并管理数据记录、实时监控和趋势分析等任务。它们能够主动跟踪和收集来自物联网设备、社交媒体源或其他系统的数据流,为 LLM 提供新鲜输入,以支持更明智的决策和情境化响应。
智能体式 AI 可以利用反馈循环,主动寻找新数据来完善其模型或决策。这可能涉及定期查询新数据源、收集用户反馈或分析真实世界的成果,以更新和改进其理解或策略。通过这种方式,LLM 可以从更丰富、持续发展的数据中实现优化。
凭借 LLM 的强大功能和智能体的针对性能力,智能体式 AI 可以在无需持续人工监督的情况下独立运行并自主执行特定任务。这使得它能够在人类监督有限或不必要的环境中持续运行。自主系统可以维护长期目标、管理多步骤任务并在一段时间内跟踪进度。
例如,一个智能体式 AI 可以被指派管理一场营销活动,持续监控绩效、调整策略并根据反馈优化结果,而无需每一步都进行人工干预。
在医疗保健领域,智能体可以监控患者数据,根据新的测试结果调整治疗建议,并通过向临床医生提供实时反馈。
在网络安全方面,智能体可以持续监控网络流量、系统日志和用户行为,以发现可能有潜在安全威胁的异常情况,如恶意软件、网络钓鱼攻击或未经授权的访问尝试。在供应链中,AI 可以自主向供应商下订单或调整生产计划,以保持最佳库存水平。
在人力资源方面,智能体可以分析新员工的角色和背景,从而创建个性化的入职培训路径。它可以基于个人的先前经验、角色要求和学习进度调整内容和学习材料。
可以想象,许多目前通过软件即服务 (SaaS) 产品执行的业务功能可能会被智能体式系统取代或增强,这些系统使员工能够通过自然语言输入和简化的用户界面更高效地与数据交互并执行任务。
例如,想象一下软件开发人员用于跟踪项目进度的工单系统。这样的系统需要许多表格、标签和工作流,其内容在一开始并不总是容易理解的。要获取有用的信息,用户需要寻找正确的数据,浏览一系列复杂的菜单以获取所需的信息。然后,他们可能需要使用这些信息来创建演示文稿。
如果用户不需要在表格和标签中排列所有数据,而只需要用简单的人类语言询问所需的信息,那会怎样?
例如,想象一下生成一张演示幻灯片,显示 5 个条形图,代表每个员工当月完成的每张工单,并可追溯到 5 年前,而这一切都无需对复杂的数据集进行手动排序。
手动获取这些数据可能需要半个小时,而以整洁的格式显示这些数据以便进行流畅的演示又需要半个小时,但智能体可以在几秒钟内将这些数据集成在一起。
对于那些难以看到生成式 AI 带来的好处的组织来说,智能体可能是找到实际商业价值的关键所在。单一的 LLM 令人印象深刻,但它们在企业 AI 领域的应用场景有限。目前投入到少数 LLM 的巨额资金是否会在真实世界的应用场景中得到回报还有待观察,但智能体式 AI 代表了一个很有前途的框架,它将 LLM 带入真实世界,为更加 AI 驱动的未来指明了方向。
借助 IBM watsonx.ai 开发平台,让开发人员能够构建、部署和监控 AI 代理。
借助在业界首屈一指的全面功能,帮助企业构建、定制和管理 AI 智能体和助手,从而在提高生产力方面取得突破性进展。
借助专为提高开发人员效率而设计的 Granite 小型开放式模型,可实现 90% 以上的成本节约。这些企业就绪型模型可根据安全基准提供卓越的性能,且适用于多种企业任务,包括网络安全、RAG 等。