复合 AI 系统是将多个 AI 模型、技术或系统结合起来,能够比单个人工智能 (AI) 模型更有效地解决复杂问题,属于高级配置。这些系统集成了不同的组件,每个组件都专门负责一项特定任务,协同工作,也可以按顺序工作。
尽管大型语言模型 (LLM) 备受关注,但这些大规模机器学习 (ML) 模型却面临着种种限制。它们的运行和开发成本高,速度慢。它们缺乏特定领域的专业知识,并不总是擅长处理涉及跨系统多个步骤的复杂任务。
由于存在这些限制,研究人员发现,用其他模型和工具对单一模型进行补充(每个模型和工具都针对特定角色进行了优化),可以使方法更加有效。
伯克利人工智能研究 (BAIR) 实验室在 2024 年发表的一篇博客文章,较早地阐明了复合 AI 系统的前景。这篇博文提出,通过构建复合 AI 系统可能会获得更好的结果,AI 的未来将涉及将 LLM、检索系统、AI 智能体和外部工具结合在一起的组织,每种工具都针对特定任务进行了优化。
协调多个单独的模型和相互作用的组件有很多优点。
通过将任务分配给专门的模型,复合系统减少了单个 AI 组件的认知负担。例如,一个模型可能专注于分析结构化数据,而另一个模型则解释图像或文本等非结构化数据。与单个模型系统相比,这种分工提高了性能和准确性。
LLM 令人印象深刻,在获得更多计算资源后,LLM 的表现也越来越好,但由于可扩展性规律,LLM 也会遇到性能上限和收益递减的问题。有时,与其向 LLM 投入更多计算资源,不如将某些任务委托给另一个对资源要求不高的模型、智能体或工具。
结合多个模型来完成一项任务,有时比训练单个 LLM 来完成任务更快。此外,复合系统可以同时处理不同类型的数据,从而实现实时决策。这在 AI 应用(如欺诈检测)或边缘应用(必须最大限度地减少延迟)中至关重要,因为在欺诈检测中,快速响应是必不可少的。
复合系统用途广泛,适用于不同的用例。这使复合 AI 系统成为旨在优化多个领域的运营的企业的首选。
结合使用预训练组件、开源解决方案和自定义模块的系统设计可让各组织受益匪浅。随着技术的发展,每个组件都可以单独更新或替换,而无需对整个系统进行全面改造。通过将任务分配给不同的模型,复合系统可获得适应性和对单个组件故障的复原力。
包括检索增强生成 (RAG) 在内的复合方法使 LLM 能够访问其初始训练数据集之外的数据源,从而扩展了 LLM 的功能。组合不同的模型使开发人员能够针对特定目标(例如速度或领域专业知识)进行优化。
LLM 可能很笨重,容易产生幻觉,做出的决定也不一定总能解释清楚。复合 AI 解决方案可以帮助控制输入和过滤输出,使行为更加可控,从而提高信任度。
复合 AI 系统已在现实世界的用例中得到使用,例如:
某些版本的聊天机器人,包括 OpenAI 的 ChatGPT 和 Microsoft 的 Copilot,都是建立在复合架构上的。例如,ChatGPT 通过多种工具和 API 为特定任务扩展其效用。
它汇集了 LLM、DALL-E 图像生成器和代码解释器插件。它使用 RAG 来动态访问外部数据源和知识库。单独的 AI 模型用于检测和过滤有害或不恰当的内容,然后再做出响应。
虽然这项技术尚未成为主流,但自动驾驶汽车系统利用计算机视觉模型来检测和识别汽车周围的物体。传感器融合算法将来自摄像头、激光雷达、雷达和超声波传感器的数据结合起来,绘制出全面的三维环境地图,从而增强态势意识。
强化学习模型可根据实时情况进行决策,例如决定何时变道、调整车速或在交通信号灯前停车。
此外,自然语言处理 (NLP) 使车辆能够解读和响应乘客的口语指令。这些组件无缝协作,处理大量数据,做出智能快速决策,并提供直观的体验。
客户支持中的复合 AI 系统结合了多项 AI 技术,可提供高效、个性化和快速响应的服务。例如,NLP 模型分析客户咨询,提取意图和关键细节,使系统能够准确地理解问题。
在识别客户意图后,由生成式 AI 驱动的聊天机器人会与客户对话,提供即时帮助或澄清更多细节。同时,推荐系统会根据客户的需求推荐相关解决方案,例如故障排除步骤、常见问题文章或产品推荐。
为了增强体验,情感分析模型会评估客户的语气和情绪状态,帮助确定紧急或不满意案例的优先级,以便进行人工干预。通过这些组件的组合,可以提供快速、智能和善解人意的客户支持,缩短解决问题的时间,同时保持较高的客户满意度。
供应链中的复合 AI 系统使用多个AI 组件来优化物流、库存管理和整体效率。例如,预测性分析模型通过分析历史销售数据、季节性趋势和市场变量来预测需求,从而实现精确的库存规划。
计算机视觉系统监控仓库运作,实时识别低效或错误,例如物品放错位置或货物损坏。同时,路线优化算法会考虑交通、天气和燃料消耗等因素,确定最有效的配送路径。
此外,NLP 还能自动处理供应商和客户的通信,例如处理采购订单或响应查询。通过整合这些组件,该系统提高了供应链的响应速度,减少了浪费,有助于确保及时交货,同时还能动态适应需求和外部条件的变化。
设计复合 AI 系统涉及将多种 AI 模型和组件整合到能够处理复杂任务的内聚框架中。这些框架为组合各种模型提供了基础设施,并有助于确保它们之间的无缝通信。
在复合 AI 系统中,编程控制逻辑可能会调用模型,也可能由 LLM “负责”,具体取决于系统的目标。
这两种方法都有明显的优势,而模型和其他组件在 AI 系统中的各种协作方式也是无限的,因此设计者需要认真思考他们的方法,并愿意尝试各种架构和组件组合。
机器学习操作 (MLOps) 在复合工作流中变得更加棘手。例如,很难在不同类型的工具和模型中应用一致的衡量标准。BAIR 的研究人员称,在向复合系统转变的同时,AI 的发展也进入了一个新阶段,以帮助应对监控、调试和其他操作问题所带来的挑战。