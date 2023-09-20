标签

基础模型 (FM) 正开启机器学习 (ML)人工智能 (AI) 领域的新纪元，这一变革不仅加速了 AI 技术的迭代进程，更推动其能够适配各类下游任务，并可针对多元应用场景进行微调优化。

随着在业务执行现场处理数据的重要性日益凸显，在企业边缘侧部署 AI 模型，既能实现近乎实时预测，又能遵守数据主权及隐私相关要求。通过将 IBM watsonx 的基础模型能力与边缘计算相结合，企业可在业务边缘节点运行 AI 工作负载，包括基础模型的微调与推理任务。这一方案支持企业规模化推进边缘 AI 部署，同时缩短部署周期、降低部署成本，并提升响应速度。。

什么是基础模型？

基础模型 (FM) 利用大量未标记的规模化数据进行训练，正在推动最先进的人工智能 (AI) 应用。这些基础模型可适配各类下游任务，并能针对多元应用场景进行微调优化。如今，专注于单一领域特定任务的传统 AI 模型正逐渐被基础模型取代；究其原因，在于基础模型具备更通用的学习能力，能够跨领域、跨问题发挥作用。顾名思义，基础模型可作为众多 AI 应用场景的技术基石。

基础模型解决了阻碍企业规模化应用 AI 的两大核心痛点。其一，企业会产生海量未标注数据，但其中仅有一小部分经过标注用于 AI 模型训练。其二，数据标注与注释工作对人力需求极高，通常需要领域专家投入数百小时。这使得 AI 难以跨用例规模化推广，毕竟这需要大量领域专家与数据专家支撑。而基础模型通过吸纳海量未标注数据，并采用自监督学习技术进行模型训练，成功突破了这些瓶颈，为企业全域规模化应用 AI 铺平了道路。事实上，每个业务场景中沉淀的海量数据，都正等待被激活以挖掘核心洞察。

什么是大型语言模型？

大型语言模型 (LLM) 是基础模型的一个分支，由多层神经网络构成，且经过海量未标注数据的训练。这类模型采用自监督学习算法，能够以近似人类语言使用习惯的方式执行各类自然语言处理 (NLP) 任务（见图 1）。

图 1.大型语言模型 (LLM) 在 AI 领域掀起了一场风暴。

扩大并加速 AI 的影响

构建与部署基础模型需经历多个关键步骤，包括数据摄取、数据筛选、数据预处理、基础模型预训练、针对一个或多个下游任务的模型微调、推理服务部署，以及数据与 AI 模型的治理及生命周期管理，上述所有环节统称为基础模型运维 (FMOps)。

为助力企业应对上述挑战，IBM 推出 IBM watsonx AI 产品组合，为企业提供充分发挥基础模型能力所需的全套工具与技术支撑，该产品组合旨在全面放大 AI 在企业全域的应用价值。IBM watsonx 由以下部分组成：

  1. IBM watsonx.ai 将全新的生成式 AI 能力（由基础模型与传统机器学习提供核心驱动）整合至一个功能强大且覆盖 AI 生命周期的工作室中。
  2. IBM watsonx.data 是一款专为特定场景设计的数据存储解决方案，基于开放式湖仓一体架构，能够支持各类数据、跨环境场景下的 AI 工作负载规模化部署。
  3. IBM watsonx.governance 是一款端到端自动化 AI 生命周期治理工具包，旨在实现负责任、透明且可解释的 AI 工作流。

另一个核心趋势是企业边缘侧计算的重要性日益凸显，例如工业场所、生产车间、零售门店、电信边缘节点等场景均属此类。更具体地说，在企业边缘侧部署 AI，能够在业务执行现场直接处理数据，实现近乎实时分析。企业边缘侧既是海量企业数据的产生源头，也是 AI 发挥价值的关键场景；在此处，AI 可提供具有时效性、实用性且可落地的业务洞察。

在边缘部署 AI 模型，既能实现近乎实时预测，又能遵守数据主权及隐私相关要求。这一部署方式可显著降低检测数据在采集、传输、转换及处理环节中常见的延迟问题。通过在边缘开展数据处理与模型推理，企业不仅能保障敏感数据的安全，还能降低数据传输成本，同时提升响应速度。

然而，在数据相关挑战（数据异构性、海量规模及合规要求）与资源约束问题（计算能力、网络连接、存储资源乃至 IT 技术能力有限）的双重影响下，规模化推进边缘 AI 部署并非易事。这些挑战大致可归为两类：

  • 部署时间/成本： 每一次部署均涉及多层软硬件组件，这些组件需在正式部署前完成安装、配置与测试。如今，技术人员在每个部署地点完成安装工作可能需要长达一到两周时间，这严重限制了组织在全域范围内规模化推进部署的速度与成本效益。
  • 后期运维：由于边缘部署节点数量庞大且地理分布分散，若为每个部署地点配备本地 IT 支持团队，以开展监控、维护及更新工作，其成本往往高到难以承受。

边缘 AI 部署

IBM 研发了一套边缘计算架构，通过为边缘 AI 部署引入软硬件 (HW/SW) 一体化设备方案，成功解决了上述挑战。该架构包含多个核心设计范式，可为 AI 部署的规模化推进提供支撑：

  • 基于策略的全软件栈零接触部署。
  • 持续监控边缘系统运行状况
  • 支持从云端中央管理平台统一管理并向海量边缘节点推送软件更新、安全补丁及配置变更，全程通过集中化方式完成后期运维相关操作。

可采用分布式“中心 - 分支”架构实现企业边缘 AI 部署的规模化扩展；其中，云端中央节点或企业数据中心扮演“中心枢纽”角色，而一体化边缘设备则在各边缘部署地点承担“分支节点”职能。这种跨混合云与边缘环境延伸的“中心 - 分支”架构，最能体现基础模型行所需资源优化配置的核心平衡，既保障资源高效利用，又适配分布式部署需求（见图 2）。

图 2：企业边缘 AI 的"中心 - 分支"部署架构

利用自监督学习技术在海量未标注数据集上对这些基础大型语言模型及其他类型的基础模型进行预训练时，通常需要海量计算 (GPU) 资源，因此最适合在中心枢纽执行。云端具备近乎无限的计算资源，且通常存储有大规模数据集，这为大参数量模型的预训练提供了支撑，同时有助于持续提升这些基础模型的精度。

另一方面，针对下游任务对这些基础模型进行微调，该过程仅需数十或数百个标注数据样本，且推理服务部署的资源需求较低，仅需在企业边缘侧配备少量 GPU 即可完成。这不仅能让敏感标注数据（或企业核心机密数据）安全留存于企业运营环境内，还能降低数据传输成本。

通过采用全栈式边缘应用部署方案，数据科学家可在统一环境中完成模型的微调、测试与部署。这一模式不仅简化了开发流程，还能缩短新 AI 模型向终端用户提供推理服务的全生命周期周期。Red Hat OpenShift Data Science (RHODS) 及近期发布的 Red Hat OpenShift AI 等平台，均提供了全套工具链，支持在分布式云及边缘环境中快速开发并部署具备生产级可用性的 AI 模型。

最后，在企业边缘侧部署经微调后的 AI 模型，可显著降低数据在采集、传输、转换及处理环节中常见的延迟问题。将云端的预训练过程与边缘侧的微调、推理任务解耦，不仅能减少推理任务的耗时，还能降低数据迁移成本，进而实现整体运营成本的优化（见图 3）。

图 3.基于一体化边缘设备在业务边缘侧开展基础模型微调与推理的价值主张。一个典型用例：土木工程师部署此类基础模型，以无人机影像为输入数据，获取近乎实时的缺陷检测洞察。

为端到端验证这一价值主张，我们选取了一个基于视觉 Transformer 的土木基础设施领域基础模型，该模型已通过公开数据集及行业定制数据集完成预训练，对其进行微调后，将其部署至一个三节点边缘（分支）集群中提供推理服务。所采用的软件栈包括 Red Hat OpenShift Container Platform 和 Red Hat OpenShift Data Science。该边缘集群还与运行在云端的 Red Hat Advanced Cluster Management for Kubernetes (RHACM) 中心节点实例建立了连接。

零接触配置

借助 Red Hat Advanced Cluster Management for Kubernetes (RHACM)，通过策略与位置标签实现了基于策略的零接触部署，这些策略与标签将特定边缘集群与一组软件组件及配置绑定。这些覆盖全栈的软件组件（涵盖计算、存储、网络及 AI 工作负载），通过各类 OpenShift Operator、必要应用服务的部署以及 S3 存储桶的配置完成安装与启用。

用于土木基础设施的预训练基础模型，通过 Red Hat OpenShift Data Science (RHODS) 中的 Jupyter Notebook 进行微调，利用标注数据对混凝土桥梁常见的六类缺陷进行分类。同时，借助 Triton 服务器实现了该微调后模型的推理服务部署。此外，通过 Prometheus 采集边缘节点软硬件组件的可观测性指标，并汇总至云端的 RHACM 中央控制台，实现了对整个边缘系统健康状态的实时监控。土木基础设施企业可将这些基础模型部署在边缘地点，利用无人机影像近乎实时检测缺陷，既缩短了洞察获取周期，又降低了海量高清数据往返云端的传输成本。

摘要

IBM watsonx 的基础模型能力与一体化边缘设备相结合，企业可在业务边缘侧运行基础模型微调与推理相关的 AI 工作负载。该设备开箱即可支持复杂用例，且构建了“中心 - 分支”架构，为集中化管理、自动化操作及自助服务提供支撑。通过这一方案，边缘基础模型的部署周期可从数周缩短至数小时，同时具备更高的可重复性、弹性与安全性。

