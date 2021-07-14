加速企业级 AI 整合能够创造积极业务增长。当前 90% 的企业 AI 项目仍难以突破测试阶段。虽然各组织机构的数据科学能力日趋成熟，但未能将高级分析与 AI/ML 整合到日常实时决策中，因而无法实现 AI 的真正价值。远程办公的新常态要求加速数字化转型，而 AI/ML 可助力更快实现这一目标。这将带来更高效的业务运营、更卓越的客户体验与更精准的决策判断。企业通过 AI 能够在价值链各环节获得显著收益，但必须从初始阶段就采用正确实施路径，否则可能面临罚款、处罚、错误决策、结果失真等风险，并导致商业用户与市场普遍丧失信任。
采用战略性 规模化 AI 方案的企业，其 AI 投资回报率可达孤立概念验证型企业的近三倍。
IBM 服务具备端到端能力，可驱动 AI 价值实现。通过环境友好、可操作、可复用且可扩展的 AI/ML 模型推动可持续的全企业创新，而非一次性的科学实验。IBM 规模化 AI 服务致力于将现有 AI 项目与应用扩展至企业级架构。该服务由多个支柱构成，共同构建完整解决方案体系：
我们以确立并扩展值得信赖的 AI 与数据作为核心商业战略要素为愿景。基于可量化的评估框架生成您与客户都能信赖的真实 AI 价值。
我们与您的团队协同工作，共同构建定制化运营模式。我们深知每个组织都有其独特性，适合某企业的方案未必适用于其他机构。例如，联邦式模型与非联邦式模型的选择。随后我们将携手开发项目管线，通过可扩展的协同团队整合 AI 资产，创造可衡量的商业价值。
我们指导您的 AI 数据与技术发展方向，运用具备充分灵活性的 AI 产品组合，实现跨用例、跨平台、跨云端的数据收集、整合与管理，从而迁移并构建全新的 AI 与机器学习数据驱动型应用。
我们将 AI 运维定位为关键组成部分，通过四大核心目标实现数据科学与 AI 模型的可重复、一致且规模化部署：工程化、部署、监控与信任。
我们通过建立主动的企业级变革管理机制，协助制定变革管理方案，以最低风险提升 AI 采纳率。该方法能识别并扫除阻碍 AI 为企业创造价值的障碍因素。
我们协助 AI 组织选定合适的技能组合、岗位角色与团队架构，这对实现成熟度与可扩展性至关重要。
IBM 规模化 AI 服务的重要特点在于无需推倒重来。IBM 将在您现有环境中开展工作：包括智能自动化系统、治理体系及数据管理架构。客户可以全面掌控并可视化所有工作负载（无论运行于何处），从而创造真实商业价值。为了尽量缩短部署周期与价值实现时间并降低风险，IBM 采用四阶段规模化 AI 实施流程。
1. 评估阶段 （4 至 6 周）： 短期审计、评估与规划——识别现有流程、方法与工具中的差距。与客户协同执行初步解决方案。
2. 设计与建立阶段 （4 至 6 周）：协同构建 AI 构建、扩展与维护的统一框架。基于现有环境与客户共同建立可扩展性框架。
3. 合作 （3 至 4 个月）：协作交付首批项目。在框架上试点 3 至 5 个最小可行产品以优化框架；最终确定并建立架构、流程与项目体系。与客户协同执行初步解决方案。IBM Garage：共创、共行、共营。
扩展阶段（持续进行）： 组建扩展团队，管理生产环境中的机器学习系统。为客户提供贯穿整个组织的全托管 AI 即服务，使客户能专注于应对业务挑战。
RAD-ML 是 IBM 通过自动化快速加速数据科学应用投产的框架方法。依托快速资产开发-机器学习 (RAD-ML) 方法论及其他 IBM 资产与加速器，IBM 规模化 AI 服务提供负责任、可持续且创新的框架体系，通过运用数据科学构建可重复、可复用、可扩展且可操作的 AI/ML 模型。IBM 解决方案能大幅缩短模型开发周期，建立加速部署至生产环境的管道，同时提升客户数据科学家的效率——使他们能专注于实现预期业务成果，从事最擅长且最热爱的工作。
IBM 规模化 AI 服务是“咨询到运营”一体化服务，为 AI/ML 概念验证向生产环境的持续整合与扩展提供完整解决方案，并实现 AI/ML 模型的长期运维管理。遵循 RAD-ML 方法指南所开发的资产能更便捷地部署于可扩展的机器学习架构。
RAD-ML 是经过验证的框架，可用于开发可扩展的 ML 资产，从功能与战略维度定义资产就绪度。若客户尚未建立通用框架，此框架可作为任何 AI/ML 解决方案的起点。该框架既可用于开发独立数据科学资产，也可在现有解决方案基础上构建功能模块。它通过以下核心概念赋能机器学习资产的创建，确保满足三大核心能力（可操作、可复用、可扩展）：
▪ 机器学习资产应整合至业务流程，并具备经验证的投资回报率
▪ 机器学习资产应能灵活适应不同的数据环境与技术投资
▪ 机器学习资产应建立在可扩展的稳健技术及运维设计基础之上
每个 RAD-ML 项目都应整合到客户现有环境中。同时需加入开源且免费的 RAD-ML 加速器：Brainstem、dash-blocks、架构及文档模板。为定义合适且标准化的 MLOps 架构，需要建立详细的目标组件概览。目标组件将与内部基础设施及工具配置保持一致。
IBM 可在任何云环境（包括混合多云）中实施此通用框架。以下示例展示 IBM 如何运用 AWS 工具构建机器学习管道。
AWS CodeCommit 替代传统 Git 代码库——这是存储项目所有使用代码的核心场所。
CodeBuild 将运行所有单元测试与集成测试，并从指定的 Python 源码构建压缩包，该压缩包后续可部署至 Docker 容器。CodeDeploy 将执行指定的部署方案，例如构建 Docker 容器，将其推送至 Docker 镜像仓库，最终在生产环境中加载镜像。
AWS ECR 作为所有 Docker 容器的存储库，这些容器在上述管道中构建完成。其功能类似于容器仓库，正如 CodeCommit 作为配置文件和源代码的仓库。当外部传入相应参数触发训练任务时，AWS SageMaker 将在此查找指定的 Docker 镜像。
AWS SageMaker 作为所有训练任务的运行时环境。AWS SageMaker 可通过 API/python 绑定触发。用户指定待运行模型类型及相应输入输出数据位置。AWS SageMaker 可接受包含预定义训练代码入口点的 Docker 镜像。同时也能运行 TensorFlow/MXNet/ONNX 定义的任务。SageMaker 提供管理用户界面，并作为托管服务支持弹性扩展。因此，用户可从多种机型中选择适配特定训练的配置。AWS SageMaker 还支持超参数调优功能（可通过 API 触发）。该工具会自动选择性能最优的超参数组合。运行结果可直接写入 S3 或 DynamoDB。
AWS S3 作为基础文件系统处理输入输出文件。通常 S3 用于存储大型训练数据文件及序列化模型。AWS S3 与 SageMaker 实现无缝集成。
AWS DynamoDB 是基于键值对的 NoSQL 数据库，由 AWS 全托管且支持按需扩展。该数据库可用于存储模型运行的关键绩效指标，持续追踪模型表现。同时整合模型运行的实时信息与性能元数据。AWS DynamoDB 可以与 QuickSight（AWS 提供的数据可视化工具）实现无缝集成。
AWS 弹性推理是增强型 EC2 实例。在 AWS SageMaker 中训练的模型可部署于弹性推理实例进行预测。底层计算资源支持按需扩展。
伦理问题不仅是技术建模问题，更是商业挑战。60% 的企业将合规性视为 AI 应用成功的障碍，部分原因在于对系统缺乏信任与理解。IBM 设计了培育 信任、 透明度 与 公平性 的三重方法，在持续运行、维护和扩展 AI 的同时保持信任度，降低品牌与声誉风险。IBM 可从三方面协助客户：构建适应 AI 安全扩展的组织文化；通过分析工具实现 AI 工程 透明化，透视黑盒算法内部逻辑；建立 治理机制 确保工程实践符合 文化 准则。值得信赖的 AI 的核心在于遥测与分析工具，IBM 在该领域凭借开源技术及 Linux 基金会生态占据行业领先地位。
IBM 规模化 AI 服务以 IBM 研究院的开源工具包 AI Fairness 360 及事实说明书为框架。开发者能够共享并获取关于 AI 偏见检测与缓解的前沿代码及数据集。这些 IBM 研究院的研究成果还促使 IBM 整合了 Watson OpenScale 商用解决方案，该方案专为构建基于 AI 的企业级解决方案设计，可检测、管理与缓解 AI 偏见。
