主页 Think Page Title AI 推理 什么是 AI 推理?
深入了解 IBM 的 AI 推理解决方案 订阅 AI 最新消息
平面/线条风格的插图,蓝色背景,带有计算机显示器的象形图

发布日期:2024 年 6 月 18 日
撰稿人:Mesh Flinders、Ian Smalley

什么是 AI 推理?

人工智能 (AI) 推理是指经过训练的 AI 模型识别模式并从以前从未见过的信息中得出结论的能力。

AI 推理对于 AI 技术的进步至关重要,并为其最令人兴奋的应用奠定了基础,例如生成式 AI,这也是为流行的 ChatGPT 应用程序提供支持的能力。AI 模型依靠 AI 推理来模仿人们思考、推理和回应提示的方式。

AI 推理首先使用决策算法在大型数据集上训练 AI 模型。AI 模型由决策算法组成,这些算法在构造类似人脑的神经网络 - 大语言模型 (LLM) 上进行训练。例如,设计用于面部识别的 AI 模型可能需要在数百万张人脸图像上进行训练。最终,它学会了准确识别眼睛颜色、鼻子形状和头发颜色等特征,然后可以利用这些特征识别图像中的个人。

AI 推理与机器学习的区别

尽管密切相关,但 AI 推理和机器学习 (ML) 是 AI 模型生命周期中的两个不同步骤。

  • 机器学习是利用训练数据和算法,通过监督学习的过程,使 AI 能够模仿人类的学习方式,逐渐提高其准确性的过程。
  • AI 推理是将 AI 模型通过机器学习习得的知识应用于决策、预测或从数据提取结论的过程。
如何选择合适的 AI 基础模型

尽管大多数组织都清楚自己对生成式 AI 的期望结果,但却不太了解如何能实现这些结果。选择错误的模型可能会对您的业务造成严重的影响。

AI 推理的优势

如果 AI 模型没有在适合其应用的强大数据集上进行训练,那么它们根本就无效。鉴于该技术的敏感性以及媒体对它的密切关注1,企业需要谨慎行事。但随着跨行业并且可带来数字化转型和可扩展创新潜力的应用的出现,其诸多好处开始显现:

  • 精确和准确的结果:随着技术的进步,AI 模型正变得越来越精确和准确。例如,最新的 LLM 可以通过模仿特定作者的语气来选择单词、句子和语法。在美术和视频领域中,它们可以做同样的事情,选择颜色和样式来传达精确的情绪、语气或艺术风格。
  • 改进质量控制:在系统监控和检查领域,AI 是最新、也可能是最令人兴奋的扩展之一。在从水质到天气模式的数据集上训练的 AI 模型被用于监测现场工业设备的健康状况。
  • 机器人学习:具有 AI 推理能力的机器人和机器人科技正被部署到各种任务中,以增加业务价值。机器人学习最受欢迎的应用可能是无人驾驶汽车。AI 推理被 Tesla、Waymo 和 Cruz 等无人驾驶汽车公司广泛使用,用来教导神经网络识别和遵守交通规则。
  • 无方向学习:AI 推理无需编程即可对数据进行训练,从而减少了有效运行所需的人工输入和资源。例如,在农业环境图像上训练的 AI 模型可用于帮助农民识别和减少杂草和不健康的作物。
  • 明智的指导和决策:AI 推理最令人兴奋的应用之一是,AI 能够理解细微差别和复杂性,并根据所学数据集提供建议。例如,经过财务原理训练的 AI 模型可以提供合理的投资建议并识别潜在的欺诈活动。同样,AI 可以消除疾病诊断或飞机驾驶等有风险程序中出现人为错误的可能性。
  • 边缘计算能力:AI 推理和边缘计算实时提供 AI 的所有优势,而无需将数据移动到数据中心进行处理。边缘 AI 推理的潜力具有广泛的影响,从仓库库存水平的管理和监控到自动驾驶汽车安全运行所需的毫秒级反应。
AI 推理的挑战

虽然 AI 推理的优点很多,但作为一项年轻、快速发展的技术,它也并非没有挑战。以下是考虑投资 AI 的企业应考虑的行业所面临的一些问题:

  • 合规:监管 AI 应用和 AI 推理的任务十分艰巨,而且不断变化。其中一个例子就是数据主权领域,即数据受其生成国家或地区的法律管辖。在多个地区收集、存储和处理用于 AI 之数据的全球企业发现,要遵守多个地区的法律,同时又能以有利于其业务的方式进行创新,是一项挑战。
  • 质量:在 AI 模型的训练中,模型训练数据的质量对其成功至关重要。就像人类向糟糕的老师学习一样,在糟糕的数据集上训练的 AI 模型也会表现不佳。数据集需要清楚地标记,并与 AI 模型尝试学习的技能高度相关。AI(尤其是 AI 推理的准确性)的一个关键挑战是选择正确的模型进行训练。
  • 复杂性:与数据质量一样,数据的复杂性也会给 AI 模型带来问题。再次使用人类学生的类比,AI 被训练的东西越简单,就越容易学习。与针对更复杂问题(如医学成像或财务建议)设计的 AI 模型相比,解决简单问题(如客服聊天机器人或虚拟旅行代理)的 AI 模型相对容易训练。
  • 提高技能:想象 AI 这样一个快速发展的新领域的可能性固然令人激动,但创建正常运行的 AI 应用程序和准确的 AI 推理所需的专业知识却需要时间和资源。在人才管道赶上创新的步伐之前,该领域的专家仍然供不应求且招聘成本高昂。
  • 对台湾的依赖:世界上 60% 的半导体和 90% 的先进芯片(包括 AI 推理所需的 AI 加速器)都在台湾岛制造。2此外,全球最大的 AI 硬件和软件公司 Nvidia 的 AI 加速器几乎完全依赖一家公司,台湾积体电路制造股份有限公司 (TSMC),即台积电。自然灾害或其他前所未见的事件可能会威胁到推动 AI 推理及其众多应用所需芯片的制造和分销。
AI 推理的关键组件

AI 推理是一个复杂的过程,涉及在适当的数据集上训练 AI 模型,直到它能推断出准确的响应。这是一个高度计算密集型的流程,需要专门的硬件和软件。在了解训练 AI 模型以进行 AI 推理的过程之前,让我们先了解一些支持它的专用硬件:

中央处理器

中央处理器 (CPU) 是计算机的主要功能组件。在 AI 训练和推理中,CPU 运行操作系统,并帮助管理训练所需的计算资源。

图形处理器

图形处理器 (GPU) 或为高性能计算机图形和图像处理而构建的电子电路用于各种设备,包括显卡、主板和手机。然而,由于它们的并行处理能力,它们也越来越多地用于 AI 模型的训练。一种方法是将许多 GPU 连接到单个 AI 系统以增强该系统的处理能力。

现场可编程门阵列

现场可编程门阵列 (FPGA) 是高度可定制的 AI 加速器,它依赖于专业知识来针对特定目的进行重新编程。与其他 AI 加速器不同,FPGA 具有适合特定功能的独特设计,通常与实时数据处理有关,这对 AI 推理至关重要。FPGA 在硬件级别上可重新编程,从而实现更高级别的定制。

专用集成电路

ASIC 是专为特定目的或工作负载而设计的 AI 加速器,例如 Cerebras 生产的 WSE-3 ASIC 加速器就专用于深度学习。ASIC 可帮助数据科学家加快 AI 推理能力并降低成本。与 FPGA 不同,ASIC 无法重新编程,但由于它们专为单一用途而构建,因此它们的性能通常优于其他更通用的加速器。其中一个例子就是 Google 的张量处理单元 (TPU),它是使用 Google 自己的 TensorFlow 软件为神经网络机器学习而开发的。

AI 推理的工作原理

作为数字化转型之旅的一部分,有兴趣投资 AI 应用程序的企业应该自行了解有关 AI 推理的优点和挑战。对于那些已经彻底研究了它的各种应用并准备将其投入实用的公司来说,以下是建立有效 AI 推理的五个步骤:

准备数据

准备数据对于创建有效的 AI 模型和应用程序至关重要。企业可以为 AI 模型创建数据集,以便使用组织内部或外部的数据进行训练。为了获得最佳效果,通常将两者结合使用。收集 AI 训练数据的另一个关键部分是数据清理 - 删除任何重复的条目并解决所有格式问题。

选择训练模型

数据集组装完成后,下一步就是为您的应用程序选择正确的 AI 模型。模型的范围从简单到复杂,较复杂的模型能够容纳更多的输入,并且较之不太复杂的模型,能在更细微的层面上进行推理。在此步骤中,必须明确您的需求,因为训练更复杂的模型与训练较简单的模型相比,可能需要更多的时间、金钱和其他资源。

训练模型

为了从 AI 应用程序中获得所需的输出,企业通常需要进行多轮严格的 AI 培训。随着模型的训练,其推理的准确性将变得更加清晰,得出这些推论所需的计算资源量(例如算力和延迟)将减少。随着模型的成熟,它进入了一个新阶段,可以开始从所学数据中推断出新数据。这是一个令人兴奋的步骤,因为您可以看到您的模型开始按照其设计方式运行。

监视器输出

在您的模型被视为可运行之前,重要的是您要检查并监控其输出是否存在任何不准确、偏差或数据隐私问题。此阶段有时称为后处理,是您创建分步过程以确保模型准确性的时段。后处理阶段是创建一种方法的时刻,以确保您的 AI 为您提供您想要的答案并按预期方式运行。

部署

经过严格的监控和后处理之后,您的 AI 模型就可以进行部署,供业务使用了。最后一步包括实施使 AI 模型能够发挥作用的架构和数据系统,以及创建任何变更管理程序,以培训利益相关者如何在其日常工作中使用您的 AI 应用程序。

AI 推理的类型

根据企业所需的 AI 应用程序类型,他们可以选择不同类型的 AI 推理。如果企业希望构建用于物联网 (IoT) 应用程序的 AI 模型,则流式推理(及其测量功能)可能是最合适的选择。但是,如果 AI 模型旨在与人类交互,那么在线推理(及其 LLM 功能)将是更好的选择。以下是三种 AI 推理类型及其独特之处。

 

1. 动态推理

动态推理(也称为在线推理)是最快的 AI 推理类型,用于最流行的 LLM AI 应用程序,例如 OpenAI 的 ChatGPT。动态推理在被要求时立即做出输出和预测,并且之后需要低延迟和快速访问数据才能运行。动态推理的另一个特点是输出非常之快,以至于在它们到达最终用户之前没有时间对其进行审查。这导致一些企业在输出和最终用户之间增加一层监控,以确保质量控制。

2. 批量推理

批量推理通过使用大批量数据离线生成 AI 预测。使用批量推理方法,之前收集的数据随后将应用于 ML 算法。虽然批量推理并不适合需要在几秒钟或更短时间输出的情况,但它非常适合全天或一周内定期更新的 AI 预测,例如销售或营销仪表板或风险评估。

3. 流式推理

流式推理使用数据管道(通常通过传感器的定期测量提供),并将其输入到使用数据不断进行计算和预测的算法中。IoT 应用,例如通过连接到互联网的传感器监控发电厂或城市交通的 AI,需要依靠流式推理来做出决策。

相关解决方案
IBM Z 上的 AI

AI on IBM® Z 运用机器学习将每项事务的数据转换为实时洞察分析。

深入了解 IBM Z 上的 AI 技术

watsonx.ai

IBM® watsonx.ai AI 开发平台属于 IBM watsonx AI 和数据平台,可将基础模型支持的全新生成式 AI 功能和传统机器学习 (ML) 整合到一个贯穿 AI 生命周期的强大开发平台。

深入了解 watsonx.ai

AI 基础设施解决方案

通过混合设计策略,您可以加速 AI 对整个企业的影响。

深入了解 AI 基础设施解决方案
AI 咨询服务

IBM Consulting 正在与全球客户和合作伙伴展开合作,共同创造 AI 的未来。我们由 2 万多名 AI 专家组成的多元化全球团队可以帮助您在整个企业中快速、从容地设计和扩展尖端的 AI 解决方案和自动化。​

深入了解 AI 咨询服务

资源 炒作之外:利用生成式 AI 创造商业价值

生成式 AI 在企业中的使用不断增加,原因也很容易理解。

借助 IBM Z,让 AI 发挥作用

详细了解 AI 的变革性技术,该技术已经在帮助企业应对业务挑战。

探索 watsonx.ai 演示

与 watsonx.ai 中的独立模型聊天,体验如何使用生成式 AI。

什么是人工智能 (AI)?

人工智能 (AI) 是一种使计算机和机器能够模拟人类智能和解决问题能力的技术。

什么是机器学习 (ML)?

机器学习 (ML) 是人工智能 (AI) 和计算机科学的一个分支,专注于使用数据和算法使 AI 能够模仿人类的学习方式,并逐渐提高准确性。

什么是 AI 模型?

AI 模型是一种程序,经过一组数据的训练,可识别某些模式或做出某些决策,而无需进一步的人工干预。

采取后续步骤

使用面向 AI 构建器的新一代企业级开发平台 IBM watsonx.ai,可以训练、验证、调整和部署生成式 AI、基础模型和机器学习功能。使用一小部分数据,即可在很短的时间内构建 AI 应用程序。

深入了解 watsonx.ai 预约实时演示
脚注

所有链接均为 ibm.com 外部链接

1“为什么公司对 AI 带来的风险准备明显不足”,Forbes,2023 年 6 月 15 日

2“在岸半导体生产:国家安全与经济效率”,美国外交关系协会,2024 年 4 月