最近发布的 DeepSeek-R1、谷歌的 Gemini 2.0 Flash Thinking、IBM 的 Granite 3.2 和 OpenAI 的 o1 系列以及 o3-mini 等推理模型让 AI 推理成为人们关注的焦点。AI 获得了进一步发展,从遵循预定义规则演变为整合某种形式的推理。随着 AI 采用率的提高,该技术的作用正在发生变化。
当今的推理模型不仅可以生成答案,还可以逐步反思和拆解分析。这使 AI 能够解决越来越复杂的问题,并引导用户采取有意义的行动。
然而,据 IBM 研究员 Francesca Rossi 所言,AI 推理并非最近才出现的功能,早在 AI 发展之初,这种能力就已被编入程序之中。预先编程设定的推理技能曾赋予 AI 模型预测结果一定程度的确定性,这种确定性让人们能够信任并依赖这些预测结果。不过,Rossi 指出,新一代 AI 模型由于具备更为动态灵活的推理能力,可能反而缺乏这种原有的确定性和可靠性。
Rossi 指出,虽然 AI 推理旨在模仿人类推理,但 AI 仍需要做很多工作才能真正像人类一样进行推理。
AI 中的推理被描述为一个通常由两大核心组件构成的系统:
● 知识库
● 推理引擎
知识库是 AI 推理系统的支柱。它包含知识图谱 、本体论、语义网络和其他知识表示模型。这些结构化形式将现实世界的实体(例如概念、特定领域信息、事件、事实、对象、关系、规则和情境)映射到 AI 模型可以处理和理解的结构中。
为了说明 AI 推理系统的工作原理,我们以自主扫地机器人为例。其知识库包含有关不同类型地板及其所需清洁类型的信息。机器人的机器学习算法也经过训练,可根据该知识库对每种地板类型进行识别和分类。
在部署机器人进行清洁时,机器人接收并处理输入数据,包括图像和传感器数据。然后,机器人利用知识库和训练,应用适当的推理技术,实时决定清洁行动,例如对硬木地板、瓷砖地板和乙烯基地板吸尘和拖地操作,但只对铺设地毯的地板吸尘。
根据数据集和目标应用的不同,AI 系统会采用不同的推理策略。它们通常综合运用以下方法:
● 溯因推理
● 智能体式推理
● 类比推理
● 常识推理
● 演绎推理
● 模糊推理
● 归纳推理
● 神经符号推理
● 概率推理
● 空间推理
● 时间推理
溯因推理的目的是基于当前可用的观测结果推导出最可能的结论。例如,在医疗保健领域,诊断算法会利用溯因推理,根据知识库中的预定义的标准,从一组症状中识别出最可能对应的疾病。
类比推理将知识从一种情境转移到另一种情境。这种推理方法借助类比关系,寻找过往场景和新场景之间的相似之处或共通之处。研究表明,AI 模型,尤其是 生成式预训练变换模型 (GPT) ,在类比推理任务中仍面临挑战。 1
常识推理运用关于世界的通用知识以及日常生活中的实用经验来辅助决策。例如,大型语言模型 (LLM) 可以从自然语言中提炼出反映常识推理的模式
。演绎推理从一般事实或更广泛的假设中得出具体结论。这意味着,如果假设成立,那么结论也一定成立。
专家系统是依赖演绎推理的 AI 系统的一个示例。它们旨在模拟人类专家的推理能力。这些系统配备了知识库,其中包含与特定领域相关的信息和规则。
基于规则的系统是专家系统的一个子集,依赖 “if-then” 规则来指导其推理过程。例如,在金融领域,这些系统可以被用来协助进行欺诈检测。
模糊推理关注的是真实程度,而非绝对的真假二元对立。它有助于处理模糊性。
例如,在情感分析中,模糊推理可以帮助评估文本并确定其表达的是正面、负面还是中立的情感。
这种推理方法衡量不同结果的统计可能性。它有助于在模糊或不确定的情况下做出决策,例如数据有限,或者可能出现多种结果且需要评估的情况。
例如,朴素贝叶斯分类器就采用概率原理来执行分类任务。概率推理还被应用于自然语言处理 (NLP) 任务和生成式 AI 应用程序。
空间推理使自动驾驶汽车和机器人等智能系统能够应对三维空间中的复杂问题。此类推理可结合几何建模来理解物体形状和表面特征,并借助路径规划算法来帮助确定最短或最优路线,从而在动态环境中高效导航。
空间推理还可以集成卷积神经网络 (CNN),后者使用三维数据进行图像分类和对象识别任务。
通过时序推理,AI 系统能够学会处理特定时间的数据,并理解事件的先后顺序,从而使它们能够制定计划、安排任务或建立预测。
例如,循环神经网络 (RNN) 被训练用于处理序列数据或时间序列数据,以推断未来结果的逻辑结论。RNN 可用于预测未来销售额、分析股票市场表现或生成天气预报。
推理可以带来更强大的 AI 应用,但它也有其局限性。以下是与 AI 推理系统相关的一些挑战:
● 偏见
● 计算成本
● 可解释性
复杂的推理任务需要强大的计算能力,因此很难扩展这些系统。企业必须优化 AI 模型以提高效率,同时保持准确性。此外,他们还必须准备好投资必要的资源,以开发、训练和部署这些推理系统。
AI 推理在企业场景中具有重要价值,可助力复杂任务的自动化与问题解决。以下是一些可从 AI 推理系统中受益的行业:
● 客户服务
● 网络安全
● 医疗保健
● 制造业
● 机器人
AI 推理模型可以辅助医疗诊断,并提出治疗方案建议。它们还可以帮助加速药物发现,寻找最佳分子来测试药物开发。
AI 推理系统可以协助进行需求预测,从而改善库存控制。预测性维护系统也可以依靠 AI 推理实时识别设备问题并提出及时修复建议。
当机器人具备推理能力时,他们可以在现实世界空间中更有效地运作,并更好地与人类和其他机器交互。它们能够自主进行逻辑推理,这有助于提高它们的适应能力、环境映射、导航和对象操控技能。
所有链接均为 ibm.com 外部链接
1 评估 GPT 模型中类比推理的鲁棒性 ,OpenReview.net,2025 年 2 月 20 日