基于效用的智能体是一种智能系统,它通过最大化可能结果的期望效用,使用效用函数来做出理性决策。效用函数以数学方式预测人工智能 (AI) 智能体可以采取的所有潜在行动的效用。
基于效用的智能体的目标是通过每个行动最大化效用函数。为了推进其目标,AI 智能体使用效用函数的结果来选择下一个最有益的行动。
基于效用的智能体的主要组成部分包括:
效用函数
传感器
内部模型
行动选择机制
执行器
效用函数是一个数学方程,表示智能体应如何评估其可以采取的任何可能行动的收益。它本质上是智能体的价值体系,代表了智能体在做选择时如何对相关因素进行优先级排序。
效用函数为潜在行动的每个结果分配一个数值,量化智能体应保持的偏好。基于效用的智能体使用效用函数来应对复杂环境、权衡利弊并最大化其选择的效用。
一个好的效用函数会考虑多种因素,例如安全性、效率、资源分配和多目标机会成本。效用函数是基于效用的智能体的基石,也是将它们与其他类型的 AI 智能体区分开来的关键。
基于效用的智能体使用传感器来感知其现实世界环境。传感器可以是物理的(如摄像头和温度计),也可以是数字的(如 API 连接和模拟)。智能体式 AI 感知使用复杂算法来过滤环境数据,并提取最重要和最相关的数据点以做出明智的决策。
基于效用的智能体维护其现实世界环境的简化内部模型。该模型基于智能体传感器感知到的数据进行创建和更新。通过随时间跟踪环境数据,内部模型还可以推断关于智能体环境的不可观测数据。
许多基于效用的智能体使用世界的状态转换模型,该模型建立环境的可能状态,以及环境从一个状态变为另一个状态的时间和方式的标准。状态转换模型展示了系统或动态环境如何随时间变化。更先进的状态转换模型会计算环境在任何时候改变其当前状态的概率。
效用函数为每个状态分配一个数值,智能体旨在将环境推向具有最高效用的未来状态。状态转换模型在随机或动态环境中尤其有用,因为智能体必须基于概率而非确定性进行推理。
行动选择机制是智能体的 AI 决策组件。基于内部模型的当前状态,智能体生成它可以采取的所有潜在行动的列表。行动选择算法使用效用函数来评估所有不同的行动,并优化智能体的选择以实现最大整体收益。
在一些现代实现中,大语言模型 (LLM) 被用于推理复杂的高层目标或解释模糊的输入,然后再将其转换为结构化的效用计算。
执行器(或性能元件)使智能体能够对其环境采取行动。物理执行器可以是生产线上的机械臂、控制智能家居温度的恒温器,或者整个自动驾驶车辆。虚拟或数字执行器可以是 API 连接、聊天机器人界面或软件输出。
基于效用的智能体 共享一个标准的内部工作流程,指导其行为:
感知
内部建模
行动生成
结果预测
效用评估
行动选择
行动
智能体使用其传感器感知环境并收集数据。这些数据用于告知智能体自身的状态及其环境的当前状态。
智能体利用来自传感器的当前感知,实时更新其环境的内部模型。使智能体能够理解其周围环境以及影响其决策过程的任何相关因素。
智能体根据其内部模型的状态,使用搜索和优化算法生成它可以采取的潜在行动列表。行动生成和选择技术鼓励智能体考虑新颖的想法,并参考具有已验证结果的过往经验,以保持可靠的性能。
在实践中,许多智能体并不会显式地生成所有可能行动的完整列表。相反,它们使用优化或强化方法,在连续行动空间中评估可能的最佳行动。
对于上一步中生成的每个行动,智能体使用其状态转换模型来预测预期结果。该模型计算智能体采取特定行动时达到某个特定状态的概率。
智能体的行动选择机制将效用函数应用于每个生成的行动及其相关的可能结果。该函数为每个可能的选择返回一个数值效用分数。分数越高表示总体效用越大。
智能体选择通向总体收益最大的结果的那个行动,该结果由效用函数的偏好决定。由于智能体的目标是最大化其效用函数,行动选择过程引导智能体以推进其所在 AI 系统目标的方式行事。
智能体选择通向总体收益最大的结果的那个行动,该结果由效用函数的偏好决定。由于智能体的目标是最大化其效用函数,智能体以推进其所在 AI 系统目标的方式行事。
基于效用的智能体非常适合具有多个相互竞争指令的复杂任务。这些可以包括:
智能家居:基于效用的智能体可以为智能家居中的智能系统提供动力,权衡舒适度、能源成本和可持续性等优先级。
自动驾驶汽车:自动驾驶车辆为机器学习工程师带来了一系列复杂问题。智能体控制的汽车必须应对人类驾驶员、行人、障碍物、天气、道路封闭以及动态环境中的许多其他条件。在这种环境下解决问题需要精心设计的效用函数。
医疗保健:由于能够兼顾各种考虑以追求最大效益,基于效用的智能体可能有助于制定治疗计划和管理成本。
机器人技术:机器人也需要权衡各种因素以追求最大效益。配送机器人与自动驾驶汽车有许多相同的考量。
推荐和定价系统:效用函数让智能体能够权衡用户偏好、一天中的时间、年份以及更大的趋势等因素,以保持用户的娱乐性。在生成式 AI 系统中,基于效用的方法可以指导生成最符合用户意图、上下文和长期参与目标的内容。
定价系统:类似地,基于效用的智能体可以管理动态定价系统,以最大化企业的购买量和收入。
物流与供应链自动化:复杂的供应链必须平衡效率、成本、风险、质量等因素。企业可以定制物流智能体的效用函数,以优先考虑对其业务最重要的因素,并创建一个可扩展的系统。
基于效用的智能体和基于目标的智能体在智能体必须朝着长期结果努力的情况下都很有用。然而,区别在于:基于效用的智能体寻求最大化其选择的效用,而基于目标的智能体追求特定目标。它们受目标达成的驱动。
基于目标的智能体将所有达成目标的状态视为同等可取,而基于效用的智能体则可以根据程度区分它们,从而实现更细致的决策。基于效用的智能体可以管理多个相互冲突的目标,即使在结果不确定的情况下也能保持性能。
基于效用的智能体具有韧性,能够应对复杂问题和不断变化的环境,同时提供一致的结果。基于效用的智能体的优势包括:
适应性:基于效用的智能体使用灵活的效用函数,而不是固定的基于规则的系统(如条件-行动规则)。它们能够适应变化的条件和新任务,而较低级别的简单反射智能体和基于模型的反射智能体可能因其僵化的基于规则的编程而遇到困难。
灵活性:基于效用的智能体可以成功权衡相互竞争的优先级,做出仍然能带来良好结果的决策。基于目标的智能体专注于一个特定的目标,可能难以考虑其他指令。
可靠性:即使在结果不确定的情况下,效用函数也能引导基于效用的智能体做出理性决策。这些智能体做出的决策很可能是那些能带来更有利的长期结果的决策。
尽管基于效用的智能体在许多环境中都很强大,但它们并不总是最佳选择。其局限性包括:
僵化性:如果没有学习元件,基于效用的智能体无法从行动中学习,也无法自主更新其效用函数和状态转换模型。添加学习元件可以让它们通过强化学习进行改进,但这在形式上更倾向于将其定义为混合智能体甚至学习智能体。
计算需求:效用函数是复杂的算法,持续运行它们需要大量的计算和能源。如果没有足够的计算资源,基于效用的智能体在对时间敏感的情况下可能因速度太慢而无法实时使用。
复杂性:有效的效用函数难以设计,基于效用的智能体的有效性取决于其效用函数。机器学习工程师必须成功地将他们的价值体系转化为一个强制智能体做出适当选择的数值方程。
伦理考量:基于效用的选择带来了伦理问题。谁来决定智能体的价值体系——尤其是当智能体有可能伤害人类时(如自动驾驶汽车)?随着智能体变得更加自主和普及,定义谁来决定其基础价值体系,以及这些价值观如何与社会伦理保持一致至关重要。
为了克服其中一些挑战,基于效用的智能体通常被集成到多智能体系统中,其中多个专门的智能体协作、共享信息并平衡相互竞争的目标。在此类架构中,每个智能体的效用函数都有助于系统的集体优化策略。
构建、部署和管理强大的 AI 助手和智能体,运用生成式 AI 实现工作流和流程自动化。
借助值得信赖的 AI 解决方案,您可以勾勒未来业务发展蓝图。
IBM Consulting AI 服务有助于重塑企业利用 AI 实现转型的方式。