AI 智能体记忆是指人工智能 (AI) 系统存储和回忆过往经验以改善决策、感知和整体性能的能力。
与独立处理每个任务的传统 AI 模型不同,具有记忆的 AI 智能体可以保留上下文,随着时间的推移识别模式并根据过去的交互进行调整。此功能对于面向目标的 AI 应用至关重要,其中需要反馈回路、知识库和自适应学习。
记忆是一个记住之前互动信息的系统。AI 智能体不一定需要记忆系统。例如,简单反射智能体可以感知其环境的实时信息,并据此采取行动或传递该信息。
最基本的恒温器不需要记住昨天的温度。但是,更先进的带记忆“智能”恒温器可以超越简单的开启或关闭温度调节方式,通过学习模式适应用户行为并优化能源效率。它不仅可以对当前温度做出反应,还可以存储和分析过去的数据,以做出更明智的决策。
大型语言模型(LLM) 本身无法记住事物。必须添加内存组件。然而,AI 内存设计的最大挑战之一是优化检索效率,因为存储过多的数据会导致响应速度变慢。
优化的内存管理有助于确保 AI 系统仅存储最相关的信息,同时保持实时应用程序的低延迟处理。
研究人员对智能体记忆的分类方式与心理学家对人类记忆的分类方式大致相同。来自普林斯顿大学一个团队在其有影响力的语言智能体认知架构 (CoALA) 论文1中,将不同类型的记忆描述为:
短期记忆 (STM) 可帮助 AI 智能体记住最近的输入,以便立即做出决策。这种类型的内存对会话式 AI 非常有用,因为在会话过程中需要在多次交互中保持上下文一致性。
例如,在会话中记住先前消息的聊天机器人可以提供连贯的响应,而不是孤立地处理每个用户的输入,从而改善用户体验。例如,OpenAI 的 ChatGPT 在单个会话中保留聊天记录,有助于确保对话更顺畅、更贴切上下文。
STM 通常使用滚动缓冲区或上下文窗口来实现,它在被覆盖之前保存有限量的最新数据。虽然这种方法提高了简短交互中的连续性,但它并不能保留会话结束后的信息,因此不适合长期的个性化设置或学习。
长期记忆 (LTM) 可让 AI 智能体跨不同的会话存储和回忆信息,使其随着时间的推移更加个性化和智能化。
与短期记忆不同,LTM 设计用于长久存储,通常使用数据库、知识图谱或向量嵌入来实现。这种类型的记忆对于需要历史知识的 AI 应用至关重要,例如个性化助手和推荐系统。
例如,人工智能驱动的客户支持智能体可以记住以前与用户的交互并相应地定制响应,从而改善整体客户体验。
实现 LTM 的最有效技术之一是检索增强生成 (RAG),该技术中,智能体从存储的知识库中获取相关信息以增强其响应。
情景记忆使人工智能智能体能够回忆特定的过去经历,类似于人类记住具体事件的方式。这种类型的记忆对于基于案例的推理非常有用,AI 可以通过从过去的事件中学习,从而在未来做出更好的决策。
情景记忆的实现方式通常为以结构化格式记录关键事件、动作及其结果,以便智能体在做出决策时可以访问此类信息。
例如,由人工智能驱动的财务顾问可能会记住用户过去的投资选择,并利用这些历史提供更好的建议。这种记忆类型在机器人和自主系统中也至关重要;在此类系统中,智能体必须回忆过去的动作才能高效导航。
语义记忆负责存储 AI 智能体可以检索并用于推理的结构化事实知识。与处理特定事件的情景记忆不同,语义记忆包含事实、定义和规则等一般化信息。
AI 智能体通常使用知识库、符号 AI 或向量嵌入来实现语义记忆,从而使它们能够有效地处理和检索相关信息。此类记忆用于需要领域专业知识的实际应用程序,例如法律 AI 助手、医疗诊断工具和企业知识管理系统。
例如,AI 法律助理可以利用其知识库来检索案件先例并提供准确的法律建议。
AI 智能体中的程序记忆是指存储和回忆技能、规则和习得行为,使 AI 智能体能够自动执行任务,而无需每次都进行显示推理的能力。
它的灵感来自人类程序记忆,此类记忆允许人们无需有意识地思考每个步骤,即可执行骑自行车或打字等动作。在 AI 中,程序记忆根据先前的经验自动执行复杂的行动序列,从而帮助智能体提高效率。
AI 智能体通过训练学习动作序列,通常使用强化学习来随着时间的推移优化性能。通过存储与任务相关的程序,AI 智能体可以减少计算时间并更快地响应特定任务,而无需从头开始重新处理数据。
开发人员使用外部存储、专用架构和反馈机制来实现记忆。由于 AI 智能体的复杂程度各不相同——从简单的反射代理到高级学习代理,记忆的实现取决于代理的架构、用例和所需的适应性。
用于构建具备记忆功能的人工智能智能体的一个关键智能体框架是 LangChain,它能够促进记忆、API 以及推理工作流的集成。通过将 LangChain 与矢量数据库相结合,AI 智能体可以有效地存储和检索大量过去的交互,从而实现随着时间的推移更加连贯的响应。
LangGraph 允许开发人员为 AI 智能体构建分层记忆图,从而提高其跟踪依赖关系和不断学习的能力。
通过集成矢量数据库,智能体系统可以有效地存储以前交互的嵌入,从而实现上下文回忆。这对于 AI 驱动的文档生成非常有用,因为智能体必须记住用户偏好和过去的修改。
开源框架的兴起加速了记忆增强型人 AI 智能体的发展。GitHub 等平台托管着众多代码库,提供将记忆集成到 AI 工作流中的工具和模板。
此外, Hugging Face 还提供预训练模型,可以使用内存组件进行微调,以提高 AI 回忆能力。Python 是 AI 开发中的主导语言,它提供用于处理编排 、记忆存储和检索机制的库,使其成为实现 AI 记忆系统的首选。
1 "Cognitive Architectures for Language Agents," Princeton University, February, 2024.
构建、部署和管理强大的 AI 助手和智能体,运用生成式 AI 实现工作流和流程自动化。
借助值得信赖的 AI 解决方案,您可以勾勒未来业务发展蓝图。
IBM Consulting AI 服务有助于重塑企业利用 AI 实现转型的方式。