什么是 AI 智能体内存？

作者

Staff Editor, AI Models

IBM Think

AI 智能体记忆是指人工智能 (AI) 系统存储和回忆过往经验以改善决策、感知和整体性能的能力。

与独立处理每个任务的传统 AI 模型不同，具有记忆的 AI 智能体可以保留上下文，随着时间的推移识别模式并根据过去的交互进行调整。此功能对于面向目标的 AI 应用至关重要，其中需要反馈回路、知识库和自适应学习。

记忆是一个记住之前互动信息的系统。AI 智能体不一定需要记忆系统。例如，简单反射智能体可以感知其环境的实时信息，并据此采取行动或传递该信息。

最基本的恒温器不需要记住昨天的温度。但是，更先进的带记忆“智能”恒温器可以超越简单的开启或关闭温度调节方式，通过学习模式适应用户行为并优化能源效率。它不仅可以对当前温度做出反应，还可以存储和分析过去的数据，以做出更明智的决策。

大型语言模型(LLM) 本身无法记住事物。必须添加内存组件。然而，AI 内存设计的最大挑战之一是优化检索效率，因为存储过多的数据会导致响应速度变慢。

优化的内存管理有助于确保 AI 系统仅存储最相关的信息，同时保持实时应用程序的低延迟处理。

行业时事通讯

专家为您带来最新的 AI 趋势

获取有关最重要且最有趣的 AI 新闻的精选洞察分析。订阅我们的每周 Think 时事通讯。请参阅 IBM 隐私声明。

智能体记忆的类型

研究人员对智能体记忆的分类方式与心理学家对人类记忆的分类方式大致相同。来自普林斯顿大学一个团队在其有影响力的语言智能体认知架构 (CoALA) 论文¹中，将不同类型的记忆描述为：

短期记忆

短期记忆 (STM) 可帮助 AI 智能体记住最近的输入，以便立即做出决策。这种类型的内存对会话式 AI 非常有用，因为在会话过程中需要在多次交互中保持上下文一致性。

例如，在会话中记住先前消息的聊天机器人可以提供连贯的响应，而不是孤立地处理每个用户的输入，从而改善用户体验。例如，OpenAI 的 ChatGPT 在单个会话中保留聊天记录，有助于确保对话更顺畅、更贴切上下文。

STM 通常使用滚动缓冲区或上下文窗口来实现，它在被覆盖之前保存有限量的最新数据。虽然这种方法提高了简短交互中的连续性，但它并不能保留会话结束后的信息，因此不适合长期的个性化设置或学习。

长期记忆

长期记忆 (LTM) 可让 AI 智能体跨不同的会话存储和回忆信息，使其随着时间的推移更加个性化和智能化。

与短期记忆不同，LTM 设计用于长久存储，通常使用数据库、知识图谱或向量嵌入来实现。这种类型的记忆对于需要历史知识的 AI 应用至关重要，例如个性化助手和推荐系统。

例如，人工智能驱动的客户支持智能体可以记住以前与用户的交互并相应地定制响应，从而改善整体客户体验。

实现 LTM 的最有效技术之一是检索增强生成 (RAG)，该技术中，智能体从存储的知识库中获取相关信息以增强其响应。

情景记忆

情景记忆使人工智能智能体能够回忆特定的过去经历，类似于人类记住具体事件的方式。这种类型的记忆对于基于案例的推理非常有用，AI 可以通过从过去的事件中学习，从而在未来做出更好的决策。

情景记忆的实现方式通常为以结构化格式记录关键事件、动作及其结果，以便智能体在做出决策时可以访问此类信息。

例如，由人工智能驱动的财务顾问可能会记住用户过去的投资选择，并利用这些历史提供更好的建议。这种记忆类型在机器人和自主系统中也至关重要；在此类系统中，智能体必须回忆过去的动作才能高效导航。

语义记忆

语义记忆负责存储 AI 智能体可以检索并用于推理的结构化事实知识。与处理特定事件的情景记忆不同，语义记忆包含事实、定义和规则等一般化信息。

AI 智能体通常使用知识库、符号 AI 或向量嵌入来实现语义记忆，从而使它们能够有效地处理和检索相关信息。此类记忆用于需要领域专业知识的实际应用程序，例如法律 AI 助手、医疗诊断工具和企业知识管理系统。

例如，AI 法律助理可以利用其知识库来检索案件先例并提供准确的法律建议。

程序记忆

AI 智能体中的程序记忆是指存储和回忆技能、规则和习得行为，使 AI 智能体能够自动执行任务，而无需每次都进行显示推理的能力。

它的灵感来自人类程序记忆，此类记忆允许人们无需有意识地思考每个步骤，即可执行骑自行车或打字等动作。在 AI 中，程序记忆根据先前的经验自动执行复杂的行动序列，从而帮助智能体提高效率。

AI 智能体通过训练学习动作序列，通常使用强化学习来随着时间的推移优化性能。通过存储与任务相关的程序，AI 智能体可以减少计算时间并更快地响应特定任务，而无需从头开始重新处理数据。

AI 智能体

5 种类型的 AI 智能体：自主功能与现实世界的应用

了解目标驱动和基于效用的 AI 如何适应工作流和复杂环境。

构建、部署和监控 AI 智能体

智能体式 AI 记忆框架

开发人员使用外部存储、专用架构和反馈机制来实现记忆。由于 AI 智能体的复杂程度各不相同——从简单的反射代理到高级学习代理，记忆的实现取决于代理的架构、用例和所需的适应性。

LangChain

用于构建具备记忆功能的人工智能智能体的一个关键智能体框架是 LangChain，它能够促进记忆、API 以及推理工作流的集成。通过将 LangChain 与矢量数据库相结合，AI 智能体可以有效地存储和检索大量过去的交互，从而实现随着时间的推移更加连贯的响应。

LangGraph

LangGraph 允许开发人员为 AI 智能体构建分层记忆图，从而提高其跟踪依赖关系和不断学习的能力。

通过集成矢量数据库，智能体系统可以有效地存储以前交互的嵌入，从而实现上下文回忆。这对于 AI 驱动的文档生成非常有用，因为智能体必须记住用户偏好和过去的修改。

其他开源产品

开源框架的兴起加速了记忆增强型人 AI 智能体的发展。GitHub 等平台托管着众多代码库，提供将记忆集成到 AI 工作流中的工具和模板。

此外， Hugging Face 还提供预训练模型，可以使用内存组件进行微调，以提高 AI 回忆能力。Python 是 AI 开发中的主导语言，它提供用于处理编排、记忆存储和检索机制的库，使其成为实现 AI 记忆系统的首选。

脚注

¹ "Cognitive Architectures for Language Agents," Princeton University, February, 2024.

2025 年主要战略技术趋势：AI智能体

下载这份 Gartner 研究报告，了解agentic AI 对 IT 领导者的潜在机遇和风险，以及如何为这一新一轮 AI 创新做好准备。

资源

应用专为企业构建的 AI 智能体大规模提高生产力

探索 AI 智能体改变游戏规则的潜力，并将其轻松整合至业务运营中。

2025 AI 智能体买家指南

深入研究本综合指南中的关键用例、核心功能和分步建议，以便选择适合您业务的解决方案。

利用 AI 智能体和助手重塑业务生产力

了解 AI 智能体和 AI 助手如何协同工作以实现新的生产力水平。

Omdia 赋能智能报告：AI 智能体的影响

了解如何使用 AI 智能体解锁生成式 AI 的全部潜力。

开拓代理型企业新时代：利用 AI 全面赋能技术资产

持续关注 AI 革命的根本转折点——新兴 AI 智能体的最新动态。

试用 watsonx Orchestrate

深入了解生成式 AI 助手如何帮您减轻工作量并提高工作效率。

AI 智能体将如何重塑生产力

学习如何使用 AI 来提高创造力和效率，并开始适应与 AI 智能体密切合作的未来。

代理的未来、AI 能耗、Anthropic 的计算机使用和 Google 对 AI 生成文本的水印

在本期 "Mixture of Experts "节目中，我们的专家将深入探讨 AI 智能体的未来等问题，与您一起保持领先地位。

Comparus 如何使用“银行助理”

Comparus 使用了 IBM® watsonx.ai 的解决方案，并令人印象深刻地展示了会话式银行业务作为新型互动模式的潜力。

相关解决方案

商用 AI 智能体

构建、部署和管理强大的 AI 助手和智能体，运用生成式 AI 实现工作流和流程自动化。

探索 watsonx Orchestrate

IBM AI 智能体解决方案

借助值得信赖的 AI 解决方案，您可以勾勒未来业务发展蓝图。

深入了解 AI 智能体解决方案

IBM Consulting AI 服务

IBM Consulting AI 服务有助于重塑企业利用 AI 实现转型的方式。

探索人工智能服务

采取下一步行动

无论您是选择定制预构建的应用程序和技能，还是使用 AI 开发平台构建和部署定制代理服务，IBM watsonx 平台都能满足您的需求。

探索 watsonx Orchestrate

深入了解 watsonx.ai