📢 转载信息
原文作者:Vinod Chugani
在本文中,您将了解到为什么短期上下文不足以支持自主智能体,以及如何设计长期记忆以确保智能体在扩展的时间跨度内保持可靠性。
我们将涵盖的主题包括:
- 情景记忆、语义记忆和程序记忆在自主智能体中的作用
- 这些记忆类型如何相互作用以支持跨会话的实际任务
- 如何为您的用例选择实用的记忆架构
让我们直接开始吧。
超越短期记忆:AI智能体需要的3种长期记忆类型
图片作者:Author
如果您构建过聊天机器人或使用过语言模型,您已经熟悉了AI系统如何在单次对话中处理记忆。模型会跟踪您所说的内容,保持上下文,并做出连贯的回应。但这种记忆在对话结束的那一刻就消失了。
这对于回答问题或进行孤立的交互来说是足够的。但对于需要在数周或数月内自主运行的AI智能体呢?那些需要安排任务、管理工作流程或在多个会话中提供个性化推荐的智能体呢?对于这些系统来说,基于会话的记忆是远远不够的。
解决方案类似于人类记忆的工作方式。我们不仅仅是记住对话。我们记住经历(上周二那次尴尬的会议)、事实和知识(Python语法、公司政策)以及习得的技能(如何调试代码、如何构建报告)。每种记忆类型都有不同的用途,它们共同使我们能够长期有效地运作。
AI智能体也需要同样的东西。构建能够从经验中学习、积累知识并执行复杂任务的智能体,需要实现三种截然不同的长期记忆:情景记忆(episodic)、语义记忆(semantic)和程序记忆(procedural)。这些不仅仅是理论上的分类。它们是实际的架构决策,决定了您的智能体是真正自主运行,还是仅限于简单、无状态的交互。
为什么短期记忆会遇到瓶颈
大多数开发人员都熟悉AI系统中的短期记忆。它是上下文窗口,让ChatGPT能够在单次对话中保持连贯性,或者是一个滚动缓冲区,帮助您的聊天机器人记住您三条消息前说过的内容。短期记忆本质上是AI的“工作记忆”,对于即时任务很有用,但范围有限。
将短期记忆想象成计算机中的RAM。一旦您关闭应用程序,它就消失了。您的AI智能体在会话结束后就会忘记所有内容。对于基本的问答系统来说,这种限制是可以管理的。但对于需要在数天、数周或数月内不断发展、适应和独立运行的自主智能体呢?短期记忆是远远不够的。
即使是超大的上下文窗口也只能暂时模拟记忆。如果没有外部存储层,它们不会在会话之间持久存在、积累或改进。
那些正在获得关注的智能体(那些推动智能体AI框架和多智能体系统普及的智能体)需要一种不同的方法:能够持久存在、学习并指导智能行为的长期记忆。
长期智能体记忆的三大支柱
AI智能体中的长期记忆有多种形式。自主智能体需要三种截然不同的长期记忆类型,每种都有其独特的目的。每种记忆类型都回答了自主智能体必须处理的不同问题:之前发生了什么?我了解什么?我该如何做这件事?
情景记忆:从经验中学习
情景记忆允许AI智能体回忆其操作历史中的特定事件和经历。它存储了发生了什么、何时发生以及结果如何。
以AI金融顾问为例。有了情景记忆,它不仅仅了解一般投资原则;它会记得三个月前,它向A用户推荐了一个科技股投资组合,而该推荐表现不佳。它会记得B用户忽略了它关于多元化的建议,后来对此感到后悔。这些具体的经历以一般知识无法做到的方式,影响着未来的建议。
情景记忆将智能体从反应式系统转变为能从自身历史中学习的系统。当您的智能体遇到新情况时,它可以搜索其情景记忆中相似的过去经历,并根据之前有效(或无效)的做法调整其方法。
这种记忆类型通常使用向量数据库或其他持久性存储层来实现,这些层支持跨过去的情景进行语义检索。智能体不必进行精确匹配,而是可以找到与当前情况概念上相似的经历,即使细节有所不同。
在实践中,情景记忆存储了交互的结构化记录:时间戳、用户标识符、采取的行动、环境条件和观察到的结果。这些情景成为了智能体在做决策时查阅的案例研究,使其能够进行基于案例的推理,并随着时间的推移而不断完善。
语义记忆:存储结构化知识
情景记忆关注个人经历,而语义记忆则存储事实知识和概念理解。这是智能体需要对世界进行推理的事实、规则、定义和关系。
法律AI助手在很大程度上依赖于语义记忆。它需要知道合同法与刑法不同,某些条款在雇佣协议中是标准的,并且特定判例适用于特定司法管辖区。这种知识并非与其处理过的特定案件相关(那是情景记忆),而是广泛适用的普遍专业知识。
语义记忆通常使用结构化知识图谱或关系数据库来建模,可以在其中查询和推理实体及其关系。话虽如此,许多智能体也将非结构化的领域知识存储在向量数据库中,并通过RAG管道检索。当智能体需要知道“将这些药物结合起来的副作用是什么?”或“API身份验证的标准安全实践是什么?”时,它正在查询语义记忆。
情景记忆和语义记忆之间的区别对自主智能体至关重要。情景记忆告诉智能体“上周二,当我们对C客户尝试X方法时,由于Z而失败了。”语义记忆告诉智能体“当条件A和B存在时,X方法通常最有效。”两者都是必需的,但它们服务于不同的认知功能。
对于在专业领域工作的智能体,语义记忆通常与RAG系统集成,以引入不包含在基础模型训练中的特定领域知识。这种结合使智能体能够在不需要大规模模型重新训练的情况下,保持深厚的专业知识。
随着时间的推移,从情景记忆中提取的模式可以被提炼成语义知识,使智能体能够从个体经验中进行泛化。
程序记忆:自动化专业技能
程序记忆在AI智能体设计中经常被忽视,但对于需要执行复杂、多步骤工作流程的智能体来说,它至关重要。这是智能体可以在没有深思熟虑的情况下自动执行的习得技能和行为模式。
想想您是如何学会盲打或开车的。最初,每一个动作都需要集中注意力。随着时间的推移,这些技能变得自动化,解放了您的意识思维去处理更高级的任务。AI智能体中的程序记忆的工作方式类似。
当客服智能体第一百次遇到密码重置请求时,程序记忆意味着它不必每次都从头开始推理整个工作流程。步骤序列(验证身份、发送重置链接、确认完成、记录操作)成为一个可靠执行的缓存例程。
程序记忆并没有完全消除推理。它减少了重复性的思考,以便推理可以专注于新颖的情况。
这种类型的记忆可以通过强化学习、微调或明确定义的工作流程(编码了最佳实践)而出现。随着智能体获得经验,频繁使用的程序会进入程序记忆,从而提高响应时间并减少计算开销。
对于执行复杂任务的自主智能体来说,程序记忆实现了顺畅的编排。处理您旅行预订的智能体不仅知道有关航空公司的事实(语义记忆),也不会仅仅记住您过去的旅行(情景记忆),它还知道如何执行搜索航班、比较选项、进行预订和协调确认的多步骤过程。
这三种记忆类型如何协同工作
当所有三种记忆类型集成在一起时,它们发挥的作用最大。考虑一个负责“准备可再生能源投资的市场分析报告”的自主AI研究助手。

情景记忆回忆起上个月在创建类似半导体行业分析报告时,用户很欣赏包含监管风险评估,但觉得技术术语令人反感。该智能体还记得哪些数据来源最可靠,哪些可视化格式获得了最好的反馈。
语义记忆提供了事实基础:不同可再生能源类型的定义、当前市场估值、行业中的主要参与者、不同国家的监管框架,以及能源政策与投资趋势之间的关系。
程序记忆指导执行:该智能体自动知道首先从市场规模开始,然后转向竞争格局分析,接着是风险评估,最后以投资建议作结。它知道如何构建章节、何时包含执行摘要,以及引用来源的标准格式。
如果没有这三者的协同作用,智能体的能力就会下降。仅有情景记忆会导致过度个性化而缺乏普遍知识。仅有语义记忆会使智能体知识渊博但无法从经验中学习。仅有程序记忆会使其擅长执行编程任务,但在遇到新情况时会缺乏灵活性。
为您的用例选择正确的记忆架构
并非每一个自主智能体都需要同等强调这三种记忆类型。正确的记忆架构取决于您的特定应用。
对于专注于用户个性化的个人AI助手,情景记忆最重要。这些智能体需要记住您的偏好、过去的交互和结果,以便提供日益定制化的体验。
对于法律、医疗或金融等领域的领域专家智能体,语义记忆最为重要。这些智能体需要可以查询和可靠推理的深度结构化知识库。
对于处理重复性流程的工作流自动化智能体,程序记忆是关键。这些智能体最受益于可以规模化执行的学习例程。
许多生产系统(特别是基于LangGraph或CrewAI等框架构建的系统)会根据它们需要处理的任务,实施结合多种记忆类型的混合方法。
前进的道路
随着我们深入到智能体AI时代,记忆架构将区分出有能力的系统和受限的系统。那些改变我们工作方式的智能体不仅仅是拥有更好提示词的语言模型。它们是拥有丰富、多方面的记忆系统,能够实现真正自主性的系统。
短期记忆足以应对回答问题的聊天机器人。长期记忆(情景记忆、语义记忆和程序记忆)则将这些聊天机器人转变为能够在扩展时间跨度上学习、记忆并智能行动的智能体。
先进语言模型、向量数据库和记忆架构的融合,正在创造出不仅处理信息,而且随着时间推移积累智慧和专业知识的AI智能体。
对于机器学习从业者来说,这种转变要求新的技能和新的架构思维。设计有效的智能体不再仅仅是提示词工程的问题。而是要有意地决定智能体应该记住什么、如何记住它,以及何时让这些记忆影响行动。这正是目前AI领域最有趣的工作所在。
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。
评论区