![]()
图片由AI生成
如果一个AI每次对话结束后,都会把与你的全部交流清空,那么无论它多聪明,都只能算是一个“高级聊天工具”,而不是一个真正意义上的智能体(Agent)。
这正是当下Agentic AI面临的核心瓶颈之一:失忆。
近日,由盛大集团全资孵化的AI技术团队EverMind,正式对外系统性地展示了他们给出的解法——EverMemOS,最新版本在四大记忆基准上实现了最先进(SOTA)准确率。
伴随而来的,还有 EverMemOS 云服务的内测,以及一项总奖金高达 8 万美元的全球开发者大赛 ——Memory Genesis Competition 2026。
这背后是陈天桥对“基础性技术长期投入”的一贯判断,也是EverMind联合创始人邓亚峰在AI记忆基础设施方向上的一次正面下注。
在产品发布之外,这也更像是一次针对“AI是否能真正成为长期智能体”的底层挑战。
为什么Agent一定需要长期记忆?
在大模型能力突飞猛进的这两年里,行业几乎把所有注意力都集中在参数规模、多模态、推理能力和算力效率上。
但在真实应用中,开发者很快发现了一个残酷事实:模型会“忘事”。
无论是对用户偏好的理解、对历史决策的追溯,还是跨时间跨度的复杂推理,只要上下文窗口结束,一切都得从头来过。RAG可以缓解一部分问题,但它更像是“临时查资料”,而不是“真正记住”。
如果说大模型负责“思考”,那么记忆系统决定的,其实是智能体是否具备连续自我。
邓亚峰认为,“如果模型每次会话后都会重置理解,真正的Agentic AI就无从谈起。”
EverMind正在从静态的上下文窗口迈向动态、自组织的记忆,借助EverMemOS,为智能体提供了一段“活的、会演化的历史”。
基准结果表明:EverMind能够以远低于全上下文模型的算力成本,实现更高的准确率。
正是在这一判断下,EverMind把研发重心从模型能力本身,转向了一个更底层,也更难的方向——AI Memory Infra。
EverMemOS:打破行业基准,点击即用
在EverMind最新发布的论文EverMemOS: A Self-Organizing Memory Operating System for Structured Long-Horizon Reasoning中,团队对现有主流方案进行了清晰区分。
![]()
截图EverMemOS: A Self-Organizing Memory Operating System for Structured Long-Horizon Reasoning
EverMind详细阐述了其技术提出的一套受engram启发的生命周期机制,用以模拟生物认知过程。与传统RAG或成本高昂的超长上下文窗口不同,EverMemOS能将经验组织为连贯、可演化的结构。
它试图构建的,是一个类似生物认知系统的记忆生命周期,灵感直接来自神经科学中的engram理论。
在这套架构中,记忆不是静态存储,而是会被不断压缩、重组、强化和遗忘的动态系统。
EverMemOS的核心机制,被概括为三个连续但可循环的阶段。
第一阶段:情景痕迹形成(Episodic Trace Formation)。
将对话流转换为MemCells,用于捕捉情景痕迹、原子事实以及有时间边界的前瞻信息。
第二阶段:语义巩固(Semantic Consolidation)。
把MemCells动态组织为主题化的MemScenes,提炼稳定的语义结构,并持续更新持久化的用户画像。
第三阶段:重建式回忆(Reconstructive Recollection)。
通过agentic检索组合“必要且充分”的推理上下文,在优化算力成本的同时保证高准确率。
这也是EverMemOS能在大幅降低token消耗的同时,维持甚至提升准确率的关键。
基准成绩,是硬指标
在AI基础设施领域,架构是否成立,最终要看基准测试。
EverMind在四个主流记忆评测基准上,给出了极具说服力的数据。
LoCoMo(93.05%准确率):超越全部现有记忆系统与全上下文模型;在多跳推理(+19.7%)与时序任务(+16.1%)上优势显著,同时大幅降低token使用与计算成本。
LongMemEval(83.00%准确率):在知识更新与时序推理方面位居第一;其中知识更新任务提升20.6%,体现出系统可通过持续语义巩固不断“进化”的能力。
HaluMem(90.04%召回):在记忆完整性方面建立新的行业标准,显著减少长时程任务中的幻觉。
PersonaMem v2:在9个复杂场景中,在深度个性化与行为一致性维度取得最佳综合表现。
这说明EverMind不需要牺牲效率,去换取长期记忆。结构本身,就是效率。
从论文到云服务:记忆能力的产品化
如果EverMemOS只停留在论文阶段,它的意义仍然是学术层面的。
但是,EverMind显然希望更快地进入真实应用场景。
此次同步推出的EverMemOS Cloud Service,正是为开发者和企业提供“即插即用”的记忆增强能力。通过简单API调用,原本无状态的聊天机器人,可以在数分钟内升级为具备长期上下文感知的智能体。
在设计上,该云服务强调三点:
一是企业级数据安全与隐私隔离;二是对底层记忆架构的自动迭代;三是尽可能降低开发者的使用门槛。
目前,该服务已对候补名单(waitlist)用户开放内测,也可以通过官网申请加入内测:console.evermind.ai。
Memory Genesis:把基础设施交到生态手里
与产品发布同样重要的,是EverMind对生态的态度。
Memory Genesis Competition 2026,并不想做成一次常规的应用开发大赛,而是围绕“记忆原生应用”展开的系统性共创。![]()
EverMind
赛事设置了Memory+Agent、Plugin和Infra三大赛道,覆盖从应用到基础设施的不同层级。初始奖金池为8万美元,并提供后续收入分成与职业机会。
优秀开发者不仅能获得奖金,还可能直接进入EverMind工程团队,或获得长期技术支持。
开发者可在2月线上参赛并提交作品,3月份将在社区逐步公布优秀项目,并将邀请优秀团队参加4月初在硅谷举办的线下活动。
开发者可在evermind.ai/activities注册。
Memory Genesis Competition的举办,延续了陈天桥一贯的逻辑:真正的基础设施,必须交由生态来验证和放大。
从更大的时间尺度看,EverMemOS的出现并不偶然。
当模型能力趋同、算力成本成为瓶颈,长期记忆正在成为Agent竞争的分水岭。谁能让AI “记得住、记得准、记得久”,谁就更接近真正的智能体。
EverMind选择在这个节点押注记忆基础设施,既是技术判断,也是战略选择。
对陈天桥和邓亚峰而言,这是一次对“长期价值”的再次下注,为Agentic AI补上一块关键拼图的尝试。
多数AI应用的失败,也许并不是因为模型不够聪明,而是因为系统不够完整。
EverMemOS至少回答了一个长期被忽视的问题:如果AI没有记忆,它到底是谁?
而这,或许正是下一阶段智能竞争真正开始的地方。(作者|李程程,编辑|李玉鹏)





京公网安备 11011402013531号