借鉴人脑「海马体-皮层」机制，红熊AI重做了一个「记忆系统」

IP属地中国·北京 机器之心Pro 时间：2025-12-03 14:18:15

机器之心报道
编辑：Youli
记忆，或是 AI 从「即时回答工具」迈向「个性化超级助手」的关键突破
记忆，正成为新一轮 AI 进化的关键所在
近期，Google Research 的一篇名为《Nested Learning: The Illusion of Deep Learning Architectures》的论文大范围「出圈」，被业界看作是论文《Attention is All You Need》的 V2 版。

对于后者，想必大家已然非常熟悉，同样是 Google Research 的作品，于 2017 年 6 月发布，文中提出的 Transformer，堪称开启了大语言模型革命的序章。
新论文之所以被奉为「精神续作」，是因为同样有着「基础范式」级别的突破，该研究提出了一种全新的机器学习范式 ——「嵌套学习」（Nested Learning），使得大语言模型能够在不断学习新技能的同时，又不会遗忘旧技能，标志着「AI 正朝着真正像大脑一样记忆、进化迈出了一大步」。

其实如果仔细看，这些热闹的背后释放出一个新的信号：大模型的风向变了。
不管是各大大模型玩家在卷「谁的模型更大、更快上」呈现的疲软、无力，还是 Ilya Sutskever 振臂一呼，直言「Scaling 已死」，都在言明，过去盛行的「暴力革命」已不再适用于当前的大模型，战场早已升级。而新的「战场」上，大模型其实已经转向「谁的模型更会记忆、谁更懂用户」的深层能力比拼上，或者说，记忆，才是新一轮 AI 进化的关键所在。
怎么理解？
过去一年多以来，大模型落地应用成为主流叙事，各类智能体（Agent）、「超级助手」产品接连涌现，但时至今日，仍然没有一个产品能够真正为用户提供个性化服务，胜任「超级助手」角色，更多的还是停留在「即时回答工具」层面，一个很重要的原因是「AI 虽然聪明，但记不住，缺乏长期记忆」。
当用户打开聊天窗口时，AI 等于「从零开始」搭建新对话流程；当多智能体系统交接任务时，它们彼此之间的记忆是断裂的；当企业试图构建连续的 AI 工作流程时，系统无法持续吸收经验…… 而这些「遗忘」背后的原因有很多，核心原因就在于「当前大模型记忆机制存在根本性缺陷」。
具体来看，这一根本性「记忆缺陷」源于多重技术局限的叠加。
首先，当前主流大模型上下文窗口通常为 8k-32k tokens，在长对话中存在早期信息被「挤出」的可能，从而导致后续交互对话脱离历史上下文语境。比如用户第一轮对话中表明自己「对海鲜过敏」，可等到第五轮对话中，用户咨询「推荐今晚的菜品」时，模型可能遗忘前面对话中提到的过敏信息。并且当前大模型的主流架构多为 Transformer，而 Transformer 的自注意力对长距离依赖的捕捉能力随序列长度下降，出现「近因效应」，换句话说就是更关注最新输入，忽略早期关键信息，可谓「天生不适合长期记忆」。
简单来说就是，模型固有的上下文窗口限制与注意力衰减，使得模型只记得住短期信息。
其次，在复杂的多 Agent 协作场景中，诸如咨询、售后、推荐等各 Agent 之间缺乏跨模块的共享机制，各自维护独立的记忆，形成「记忆孤岛」，导致用户「换个入口就像换了个新 AI」，不得不一遍又一遍地重复提供信息。
另外，还有个更深层的问题在于，用户对话中的模糊指代、行业术语及多语言混用，常常导致语义解析失真，而模型静态的知识库与用户动态的个性化需求之间，更是存在难以逾越的鸿沟……
因此，业界呼唤长期、稳定、可演进的模型「记忆」，越来越多的AI厂商开始聚焦模型记忆能力，比如谷歌、OpenAI、Anthropic 等AI大厂都在围绕「记忆」这一新命题发力，通过各种方法强化其模型的记忆能力，而很多初创企业也在寻找新解法。
红熊 AI 也是其中一个。
「记忆熊」，赋予 AI 如同人类一样的记忆
其实，红熊 AI 决定做「记忆」的背后不是长期谋划的结果，也并非突然的灵感迸发，而是被真实场景的业务难题「逼」出来的。
红熊 AI 成立于 2024 年 4 月，原本是一家聚焦底层技术中台的企业。去年 9 月，团队在做一个智能客服类型项目时，遇到了模型的「知识遗忘」问题，为了解决这一「拦路虎」，团队尝试了各种技术方案，包括上下文优化、外挂知识库、模型训练调参优化、增加长期记忆等，可最后的效果都不甚理想……
这次的经历让红熊 AI 意识到一个问题：记忆缺失，或是制约 AI 从「即时回答工具」迈向「个性化超级助手」的核心瓶颈。
在红熊 AI 创始人兼 CEO、记忆熊首席科学家温德亮看来，人类智能的基石，在于能够将碎片化信息组织成可被持续调用、关联并解决新问题的记忆体系。「当前 AI 所缺乏的，正是这种基于记忆的认知能力，而不仅仅是模式匹配。」
为此，红熊 AI 重新规划公司发展重心，开始转向「多模态模型 + 记忆科学」的研发路径，之后历时一年，于今年下半年正式推出其自主研发的记忆科学核心技术产品 ——「记忆熊」（Memory Bear）。
「记忆熊」不仅有效突破了传统大语言模型在长期记忆管理中的「准确率低、成本高、幻觉多、延迟高」等诸多瓶颈，更在技术架构、应用场景与性能指标上实现多重跨越。
具体来看，「记忆熊」的技术突破在于，它并不是对模型的记忆系统进行局部优化，而是「全链路重构」，借鉴了人脑「海马体 - 皮层」的分工协作机制，构建了一套分层、动态、可演进的「类人」记忆架构。

可以这样理解，在人脑系统中，海马体就像「临时图书馆」和「索引编制中心」，负责快速形成新记忆，而大脑皮层则像是「永久分布式书库」，负责长期存储和关联知识。在日常记忆中，「海马体 - 皮层」机制通过「快速绑定 - 索引创建 - 离线重放 - 皮层固化 - 关联整合」的协作，来进行快速学习新事物和存储、记忆长期知识。
而这套机制应用在 AI 中，「记忆熊」则是按记忆管理的需求来划分为「显性记忆层」与「隐性记忆层」。

在显性记忆层，系统通过结构化数据库，存储可清晰描述和主动调用的信息，比如用户的历史对话（情景记忆）和行业知识库（语义记忆）。
在隐性记忆层，一个独立于大模型参数的外部组件负责专门管理 AI 的行为习惯、任务策略和决策偏好，使其能「无意识」地高效处理重复任务。
此外，系统还通过情感倾向加权机制，对用户标记的重要或高频情感信息赋予更高权重，模拟人类对情绪事件的深刻记忆。
比如，前面提到，在一些 AI 产品中，模型记不住之前对话中用户提到的「对海鲜过敏」，而「记忆熊」能做的不仅是记住用户「用对海鲜过敏」，甚至还能将用户的一些隐性需求进行关联记忆，像是「用户周一到周五习惯几点起床？」「到公司喝什么咖啡，天气冷了可能想喝热的，热了想喝冰的……」它能够理解「咖啡」与用户「早晨通勤习惯」的隐性关联，从而实现超越关键词的联想式记忆检索。
数据显示，「记忆熊」通过精准剔除冗余信息，在保持语义完整的前提下，能够实现 97% 的 token 效率提升和 82% 的语境偏移率降低，将复杂推理准确率提升至 75.00±0.20% 的行业高度，打破传统 AI 记忆系统「高消耗、低准确」的刻板印象。
另外，在权威的 LOCOMO 数据集测试中，「记忆熊」的性能表现在单跳问答、多跳推理、开放泛化和时序处理四大核心任务中，表现优异，尤其在基于向量的版本在 Achieving 高准确性的同时，将搜索延迟 p50 控制在 0.137 秒，总延迟 p95 低至 1.232 秒，证明了「高准确率并不代表必有高延迟」。
可以说，「记忆熊」不仅「记得住」，而且「记得快、记得准、记得省」。
「记忆熊」已落地场景应用，带来实际商业价值
在 AI 行业中，衡量一个技术是否真有价值，仅仅停留在概念阶段的各种「打榜」并不能说明一切，归根结底要取决于能否在真实场景中落地应用。在这一点上，红熊 AI 推出的「记忆熊」具有天然优势：它本身就诞生于商业场景，因此早早回到场景中验证，并交出一份不错的成绩单……
首先是智能 AI 客服场景，这可以说是「记忆熊」「缘起」的地方，曾经因为模型记忆能力不足，带来交接时客服缺乏上下文，客户被迫重复信息，情感线索被忽略，长期下来导致用户不满，客户流失的情况频发，而如今正变得不一样。
「记忆熊」可以为每位用户创建动态记忆图谱，从而让机器人拥有了「客户终身记忆」，每次交互时都可以回溯过往交互记录，理解对方情感状态，并为客服提供即时上下文，将服务从被动响应转变为主动关怀，用户无需再重复陈述问题，大幅提升用户的交互体验。
数据显示，凭借跨 Agent 的记忆共享，「记忆熊」实现了 70% 的人工替代率与 98.4% 的自助解决率。
营销场景，「记忆熊」能够根据购买习惯，为用户构建兴趣记忆图谱，追踪用户从首次点击到复购的完整旅程，继而可以针对用户兴趣，推出超个性化、实时适应用户行为的营销活动，改变传统的「猜你喜欢」营销范式，变成「我记得你喜欢，知道你现在想要什么」的主动迎合。
企业数智化领域，「记忆熊」作为统一的组织记忆中枢，打破了部门间的数据孤岛，将新员工的知识获取效率提升了 50% 以上。
而在AI 教育场景中，「记忆熊」基于个性化记忆的因材施教与情感加权推荐，正重新定义着个性化服务的标准，面对学生重复犯错、学习路径千篇一律，被忽视的学习情绪与习惯等，基于「记忆熊」的 AI 导师能够追溯学生数月的错题本，实现精准查漏补缺，从而提供更为个性化的教学体验。
不止是这些，在电商、零售等场景，「记忆熊」也正在不断赋能，通过模型记忆能力的增强，来提升服务质量。而未来，红熊 AI 将会继续以「记忆熊」为核心技术引擎，推动 AI 从「工具级服务」迈向「伙伴级服务」，为千行百业的智能化升级提供底层支撑……
其实，从整体来看，不管是 Google Research 提出「嵌套学习」，从前沿技术层面指明「记忆」的提升方向，还是像红熊 AI 这样的玩家不断从工程路径上探索「记忆」的落地应用，都在表明一个事实：「记忆」能力是当前 AI 技术侧和应用侧的双重诉求，这已然成为一个共识。
基于此共识，越来越多的玩家开始入局、押注，朝着让 AI 拥有像人类一样的记忆持续探索，而在 AGI 这一终极目标的追寻道路上，谁掌握了「记忆」，谁就更接近 AGI……

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

360周鸿祎：打造中国版Mythos，抵御用智能体产生的自动进攻

中国电信网优任务大模型白皮书发布

百度开源Unlimited OCR模型：解析文档告别AI越生成越慢

硬刚马斯克，软银称已开始量产机器人，将成为“压倒性的世界第一”

2026年财富中国科技50强出炉华为/字节跳动/联想入选

谷歌前CEO批评中国AI开源：“这样我们就失去了任何控制手段”

全站最新

360周鸿祎：打造中国版Mythos，抵御用智能体产生的自动进攻

中国电信网优任务大模型白皮书发布

百度开源Unlimited OCR模型：解析文档告别AI越生成越慢

硬刚马斯克，软银称已开始量产机器人，将成为“压倒性的世界第一”

热门推荐

360周鸿祎：打造中国版Mythos，抵御用智能体产生的自动进攻

中国电信网优任务大模型白皮书发布

百度开源Unlimited OCR模型：解析文档告别AI越生成越慢

硬刚马斯克，软银称已开始量产机器人，将成为“压倒性的世界第一”

2026年财富中国科技50强出炉华为/字节跳动/联想入选

谷歌前CEO批评中国AI开源：“这样我们就失去了任何控制手段”

2.8万Star爆款作者竟被谷歌裁了！硅谷大佬火速抢人

一个智谱，相当于半个阿里巴巴？

联想问天超节点方案亮相：单节点40GPU加持，算力通信部署扩展全面升级

REDMI Note系列再出新招跳过16代 7月Note 17系列携硬核配置来袭

苹果折叠屏新动向：iPhone Ultra 2阔折叠立项，iPhone Air 3开模待Air 2销量

亚马逊AWS业务CEO加曼：AI将重塑半数白领岗位，新职业机遇正涌现

华为申请车顶升降专利鸿蒙智行MPV或将实现“车顶变二层”露营新体验

火山引擎“领跑”Token经济：从模型爆发到赋能千行百业新图景

REDMI K90至尊版来袭：大电池+快充加持散热外观屏幕皆看齐Max