梁文锋署名DeepSeek新论文发布，直指大模型“记忆”短板

IP属地中国·北京 贝壳财经 时间：2026-01-13 14:08:26

新京报贝壳财经讯（记者罗亦丹）1月12日晚间，DeepSeek发布了一篇新论文，主题为《Conditional Memory via Scalable Lookup:A New Axis of Sparsity for Large Language Models》（直译为基于可扩展查找的条件记忆：大语言模型稀疏性的新维度），梁文锋再度出现在了作者名单最后。这篇论文为北京大学和DeepSeek共同完成。
新京报贝壳财经记者浏览发现，这篇论文的核心直指当前大语言模型存在的记忆力“短板”，提出了“条件记忆”这一概念。
为了实现“条件记忆”，DeepSeek提出的解决方案是一个名为Engram（直译为：记忆痕迹）的模块，它将语言建模任务拆解为“静态模式检索”与“动态组合推理”两大分支：前者负责实体、固定短语等确定性知识的快速调取，后者则交由Transformer架构专注完成复杂逻辑运算。
论文最后表示，“我们将条件记忆视为下一代稀疏模型不可或缺的建模原语。”
当前，有不少声音猜测DeepSeek的下一代模型将于春节前发布，复现2025年春节期间盛况。这一背景下，此篇论文或为模型的“庐山真面目”提供了方向。
编辑杨娟娟
校对杨利

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

三年改名八次后，字节前员工创办的演语科技估值涨到20亿美金

飞书广州峰会落地，聚焦制造业AI协作升级

OpenAI发布GPT-5.6系列模型，应美政府要求限量开放，直言不应成为长期默认做法

美股芯片股全线大跌，安森美半导体跌超20%，中概股走势分化，迅雷涨超10%

全球性能第一！国家超算互联网存储系统登顶

腾讯音乐研究院发布《2025华语数字音乐年度白皮书》，深度解读AI与超级粉丝趋势

全站最新

三年改名八次后，字节前员工创办的演语科技估值涨到20亿美金

飞书广州峰会落地，聚焦制造业AI协作升级

OpenAI发布GPT-5.6系列模型，应美政府要求限量开放，直言不应成为长期默认做法

国产超豪华MPV新标杆！尊界V800亮相，配置拉满能否重塑市场格局？

热门推荐

三年改名八次后，字节前员工创办的演语科技估值涨到20亿美金

飞书广州峰会落地，聚焦制造业AI协作升级

OpenAI发布GPT-5.6系列模型，应美政府要求限量开放，直言不应成为长期默认做法

黄锐名下工作室以蛋黄酱命名

大疆跨界新作：ROMO 2系列扫地机器人携无人机技术开启地面清洁新篇章

智元机器人数采2.0体系发布，为西南具身智能产业规模化发展添新动力

美股芯片股全线大跌，安森美半导体跌超20%，中概股走势分化，迅雷涨超10%

全球性能第一！国家超算互联网存储系统登顶

腾讯音乐研究院发布《2025华语数字音乐年度白皮书》，深度解读AI与超级粉丝趋势

南网数字旗下广东电算科技工程公司增资至15.17亿增幅约17%

高通骁龙8E6系列9月登场！2nm工艺加持小米18系列两款机型将首发

本田上市69年首现年度亏损：2025财年净亏4239亿，电动化战略致巨亏后调整方向

买宠物不再开盲盒！京东“安心宠”服务上线：专人专车送到家

华为助力全球运营商以网为基，以智为翼，业网算协同创新，迈向Token经营新征程

华为赵振龙：AI赋能网络新质生产力，华为无线网络智能体激活网络新动能