今日凌晨,智谱发布技术博客《Scaling Pain:超大规模Coding Agent推理实践》,首次系统披露GLM-5系列模型在超大规模Coding Agent调用场景下的底层推理技术突破。包括两个关键Bug的定位及修复、一项性能优化创新、以及一个意外的监控机制突破。
针对Context Parallel策略中的KV Cache冗余存储问题,智谱设计实现了KV Cache分层存储方案 LayerSplit —— 每张GPU仅持有部分层的KV Cache,通过广播机制完成协同计算。在Cache命中率90%条件下,40K至120K请求长度区间内,系统吞吐量提升10%至132%,且上下文越长收益越显著。这一优化直接大幅提升智谱在Coding场景下的服务能力上限。
智谱本次披露的工程突破具备明确的技术深度——团队不仅在自有推理链路中定位并修复了PD分离架构下的KV Cache跨节点复用竞态,更进一步在主流开源推理框架SGLang的源代码层面发现并修复了HiCache模块的加载时序缺失(read-before-ready)问题,修复方案被SGLang开源社区采纳,其底层基础设施能力不仅服务于自身模型,也正在成为大模型行业的公共基础设施之一。
智谱推理优化还在进一步加速,大幅提升单位算力token吞吐效率,降低推理成本。
智谱官宣GLM-5底层基建进展:吞吐最高提升132%,修复方案被SGLang开源社区采纳
IP属地 中国·北京
编辑:格隆汇 格隆汇 时间:2026-05-12 01:43:48
免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。
全站最新
热门推荐
- 美股高开低走!三大指数集体收跌,ARM跌超10%,中概指数跌1.4%
- 翼菲科技(06871.HK)5月8日起招股 发售价将为每股30.50港元
- 翼菲科技(06871.HK)拟全球发售2460万股H股 预计5月18日上市
- 瑞和数智(03680.HK)与硬核坚果、嘉兴政通等订立合伙协议
- 美股大涨!纳指、标普500指数续创新高!AMD涨超18%,英伟达市值重回5万亿,中概指数涨3.45%
- 美股异动|Arm盘后大涨后跌逾7%,2026财年Q4营收14.9亿美元高于市场预期
- 中国生物制药(01177.HK):克非奇拜单抗“CCR8单抗”二线治疗胃癌Ⅲ期注册临床试验完成首例患者入组
- 科笛-B(02487.HK):CU-30101(局部外用利多卡因丁卡因乳膏剂)获得国家药监局药品上市许可
- 新华通讯频媒(00309.HK)拟根据一般授权发行1.53亿股新股份
- 美高梅中国(02282.HK)拟发行本金总额7.5亿美元优先票据
- 中国宏桥(01378.HK)5月6日耗资5.95亿港元回购1795.1万股
- 美的集团(00300.HK):建议发行于2027年到期86.24亿港元可换股债券及于2033年到期86.24亿港元可换股债券
- 蓝河控股(00498.HK)5月7日起停牌
- 紫元元(08223.HK)5月7日起短暂停牌
- 美的集团(000333.SZ):拟发行于2027年到期86.24亿港元及于2033年到期86.24亿港元H股可转债





京公网安备 11011402013531号