今日凌晨,智谱发布技术博客《Scaling Pain:超大规模Coding Agent推理实践》,首次系统披露GLM-5系列模型在超大规模Coding Agent调用场景下的底层推理技术突破。包括两个关键Bug的定位及修复、一项性能优化创新、以及一个意外的监控机制突破。
针对Context Parallel策略中的KV Cache冗余存储问题,智谱设计实现了KV Cache分层存储方案 LayerSplit —— 每张GPU仅持有部分层的KV Cache,通过广播机制完成协同计算。在Cache命中率90%条件下,40K至120K请求长度区间内,系统吞吐量提升10%至132%,且上下文越长收益越显著。这一优化直接大幅提升智谱在Coding场景下的服务能力上限。
智谱本次披露的工程突破具备明确的技术深度——团队不仅在自有推理链路中定位并修复了PD分离架构下的KV Cache跨节点复用竞态,更进一步在主流开源推理框架SGLang的源代码层面发现并修复了HiCache模块的加载时序缺失(read-before-ready)问题,修复方案被SGLang开源社区采纳,其底层基础设施能力不仅服务于自身模型,也正在成为大模型行业的公共基础设施之一。
智谱推理优化还在进一步加速,大幅提升单位算力token吞吐效率,降低推理成本。
智谱官宣GLM-5底层基建进展:吞吐最高提升132%,修复方案被SGLang开源社区采纳
IP属地 中国·北京
编辑:格隆汇 格隆汇 时间:2026-05-12 01:43:48
免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。
全站最新
热门推荐
- 知名艺人吴尊行李失联三天背后,国泰航空的盈利与服务为何背道而驰
- 突发!美国禁止 OpenAI 发布 GPT-5.6
- 德美化工(002054.SZ)拟对控股子公司德荣化工增资1亿元
- 德美化工(002054.SZ):子公司施华特秘鲁公司下属公司拟750万美元出售三处土地
- 合作品牌陷“纸尿裤风波”,孩子王再战港股
- 时空道宇CEO王洋:民营低轨星座为何要走“开源”之路?|直击MWC上海
- 青龙管业(002457.SZ):中标5.57亿元采购项目
- 兴业科技(002674.SZ)签署收购磷化铟业务相关资产框架协议
- 思必驰再次冲刺IPO,却遭3名经销商举报:夸大市场前景诱导囤货、虚构合作资源
- 多场次电影票全部售罄!《给阿嬷的情书》在英国和爱尔兰上映
- WPS回应C盘占用:7月上线磁盘存储管理功能,用户可一键批量清理文件
- 大瓜!这位2026年全网最火的基金经理,已经亏麻了!
- 中工国际(002051.SZ)子公司签合肥长丰县11.27亿独立混合储能电站总承包合同
- 峰璟股份(002662.SZ):锂电池项目(新型钛酸锂电池)一期2GWh 工程已经全面建设完成
- 巨力索具“蹭热点”罚单落地!杨子侄子被罚200万,年薪18万董秘被罚300万





京公网安备 11011402013531号