智谱发布Infra新成果：不加一块GPU，算力多出15%

IP属地中国·北京 澎湃新闻 时间：2026-05-21 12:28:24

5月21日，澎湃新闻记者获悉，智谱联合驭驯网络与清华大学，在GLM-5.1线上生产集群中完成了新一代网络架构ZCube的规模化落地。
在线上GLM-5.1 coding场景中，在保持GPU算力、软件栈与应用不变的前提下，ZCube节省了33%交换机与光模块成本，同时将GPU平均推理吞吐提升了15%，并将TTFT P99降低了40.6%。
这意味着，同样的硬件投入，智谱的 GLM 大模型现在每秒能多响应 15% 的 API 请求。对于大模型 API 平台而言，这直接对应更高的并发上限以及在流量峰值下更稳定的用户体验。（澎湃新闻记者范佳来）

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

微软Teams加强第三方AI智能体权限管理，需会议组织者确认后放行

互联网的meme危险了

工业互联网发展迎来新机遇（锐财经）

高考生填志愿前，都该读一遍DeepSeek的招聘帖

华为用户不寂寞！全国首个全场景开源鸿蒙养老院落地：支持无感监测、主动预警

关键考验明日来袭：三星Q2营利料狂飙17倍但AI支出前景暗藏风险

全站最新

微软Teams加强第三方AI智能体权限管理，需会议组织者确认后放行

互联网的meme危险了

工业互联网发展迎来新机遇（锐财经）

高考生填志愿前，都该读一遍DeepSeek的招聘帖

热门推荐

龙大转债涨停、股价涨9.7%，ST龙大启动庭外重组“找钱”

谷歌跳票之后终定档：Gemini 3.5 Pro七月硬刚DeepSeek V4，全新底座不再"挤牙膏"

全球首例AI智能体勒索攻击浮出水面：无需人类干预的自动化“作案”链条

微软Teams加强第三方AI智能体权限管理，需会议组织者确认后放行

互联网的meme危险了

工业互联网发展迎来新机遇（锐财经）

优必选99万机器人伴侣续航撑不过一晚？ “赛博伴侣”引爆争议

高考生填志愿前，都该读一遍DeepSeek的招聘帖

华为用户不寂寞！全国首个全场景开源鸿蒙养老院落地：支持无感监测、主动预警

关键考验明日来袭：三星Q2营利料狂飙17倍但AI支出前景暗藏风险

AI时代游戏主机还能抢占客厅吗？这家家电厂商押注了

Token支出指数暴跌近20%！AI“牛熊激辩”正围绕这张图展开？

2026量子计算迟到的狂欢：能拿订单、奔赴IPO、市值破百亿

“AI狂欢”末日将至？“大空头”发出警告

印度代工厂被黑，苹果最怕泄露的不是真机照片