全国运营商首个！华为联合湖北移动完成AI推理加速现网测试：Token吞吐率大增372%

IP属地中国·北京 编辑：郑浩快科技 时间：2026-06-26 08:05:49

快科技6月26日消息，据“华为数据存储”公众号消息，在2026 MWC上海展期间，华为与中国移动通信集团湖北有限公司（以下简称“湖北移动”）联合宣布，双方已成功完成全国运营商首个AI推理加速解决方案现网测试。
此次测试基于华为OceanStor A800存储与昇腾A3超节点架构，并搭载UCM（Unified Cache Manager，推理记忆数据管理）能力，在长序列AI推理场景下，实现Token吞吐率最高提升372%的突破性成果，为运营商智算业务的高效部署提供了重要技术支撑。
据介绍，本次测试在湖北移动现网环境中部署vLLM-Ascend框架，面向MiniMax M2.5、GLM-5.1等主流大模型，模拟了8K至190K长序列输入场景。
测试结果显示，在MiniMax M2.5模型场景下，启用UCM后，首Token延迟（TTFT）优化26%至62%，单NPU卡Token输出效率（TPS）也获得明显提升。
其中，在64K序列长度下，TPS提升58%；在128K序列长度下，TPS提升78%。
在GLM-5.1模型场景下，UCM带来的加速效果更加明显，TTFT优化幅度达到51%至93%，TPS提升56%至372%。
具体来看，在64K序列长度下，TPS提升313%；在128K序列环境下，TPS最高提升372%。
华为表示，测试结果表明，随着上下文长度不断增加，AI推理加速方案的优势将持续放大，有效解决了长序列推理中的KV Cache容量瓶颈。
对于运营商而言，这意味着在大模型推理、智能客服、内容生成、行业智能体等长序列AI业务场景中，现网智算资源有望获得更高利用效率，同时降低长上下文推理带来的性能压力。

标签：华为 运营商 序列场景现网湖北全国部署智算智能业务节点方案性能 责任编辑 内容架构优势压力科技能力模型环境长度技术框架公众客服记忆 数据管理 成果有限

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

机器人终于不瞎抓了！港大阿里联手开源FineVLA：用哪只手、抓哪里，一句话全搞定

一次吃下一本书！百度开源新OCR，作者疑似前DeepSeek研究员

OpenAI内部Token流向剧变，Codex几乎“通吃”

苹果涨价引发亚洲科技股抛售，市场担忧存储芯片涨价拖累AI需求

让外卖骑手转型汽车营销、质量管理，吉利发起“跨时代实战专业能力培养计划”

中国信通院联合华为云等22家单位，筹备成立AIIA词元服务工作组

全站最新

机器人终于不瞎抓了！港大阿里联手开源FineVLA：用哪只手、抓哪里，一句话全搞定

一次吃下一本书！百度开源新OCR，作者疑似前DeepSeek研究员

OpenAI内部Token流向剧变，Codex几乎“通吃”

苹果涨价引发亚洲科技股抛售，市场担忧存储芯片涨价拖累AI需求

热门推荐

机器人终于不瞎抓了！港大阿里联手开源FineVLA：用哪只手、抓哪里，一句话全搞定

一次吃下一本书！百度开源新OCR，作者疑似前DeepSeek研究员

OpenAI内部Token流向剧变，Codex几乎“通吃”

苹果涨价引发亚洲科技股抛售，市场担忧存储芯片涨价拖累AI需求

新加的同事为啥能看到你以前的“同事不可见”朋友圈？微信官方给出答案

Notion宣布将于9月22日关闭AI邮箱服务Notion Mail

亚马逊加码印度：拟投 130 亿美元布局AI与云基础设施

让外卖骑手转型汽车营销、质量管理，吉利发起“跨时代实战专业能力培养计划”

中国信通院联合华为云等22家单位，筹备成立AIIA词元服务工作组

特朗普T1手机开放销售，结算页需额外支付41.75美元的“设备税”

消息称三星集团29日将公布1000万亿韩元巨额投资计划

小米YU7获CNCAP安全性测试五星认证：雷军称安全高于一切

DeepSeek成立以来规模最大扩招，意味着什么？

头部新势力车企回应：暂不涨价

TD Cowen称马斯克SpaceX可能斥3200亿美元收购美国第三大运营商T-Mobile