华为推新技术优化大模型推理：UCM 技术缓解 HBM 依赖

IP属地中国·北京 编辑：赵云飞 Chinaz 时间：2025-08-12 16:24:58

8月12日，华为将在 2025金融AI推理应用落地与发展论坛上发布突破性 AI 推理创新技术 UCM（推理记忆数据管理器）。该技术有望降低中国 AI 推理对 HBM（高带宽内存）的依赖，并显著提升国内大模型推理性能。
UCM 以 KV Cache 为核心，融合多类型缓存加速算法工具，通过分级管理推理过程中产生的记忆数据，扩大上下文窗口，实现高吞吐、低时延的推理体验，并降低每 Token 的推理成本。这一方案可缓解 HBM 资源不足带来的任务卡顿与响应延迟问题。
在此次论坛上，华为将与中国银联共同发布 AI 推理最新应用成果。信通院、清华大学、科大讯飞等机构专家也将分享大模型推理加速与体验优化的实践。华为数据存储产品线副总裁樊杰表示，未来 AI 突破将高度依赖高质量行业数据的释放，高性能 AI 存储可将数据加载时间从小时级缩短至分钟级，使算力集群效率从30% 提升至60%。
业内分析认为，UCM 的推出正值 AI 产业从“追求模型能力极限”转向“追求推理体验最优化”的关键节点，推理体验已成为衡量 AI 商业价值的重要标准。长城证券指出，随着大模型能力持续提升与商业场景扩展，算力及产业链公司有望迎来新的发展机遇。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

香港大学提出无需数据标记的ViT密集表征增强方法

【为你喝彩】科技报国传薪火·孙颖慧：14年攻坚，一颗药丸的生命重量

牵扯英特尔，台积电又曝“内鬼”

比特币11月雪崩，谁抽走了市场的梯子？

美国最强学术超算Horizon开始安装，含英伟达Vera CPU服务器

特斯拉Robotaxi服务向公众全面开放，但仅提供iOS版App

全站最新

香港大学提出无需数据标记的ViT密集表征增强方法

【为你喝彩】科技报国传薪火·孙颖慧：14年攻坚，一颗药丸的生命重量

牵扯英特尔，台积电又曝“内鬼”

比特币11月雪崩，谁抽走了市场的梯子？

热门推荐

人形机器人量产交付视频被质疑造假，优必选回应：完全失实

香港大学提出无需数据标记的ViT密集表征增强方法

超微电脑(SMCI.US)推出基于英伟达架构的AI工厂集群解决方案以简化大规模部署

【为你喝彩】科技报国传薪火·孙颖慧：14年攻坚，一颗药丸的生命重量

2025第二届中关村具身智能机器人应用大赛举行

牵扯英特尔，台积电又曝“内鬼”

比特币11月雪崩，谁抽走了市场的梯子？

美国最强学术超算Horizon开始安装，含英伟达Vera CPU服务器

特斯拉Robotaxi服务向公众全面开放，但仅提供iOS版App

全球首型深远海智能渔业养殖工船“湛江湾1号”交付

全新吉利帝豪 6.59 万元起，车长 4.8 米，吉利要把燃油车市场吃干抹净

萨尔瓦多政府砸下逾1亿美元大举抄底! 比特币“超级大反攻”号角已吹响?

全球首台！这项药物“智造”核心装备，将提升中国创新药竞争力

中国平安CTO：AI加速进化，平安正在打造三大AI服务

NeurIPS 2025 | 上下文元学习实现不微调跨被试脑活动预测