当前位置: 首页 » 资讯 » 科技头条 » 正文

单套1.35亿元!华为独家中标中移动超节点采购

IP属地 中国·北京 观察者网 时间:2025-12-03 12:18:30

(文/观察者网 吕栋)

近日,中国移动招标与采购网显示,中国移动研究院2025年超节点试验装置采购项目开标,中标候选人为华为技术有限公司(下称:华为),投标报价为1.35亿元,拟中标份额100%。

观察者网注意到,该采购的招标公告于11月6日发布,招标内容包括超节点试验装置1套(含超节点智算模块(含计算及配套网络等)48套、超节点存储模块1套)。

就在11月11日,华为公布其第六届“十大发明”,“Scale-up超大规模超节点算力平台”排在第一位。

据介绍,该发明将超节点内的异构并行处理器、CPU、内存、存储等资源,通过高速互联总线形成全对等互联架构,实现共享内存池;资源可根据不同的任务需求,像搭积木一样进行灵活调配组合,实现了“一切皆对等、一切皆可池化、一切皆可组合”,使数百、数千个AI处理器联接起来,像一台计算机一样工作、学习、思考、推理。

而根据华为之前公布的信息,昇腾384超节点首创将384颗昇腾NPU和192颗鲲鹏CPU通过全新高速网络MatrixLink全对等互联,算力总规模达300Pflops,是英伟达NVL72的1.7倍;网络互联总带宽达269TB/s,比英伟达NVL72提升107%;内存总带宽达1229TB/s,比英伟达NVL72提升113%;单卡推理吞吐量达到2300 Tokens/s。


图源:观察者网

在当下,大模型对算力需求的爆炸式增长,但传统计算架构面临资源利用率低,故障频发等挑战,难以支撑AI技术的代际跃迁,这对算力集群的提出更高要求。随着传统服务器集群的堆卡模式,已无法实现算力的线性增加,超节点正在成为AI基础设施建设的新常态。除了华为,国内多家厂商也都在探索超节点系统。

比如近期中科曙光也发布了全球首个单机柜级640卡超节点scaleX640,该方案采用“一拖二”高密架构设计,实现了单机柜640卡超高速总线互连,综合算力性能实现倍增,同时单机柜算力密度提升20倍;相比传统方案,可实现MoE万亿参数大模型训练推理场景30%-40%的性能提升。

中科曙光表示,通过30天+长稳运行可靠性测试验证,scaleX640可保障10万卡级集群扩展部署。


中科曙光scaleX640超节点

百度昆仑芯也在9月首次展示了自己的超节点方案,据称该方案单个机柜可支持32至64张加速卡的灵活部署,在DeepSeek V3/R1 PD分离推理架构的优化下实现了单卡性能提升95%,单实例推理性能大幅提升高达8倍,已在百度内部实现大规模部署。


昆仑芯超节点

无独有偶,在今年世界人工智能大会上,上海仪电、曦智科技、壁仞科技和中兴通讯,联合发布了国内首个光互连光交换GPU超节点——光跃LightSphere X。据介绍,相比铜缆,光缆的远距离传输优势可实现交付与机柜解耦。该方案采用光互连技术,通过增加机柜数量构建超节点,能按模型算力需求动态调整超节点规模,将实现2000卡部署。


图源:观察者网

相比传统的计算集群,超节点到底有哪些不同?

根据华为董事、ICT BG CEO杨超斌近期的介绍,超节点应具备6大特征:总线级互联、平等协同、全量池化、协议归一、大规模组网、高可用性。它事实上就是改变过去的“主从架构”,构建一台能学习、思考、推理的超级计算机,物理上由多台机器组成,但逻辑上以一台机器学习、思考、推理。

随着算力集群迈入“万卡协同”时代,在今年华为全连接大会上,华为宣布了未来的超节点演进计划,计划2026年四季度上市的Atlas 950超节点,基于8192颗昇腾950DT芯片打造,满配包括由128个计算柜、32个互联柜,共计160个机柜组成,柜间采用全光互联,FP8算力达到8E FLOPS,FP4算力达到16E FLOPS,互联带宽达到16PB/s。这意味着,Atlas 950一个产品的总互联带宽,将超过今天全球互联网峰值带宽的10倍。


图源:观察者网

“Atlas 950超节点,至少在未来多年都将是全球最强算力的超节点,并且在各项主要能力上都远超业界主要产品。其中,相比英伟达同样将在明年下半年上市的NVL144,Atlas 950超节点卡的规模是其56.8倍,总算力是其6.7倍,内存容量是其15倍,达到1152TB;互联带宽是其62倍,达到16.3PB/s。即使是与英伟达计划2027年上市的NVL576相比,Atlas 950超节点在各方面依然是领先的。”华为轮值董事长徐直军称。

华为还计划构建更大规模的超节点算力集群,比如Atlas 950 SuperCluster集群,由64个Atlas 950超节点互联组成,把52万多片昇腾950DT组成一个整体,FP8总算力可达524 EFLOPS。相比当前世界上最大的集群 xAI Colossus,规模是其2.5倍,算力是其1.3倍。与此同时,2027年四季度,华为还计划基于Atlas 960超节点,推出Atlas 960 SuperCluster,规模达百万卡级,FP8总算力达2 ZFLOPS,FP4总算力达4 ZFLOPS。

本文系观察者网独家稿件,未经授权,不得转载。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

全站最新