当马斯克OpenAI算力军备赛打响，中国最大国产AI算力池来了！

IP属地中国·北京 智东西 时间：2026-02-06 18:21:45

智东西
作者李水青
编辑漠影
智东西2月6日报道，昨日，由中科曙光提供的3套scaleX万卡超集群系统，在国家超算互联网核心节点同时上线试运行。
这是国内第一次在国家级算力枢纽节点上，同步部署并实际投入运营3套万卡级AI超集群，一举成为全国首个实现超3万卡部署、且已进入实际运营阶段的最大国产AI算力池。
该算力池覆盖万亿参数大模型训练、高通量推理、AI for Science等当前最重型、最前沿的大规模AI计算场景，并通过国家超算互联网平台对外提供统一调度与服务。
放在全球背景下，这一节点的上线，恰好发生在AI算力军备竞赛白热化的时间窗口。
不久前，埃隆·马斯克刚刚宣布，xAI用于训练Grok的“Colossus 2”超级计算机投入运行，成为全球首个吉瓦级训练集群，并计划在数月内继续扩容；OpenAI则斥资百亿美元，联合AI芯片企业Cerebras部署750兆瓦级晶圆级系统，试图打造全球最大高速AI推理平台……
在海外资本与科技巨头不断“堆算力”的同时，国家超算互联网核心节点三套万卡集群同步落地，以独有的工程化、体系化方式，打造国家超算互联网中一颗强劲的“动力心脏”。
一、从真机亮相到规模落地：不到两个月完成算力跨越
时间回溯到2025年12月，在昆山举行的光合组织2025人工智能创新大会（HAIC2025）上，作为全球领先的大规模智能计算系统，中科曙光scaleX万卡超集群首次以真机形式展出，引起行业广泛关注。

当时外界更多将其视为一次技术展示：展示国产万卡集群在超节点架构、高速互联、能效控制等方面，已经具备与国际同类路线同台竞争的能力。
但不到两个月后，scaleX万卡超集群就完成了从“真机展示”到“落地国家核心节点试运行”的关键跨越——且不是一套，而是三套同步部署、同时上线。
这一速度背后，体现的是工程化能力的集中释放。
三套万卡集群同步部署，意味着要在极短时间内，完成从设备交付、机房适配、供配电与散热系统建设，到网络调通、软件栈部署、调度系统联调，再到稳定性验证与试运行的完整链路。任何一个环节出现瓶颈，都会放大为整体延误。
这也意味着，万卡集群不再是“定制化工程”，而已经具备可复制、可规模交付的能力。
值得一提的是，该核心节点并非孤立存在。作为国家超算互联网的重要枢纽，该核心节点承载了中国最大的国产AI算力资源池，其上线也意味着国产万卡集群正式进入国家级算力体系的“主干网络”。
二、揭秘技术底座：万卡超集群如何真正“跑起来”
万卡级AI集群，从来不是“把卡堆在一起”这么简单。
在规模跨过万卡门槛后，系统面临的挑战会呈指数级放大，核心集中在三件事上：算力能否充分释放、系统能否长期稳定运行、资源能否被高效调度使用。
1、高速互联：决定万卡算力是否“有效”
在大模型训练和推理场景中，节点间通信往往成为性能瓶颈。算力规模越大，通信效率对整体性能的影响就越致命。
scaleX万卡超集群采用的是中科曙光自主研发的scaleFabric高速互联网络。该网络基于国内首款400G类InfiniBand原生RDMA网卡与交换芯片，可实现400Gb/s带宽、端到端通信延迟低于1微秒。
这一网络不仅支撑万卡级集群高效运行，还在架构上预留了向十万卡、百万卡规模平滑扩展的能力。相较传统IB网络方案，其通信性能提升超过2倍，同时网络总体成本下降约30%，为后续更大规模集群建设提供了现实可行的路径。
2、高密度供电与散热：平衡算力密度与能效，能效比创新高
算力规模上去之后，真正考验系统工程能力的，往往是“物理世界”，供电和散热成为不可忽视的挑战。
scaleX万卡超集群采用了全球首创的高密度单机柜设计。通过超高密度刀片架构与浸没相变液冷技术，单机柜算力密度提升约20倍，整体PUE值低至1.04。
这意味着，在同等机房条件下，可以部署更高密度的AI算力，同时将能耗控制在可持续范围内。这不仅直接影响运营成本，也决定了万卡集群是否具备长期稳定运行的现实基础。
3、统一调度与运维：智能管理万级节点、服务十万级用户
万卡集群的价值，最终取决于是否“好用”。
在核心节点，三套万卡超集群并非各自独立运行，而是通过统一的调度与管理体系，对外提供算力服务。系统引入物理集群数字孪生，实现故障定位、资源状态、运维流程的可视化管理；智能调度引擎可管理万级节点、服务十万级用户，支持每秒万级作业调度，长期可用性达到99.99%。
这种“数字孪生+智能调度”的组合，使得万卡集群不再只是“硬件资产”，而是真正融入国家超算互联网体系的算力中枢。

三、连接30+算力中心、服务超100万用户，打造国家级“算力样板间”
如果说万卡超集群解决的是“算力从哪来”，那么国家超算互联网解决的，则是“算力如何被用起来”。
由官方数据可知，截至2025年底，国家超算互联网平台已连接全国30余家超算与智算中心，服务100多万用户，应用商品超7200多个，单日处理作业峰值103万个，迄今已累计支撑运行1.96亿次作业，致力于有效联动中国乃至全球算力资源与应用需求。
在这一体系中，本次新上线的核心节点角色尤为特殊。
一方面，它以三套万卡超集群构成全国最大的国产AI算力资源池，为高强度AI任务提供稳定算力供给；另一方面，它也承担着“算力样板间”的示范功能——验证国产万卡集群在真实业务负载下的可用性、稳定性与经济性。
从应用层看，该算力池已全面覆盖万亿参数模型训练、高通量推理、AI for Science等关键场景。在科研领域，支撑材料科学、生命科学等方向的大模型计算；在产业侧，面向模型企业、互联网公司和行业用户，提供统一入口的普惠算力服务。
更重要的是，其背后采用的，是中科曙光提出并协同20多家AI产业链企业大力推动的“AI计算开放架构”理念。
开放架构强调打破单一生态绑定，支持多品牌AI加速卡混合部署，全面兼容CUDA等主流软件生态，并已完成400余个主流大模型、世界模型的适配优化。对开发者而言，这意味着迁移成本更低、选择空间更大；对整个产业而言，则有助于推动国产算力的一体化协同。
这也使国产万卡集群的发展路径，从“单点技术突围”，逐步走向“产业生态共建”。
结语：AI基建竞争，正在从“拼建设”走向“拼运营”
随着核心节点上线，我国AI基础设施建设正在进入一个比拼运营的新阶段。
算力竞争不只是“有没有万卡”，更是谁能规模化部署、稳定运营、并真正支撑应用落地。在全球AI算力军备竞赛持续升温的背景下，国产算力正通过日益成型的国家超算互联网完成一体化调度，最终实现工程可落地、运行可持续、生态可协同。
“中国最大”只是起点，“以国产算力服务好全球用户”才是更远的星辰大海。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

杨植麟拒绝苹果回国创业，美国为何留不住中国AI人才？

不只是芯片交易与投资承诺：AMD将在内部应用Anthropic Claude

4小时、118个回答，梁文锋内部交流回应一切

优步裁减10%的客服岗位，理由是“拥抱”人工智能

美国AI再现“梯云纵”武功绝学：AMD投资Anthropic 50亿美元换显卡出售

三星Galaxy Z Flip8发布：首款骁龙8E5小折叠 8999元起

全站最新

杨植麟拒绝苹果回国创业，美国为何留不住中国AI人才？

不只是芯片交易与投资承诺：AMD将在内部应用Anthropic Claude

4小时、118个回答，梁文锋内部交流回应一切

优步裁减10%的客服岗位，理由是“拥抱”人工智能

热门推荐

杨植麟拒绝苹果回国创业，美国为何留不住中国AI人才？

不只是芯片交易与投资承诺：AMD将在内部应用Anthropic Claude

4小时、118个回答，梁文锋内部交流回应一切

OpenAI 拟投资 200 亿美元在美新建超大规模数据中心

小红书开源 BigMac：把多模态训练的显存与速度，从二选一中解放出来

优步裁减10%的客服岗位，理由是“拥抱”人工智能

冯骥评《梁文锋四小时投资人会议实录》：荡气回肠，这就是中国故事

涉“财务造假”罚单刚落又遭上交所问询，ST葫芦娃回复看似合理尚存疑点

中汽协：6月中国品牌乘用车共销售181.2万辆，同比增长6.2%

长安汽车：向特定对象发行A股股票申请获深交所审核通过

荣耀亲选5G随身WiFi登场！搭载华为海思芯片，低功耗畅享高速网络

谷歌上线全新数据迁移功能：从苹果iPhone换到安卓更方便

美国AI再现“梯云纵”武功绝学：AMD投资Anthropic 50亿美元换显卡出售

三星Galaxy Z Flip8发布：首款骁龙8E5小折叠 8999元起

蜘蛛侠惊喜现身三星Unpacked 2026发布会