当前位置: 首页 » 资讯 » 科技头条 » 正文

AI进入万亿Token时代,国产芯片如何构建行业壁垒?

IP属地 中国·北京 钛媒体APP 时间:2026-05-20 16:23:15


当AI正式迈入万亿Token时代,算力需求迎来爆发式增长,国产GPU行业也从“单点突围”进入“全域竞争”的关键周期,AI算力从“稀缺资源”加速迈向“结构性过剩”,当国内市场“国产替代”的红利窗口期开始收窄,中国GPU行业的竞争逻辑正在发生根本性转变。单纯比拼单卡峰值算力、简单对标英伟达的技术路线,正走向同质化的价格泥潭。

云边端协同构建算力闭环

GPU行业的竞争,早已从单一芯片性能比拼,升级为全场景产品能力与生态适配能力的综合较量。摩尔线程的核心竞争力,在于其坚持“全功能GPU”的技术路线,打破了AI芯片、图形芯片、通用计算芯片的场景壁垒,构建起覆盖云端智算、端侧应用的完整产品矩阵,形成了“算力底座+场景应用”的双向赋能格局。

云端算力作为摩尔线程的核心布局领域,承担着大模型训练、大规模仿真、科学计算等高端算力需求,其产品组合以“夸娥(KUAE)智算集群”为核心,搭配MTT S5000旗舰智算卡与智算一体机,形成了从单卡到万卡级集群的完整解决方案。

在端侧领域,摩尔线程以自研“长江”智能SoC芯片为核心,构建起覆盖个人、家庭、行业的端侧AI产品矩阵,实现了“云端训练—端侧部署”的算力闭环。“长江”SoC芯片作为端侧算力基石,采用异构计算架构,集成8个主频高达2.65GHz的全大核CPU、全功能GPU及高能效NPU,提供50TOPS的异构AI算力,支持INT8/FP16/FP32等混合精度计算,可在端侧流畅运行百亿参数大模型,配合136GB/s的超高内存带宽与最高64GB的LPDDR5X高速统一内存,兼顾了高性能与低功耗,适配各类端侧设备的部署需求

基于“长江”SoC芯片,摩尔线程在本次产品发布会上推出了三大端侧核心产品:MTT AIBOOK AI算力本、MTT AICUBE家庭AI中枢与MTT E300边缘AI模组。

全功能GPU是核心竞争力

在AI芯片集体对标英伟达的拥挤赛道中,任何仅仅是“对标”的路径最终都将陷入价格战。真正的护城河,来自于竞争对手难以同时复制的多重能力组合。除了云端边的全场景布局之外,摩尔线程真正的护城河在于“全功能GPU”这条技术路径。所谓全功能GPU,是指在统一架构的单颗芯片上,同时具备AI计算、3D图形渲染、物理仿真和超高清视频编解码四大核心能力。这种“算、渲、仿”一体化的架构设计,在业内极少数企业(如英伟达)之外尚无人具备规模化量产能力。

这个选择的战略代价非常清晰:设计复杂度极高、兼容挑战巨大、研发战线极长。一款图形GPU的设计复杂度本已不亚于AI芯片,而将两者统一到同一架构并兼顾物理仿真与编解码,意味着在指令集、缓存层级、计算单元调度等多维度都要做架构层面的融合设计。从2025年MUSA软件栈已实现700多个API兼容、PyTorch算子层面100%兼容的进展来看,摩尔线程正在逼近这个“不可能三角”的平衡点。

为什么值得付出这样的代价?因为物理AI和具身智能的崛起正在改变算力需求的底层逻辑。正如发布会上摩尔线程CEO张建中所述,具身智能体的训练不仅需要AI算力来“思考”,更需要图形渲染来“看见”虚拟环境,还需要物理仿真来“触碰”物体的运动规律。将三者分立在不同芯片上完成,意味着数据的跨芯片搬运、异构编程和仿真到现实(Sim-to-Real)的巨大鸿沟——而统一架构让这三者在同一芯片上实现“零拷贝”,数据延迟和转换损耗被压缩到最低。

这种架构优势在夸娥万卡集群上得到了验证。基于MTT S5000构建的集群实现了Dense大模型训练MFU达40%、MoE大模型达60%、训练线性扩展效率达95%、有效训练时间占比超过90%。这些技术指标之所以重要,是因为它们共同回答了一个问题:国产GPU集群是否真正解决了大规模分布式训练中最令人头疼的两个问题:效率损耗和故障中断。

MFU(Model FLOPs Utilization)衡量的是硬件算力被模型训练实际利用的效率,95%的线性扩展率意味着在集群规模扩大时性能不会断崖式下降。这些背后离不开从芯片层面的高速互联设计到集群管理调度算法的全栈优化。

但必须指出,万卡集群能力的建立只是起点,不是终点。据行业数据,截至2025年底中国已建成42个万卡级智算集群,智能算力总规模超过1590EFLOPS。随着深圳、郑州等地超大规模集群的密集上线,未来两到三年内,国内智算市场将从“稀缺状态”快速转向“结构性过剩” ,市场对芯片的需求将从“能跑通模型”升级为“每Token的边际成本最低”。这迫使AI芯片厂商的竞争焦点从单卡性能转向系统级的TCO(总拥有成本)竞争,包括功耗效率、集群调度算法、容错恢复能力、软件栈开发效率等。对摩尔线程而言,最新发布的“花港”架构推进十万卡级集群的规划,是应对这一趋势的战略布局——十万卡规模下,哪怕是0.01%的故障率,每小时也意味着数十张卡的失效,而每张卡的宕机都意味着数十万元的算力浪费。

国产芯片绕不开的商业化

技术再好,脱离商业化也只能停留在实验室阶段。在技术的背后,困扰国产芯片的还有一个更高层级的问题:商业化之路怎么走?

而判断一家技术驱动型企业是否真正步入正轨,不能只看营收增速,更要看其研发投入与商业化变现之间的节奏是否能形成正向循环。

摩尔线程最新披露的财报则为理解其当前的战略位置提供了关键的数据切口。从营收规模来看,摩尔线程2025年实现营业收入15.05亿元,同比增长243.37%;毛利总额达到9.87亿元,整体毛利率水平达65.57%。2026年一季度实现营收7.38亿元,同比增长155.35%,归母净利润2935.92万元,是公司上市以来首次实现单季盈利。数据的背后隐含一个值得关注的结构性变化:2026年3月,摩尔线程签订了6.6亿元的夸娥智算集群大单。这意味着,公司已从“卖卡”向“交付系统级AI基础设施”完成关键跃迁——单一大单金额即占全年营收近四成,大客户集中度的提升既是商业能力的体现,也意味着大客户续约和复购将成为未来业绩的重要观察指标。

当然,首次单季盈利需要冷静看待。财报显示一季度有7006万元政府补助,而同期研发费用约3亿-4亿元,毛利率水平约65.6%,单季营收需达8亿-10亿元以上方能覆盖当期研发支出。

这些财务表象之上,真正塑造公司长期价值的是研发投入的“纵深”。2025年研发费用13.05亿元,占营收比重86.68%。截至2025年底,累计申请知识产权2014项,其中发明专利1743项。这也恰恰说明,摩尔线程选择了将绝大多数资源投入底层技术而非短期营销,这种“逆周期投入”将决定它能否在下一代算力竞争中占据主动。2025年,公司基于MTT S5000的夸娥万卡级智算集群实现了商业化部署,成为国内极少数真正具备万卡级大规模集群交付能力的GPU供应商。从五年五代架构五颗芯片的产品迭代节奏来看,这是一种典型的“用研发换时间、用架构换代换弯道”的打法。

从夸娥万卡集群的万卡工程能力,到MT Lambda仿真平台的三大引擎融合,再到“小麦”全域智能体的端侧闭环,以及AIBOOK、AICUBE、E300对“云-边-端”全场景的覆盖——这些产品线揭示了摩尔线程的系统级战略:不把自己定位为“卖卡的”,而是做“AI基础设施的系统级供应商”。

但客观来看,挑战同样严峻。英伟达已进入Rubin架构的新周期,而国内市场的“国产替代”红利窗口期也在收窄。当华为昇腾有望在2026年占据中国市场50%份额,当海光、寒武纪、燧原等企业纷纷在各自细分市场发力时,摩尔线程面临的竞争格局将比过去几年更加激烈。 研发费用率86.68%虽然在技术攻坚期可以理解,但一旦营收增长放缓,这一比例将直接冲击现金流。26.68亿元的存货+预付款意味着市场对产品需求的判断一旦发生偏差,公司将面临沉重的资产减值风险。

但张建中在2025年年度业绩说明会上对存货问题作出了解释,他表示,当前国内算力需求持续放量,叠加芯片行业普遍存在的交期波动、原材料价格浮动、核心产能紧缺等不确定性风险,稳定的供应链体系成为企业核心竞争力。通过储备充足库存、锁定上游产能,摩尔线程有效规避了行业供应链风险,筑牢交付护城河,同时能够快速响应下游批量订单,大幅缩短产品交付周期,稳固市场基本盘。

综合来看,摩尔线程真正的护城河不在于某款芯片或者某个集群,而在于能否把“统一架构”的技术路线坚持到临界点——让全功能GPU在物理AI时代成为不可或缺的算力基础设施。当训练芯片在中国市场不再稀缺、而是过剩时,决定胜负的可能不再是单卡峰值算力,而是谁能在同一个芯片上承载AI、仿真、渲染等更多维的计算任务,谁能以最低的Token成本交付最多的智能。这恰恰是“全功能GPU”这条看似更艰难的路,所能提供的长期壁垒。

(文|Leo张ToB杂谈,作者|张申宇,编辑丨杨林)

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

全站最新