![]()
编者按:以定力致远,以重构图新。大象新闻、大象财富联合腾讯新闻、腾讯科技推出2025年终策划《定力与重构》,回望2025、展望2026,让洞察照见本质,向变革寻求确定。
“全球人工智能投资规模2025年或将接近2000亿美元。”高盛8月份的一份报告中写道。
虽然争夺算力是追逐超级智能的明牌项,但中、美这两个最大的玩家,却站在分岔路口:中国这边不断地在性能上追分,美国那边虽没有被算力困住,却被能源所“卡脖子”。
时针拨回到2023、2024年,抢算力成为“全球共识”——无论硅谷巨头、主权基金,无不寄希望从英伟达的手里,抢到更多的H100产能。
但是站在2025年年末回看,尽管抢算力的趋势没有根本改变,但各大云厂下单为了计算总拥有成本,已经把计算器按冒烟。
在英伟达的身后,谷歌十年磨一剑,在Gemini 3的训练上让自研芯片TPU脱颖而出,为专用集成电路(ASIC)赢得极其重要的话语权。
在谷歌身后,亚马逊、Meta、微软一众老巨头,以及OpenAI、xAI这样的新贵,无一例外的下场自研。
资本市场随即给出结论:英伟达市值上限5万亿美金。
2025年下半年之前,泡沫并不是主旋律,但随着山姆·奥特曼拿出1.4万亿美元的庞大基础设施建设计划,尤其是背后的循环交易、举债融资,引发外界对泡沫的担忧。
泡沫理应关注,但在先进算力禁运的背景下,泡沫显然不是中国算力、大模型的重点。
相比硅谷,中国AI产业走的非常曲折、艰难,但成果也颇丰——我们有世界顶级的开源模型,有成熟的应用生态,更有数倍于硅谷明显公司们的Tokens使用量。
在有限的空间里,过去中国大模型一直使用英伟达供应的“阉割版”次等芯片,但今年开始,这个趋势将慢慢得到改变——机构伯恩斯坦的数据显示,中国本土AI芯片品牌渗透率已从2024年的约29%,快速提升至接近60%。
同期,中国英伟达们纷纷冲刺上市,背后是中美科技竞争加剧和国产替代需求的爆发。
在这个大环境下,越来越多的中国芯片企业试图通过“超节点”的形式,以绕开单芯片性不足的问题,这反映出中国人工智能产业的智慧和韧性。
01 硅谷巨头:从CapEx到CapEx+TCO
回望2023与2024年,全球AI算力市场的主旋律是恐慌与抢购,在那两年里,无论是硅谷巨头还是主权基金,唯一的KPI就是抢到尽可能多的H100。
根据UBS的数据,2025年全球AI芯片市场规模虽然预计将突破2000亿美元,但增长的内驱力已发生质变。
现在的云厂商在下单前,不再只盯着性能参数,而是开始拿着计算器审视TCO(总拥有成本)。
![]()
今年美国主要云服务提供商如亚马逊AWS、微软Azure和谷歌云,正以前所未有的激进姿态加大资本开支(CapEx)。
高盛预测,2025年五大巨头的资本支出将达到3800亿美元,用于AI基础设施扩张和数据中心建设,以应对爆炸式增长的计算需求。到2027年,总规模将超过5400亿美元。
云长的投资反映了激烈的竞争,但和以往不同,所有人都不得不考虑效率问题,不得不精打细算考虑经济账。
在这个过程中,还有一个值得关注的信号:2025年的算力市场不再是单纯的“卖卡”生意,数据中心的基建进入了机架级时代。
如今,交付到云厂商的是集成了计算、高速互联、甚至液冷系统的完整机柜。与此同时,由于单机架功耗普遍突破100kW,电力供应已成为限制2025年算力总量释放的物理天花板,而非芯片产能本身。
今年AI产业的另一一个显著的标志就是推理的需求越来越多。算力中心的工作负载正从“暴力堆算力跑训练”转向“大规模、高并发的推理调度”。
![]()
大摩预测,2026年推理算力需求将超过训练需求。
这意味着,市场对芯片的要求不再仅仅是单卡极致的算力峰值,而是单位成本下的Token输出效率。
这种需求偏移,也变相给了非英伟达阵营更多生存空间,因为在推理侧,性价比往往比绝对生态优势更具杀伤力。
当然,推理需求的暴涨也给广大的“赛博玩家”一记暴击——存储价格暴涨。
02 英伟达是“一超”,谷歌领衔“多强”
2025年,数据中心AI芯片市场呈现典型的“一超多强”格局。
凭借Blackwell架构的领先性能、NVLink互联生态和大规模部署,英伟达占据主导地位,市场份额约占80%以上,凭借年度旗舰GB200&GB300系列,继续以“一超”的姿态,主导训练和推理领域。
AMD、谷歌、亚马逊、微软和Meta作为“多强”,通过自研ASIC加速器,积极优化内部云基础设施、降低成本并逐步向外部开放,挑战英伟达的垄断。
这些公司主要从自身大规模AI需求出发,开发专用芯片,强调能效、规模化和特定工作负载优化。
![]()
AMD通过Instinct MI系列在数据中心市场快速崛起,已吸引Meta、微软和Oracle等客户。
2025年MI350系列已大规模可用,在某些MoE模型上性价比突出。MI400系列计划2026年推出,支持更大规模机架级集成。
亚马逊AWS的自研Trainium系列针对数据中心训练和推理,Trainium3 采用3nm工艺,支持144芯片集成,峰值超362 PFLOPS,专门针对Agent代理、推理和视频生成等下一代应用优化,支持PyTorch/JAX无缝迁移,可扩展至百万芯片超大规模集群。
亚马逊策略是垂直整合Bedrock平台,吸引Anthropic等客户,显著降低token成本,在AWS生态内提供高性价比替代。
Meta的MTIA系列专注内部数据中心推荐和排名模型,核心策略是基础设施自主化,减少成本,主要内部使用(如Facebook/Instagram推荐),尚未外部开放,但正扩展至生成AI训练。
2025年下一代MTIA(基于5nm)已测试并部署,提供3.5倍密集计算和7倍稀疏计算提升,内存带宽翻倍,效率较GPU高2倍。MTIA与下一代GPU协同,支持Llama系列推理。
和其他巨头一样,微软过去两年也在推动自研Maia系列,但一直“掉链子”。
Maia系列的首款产品Maia 100在2023年底发布,被视为微软进军自研芯片的标志性动作,不过参数远不及同行同期的产品。Maia 200更是一波三折:原计划2024年完成流片,但设计过程中出现多个技术问题,导致流片延迟至2024年底,2025年才启动量产。
根据SemiAnalysis的信息,Maia 200的性能未达预期,被内部评估为失败项目,即便量产也难以支撑核心AI工作负载。而计划在2027年部署的Maia 300,虽然瞄准 2nm工艺,目标是接近内部性能预期。
在“多强”的阵容当中,不得不提的是谷歌十年磨一剑的TPU。
谷歌的TPU系列专注云端数据中心,最新的第七代Ironwood支持高达9216芯片的节点规模,提供超过4倍于前代Trillium的单芯片性能。
都在说ASIC在慢慢赶超GPU,但对英伟达来说,真正意义上的变数还要数谷歌TPU。
长期以来,TPU作为谷歌内部AI工作负载的核心支撑,主要服务于搜索推荐、广告等业务,即便 2018 年通过谷歌云对外开放,也未推进全面商业化。
近几个月,这一局面发生根本性转变:谷歌调动全技术栈资源,通过 “云端服务+硬件直售” 双路径开放TPU能力,正式以硬件供应商身份入局AI算力市场。
这一战略转型已取得显著成效:Anthropic、Meta、OpenAI、xAI等头部机构陆续加入TPU采购队列,其中Anthropic与谷歌的合作堪称标杆——不仅部署规模超 1GW 的TPU计算集群,更签订100万个TPU的合作协议,分两阶段落地40万个直供TPUv7 Ironwood和60万个GCP租用 TPUv7,对应订单金额超520亿美元。
订单背后,关键支撑在于:Gemini 3、Opus 4.5这些业界领先模型,均基于该芯片训练,所谓“好不好看疗效”。
不过,TPU的过去10年研发路,也不是一帆风顺,TPUv4、v5的计算吞吐量曾显著落后于同期英伟达旗舰产品,直到TPUv6通过将脉动阵列规模从128×128 提升至 256×256,实现算力翻倍且能耗降低。TPUv7则沿用3D环面(3D Torus)架构,在实际场景中展现出更优的 TCO 表现。
现在,很多网友们都在讨论TPU进入国内的可能性,有两个关键问题:其一是性能超规,这很好理解;其二是生态问题。
生态问题上,即便在北美,大家都是租用谷歌云上的TPU算力,如果云厂自己买回去建TPU集群,会增加非常多的调试时间,而且还要学会使用TPU的软件生态,在没有谷歌的支持下,难度可想而知。
03 “中国英伟达”上市潮、超节点与华为昇腾
2025年,对于中国的AI芯片来说,是不平凡的一年。
寒武纪在今年走出了一波大行情,市值最高一度突破6000亿,成为A股AI芯片龙头标杆。摩尔线程和沐曦也成功在科创板上市。
其他几个耳熟能详的国产AI厂商,比如壁仞科技、天数智芯、遂原科技、昆仑芯也基本都在上市的路上。
这一轮国产AI芯片上市潮背后,是中美科技竞争加剧和国产替代需求的爆发——美国对高端GPU的出口管制,推动国内巨头和初创企业加速自主研发,同时资本市场对AI算力的追捧,让这些高研发投入的公司迎来融资窗口期。
尽管多数企业仍处于亏损阶段,但高估值反映了投资者对未来国产芯片在智算中心、大模型训练等领域的期待,这一潮涌不仅带来了资金活水,也标志着中国AI芯片产业从“跟跑”向“并跑”迈进的关键转折。
之所以说是关键转折,原因在于,2023年英伟达凭借其CUDA生态和领先的GPU性能,几乎垄断了全球和中国AI算力市场,市场份额一度高达80%以上,尤其在数据中心和训练大模型领域,英伟达的H100和A100系列芯片成为不可或缺的核心,国产厂商难以撼动其地位。
受美国出口管制的持续影响,特别是对先进AI芯片的禁售,英伟达在中国市场的份额急剧下滑,这为国产GPU提供了绝佳的渗透机会。
根据伯恩斯坦的数据,本土AI芯片品牌渗透率已从2024年的约29%快速提升至2025年的59%以上,特别是在智算中心和云服务领域,国产芯片的采用率显著上升。
![]()
转变得益于“国产替代”的强势推动和产业链的加速成熟。
具体来说,华为的Ascend系列性能已接近英伟达H200的80%,并在多家数据中心大规模部署;其他厂商如阿里的PPU、昆仑芯、寒武纪、壁仞、天数智芯和燧原,也通过异构计算和生态兼容性提升,逐步蚕食市场空白。
整体而言,中国AI芯片市场正从英伟达“一超独大”的垄断格局,向“百花齐放”的多强竞争演变。
预计到2026年,国产GPU在国内渗透率将进一步突破,这不仅降低了供应链风险,还推动了AI算力的自主可控和成本优化。
单芯片性能在不断追赶,整个算力产业都涌向“超节点”,以规避单芯片性能还不足的问题,更提现了中国人的智慧。
超节点是将大量AI加速卡通过高速互联整合成逻辑上统一的“巨型计算机”,有效解决传统集群通信延迟高、扩展性差等问题,支持万亿参数模型高效训练和推理。
目前,中国已推出多款商用超节点产品,单节点规模从128卡到640卡不等,技术路线涵盖电互连、光互连和开放架构。
互联技术是国产超节点的核心突破,传统以太网和PCIe难以满足万卡级通信需求,头部厂商自研高速协议成为标配:华为“灵衢”协议单芯片互联带宽达2TB/s、卡间延迟仅2.1微秒;海光/曙光HSL协议支持112G高速互联,并通过专用交换芯片实现节点内全带宽点对点互联,避免出节点转发,这种低延迟、高带宽设计极大降低了分布式训练中的通信开销。
目前,已有多个超节点项目落地,但大规模商用预计2026年真正爆发,所以我们也常说,2026年将迎来“超节点战争”。
尽管超节点可以部分补齐单芯片算力不足的问题,但挑战仍然存在,包括软件生态优化、先进制程与HBM产能瓶颈。关于国产算力,不得不提的是华为。根据IDC的数据,明年昇腾的出货量将占比中国AI芯片总出货量的一半。
9月份的全连接大会上,华为直接亮出了昇腾系列路线图。
根据规划,2026年至2028年,华为将分阶段推出四款新芯片:2026年第一季度发布昇腾950 PR(专注推理Prefill和推荐场景);2026年第四季度推出昇腾950 DT;2027年第四季度推出昇腾960;2028年第四季度推出昇腾970。
![]()
昇腾AI芯片路线图
这一路线图延续了昇腾从910系列(2018年起)到910C(2025年推出)的迭代路径,结合Atlas超节点技术,支持大规模集群部署。
关于昇腾的950 PR,最近大家在网上都能看到一些性能参数,对华为来说,其目前的核心并不是在训练上要去掉英伟达,而且让自己的芯片被更多的用户使用起来。有可能会被忽视的关键数据:在950 PR中,增加了SIMT/FP8/F4,这些都对推理有明显的改善。
04 有泡沫,那就挤掉
当奥特曼的1.4万亿美元投资重塑AI产业格局,当英伟达市值一路飙升至5万亿美元,当AI概念股成为资本市场的香饽饽,关于AI是否处于泡沫的争论变得异常激烈。
有人将当前的资本狂热比作 2000年互联网泡沫的重现,也有人坚信这是技术革命的必然序曲,这些都是基于不同视角、立场得出的洞察,都有存在的合理性。
乐观派坚定看好AI的长期价值,认为当前的高投入与高估值并非炒作,强调AI将创造20万亿美元的经济价值,仅生成式AI就有望提升劳动生产率15%,这种技术赋能的潜力足以支撑资本的热情。
从数据来看,以英伟达为代表的龙头企业并非空谈概念,其凭借GPU技术占据AI价值链35-40% 的资本支出份额,2025年营收预计超2000亿美元,扎实的盈利能力成为估值的重要支撑。
谨慎派则认为市场存在潜在的风险,企业对债务融资的依赖度不断上升, 五大AI超大规模企业现金资产占比已从2021年底的29%降至2025年二季度的15%,债券与私人信贷成为主要融资渠道。
更值得关注的是,AI产业呈现明显的结构性失衡:上游算力硬件景气度高涨,但中游多数初创模型企业缺乏商业化能力,下游80%部署AI的企业尚未实现净利润提升。
换句话说,源源不断地投钱,却没有在商业收入上高效转化。
判断AI是否处于泡沫,不能仅凭市场热度,而需从估值水平、盈利支撑、产业逻辑三个核心维度理性分析。
从估值来看,当前美国科技巨头的估值并未达到历史泡沫峰值。
被称为“美股七姐妹” 的核心科技股当前市盈率约31倍,远低于2000年互联网泡沫时期的极端水平。
更重要的是,这些企业大多具备强劲的现金流和造血能力,与当年缺乏盈利支撑的互联网初创企业有本质区别。
从产业逻辑来看,美国AI硬件投资自2023年已增长2000-3000亿美元,数据中心、算力基础设施的建设虽然存在局部过热迹象,但背后是真实的产业需求支撑。谷歌TPU芯片对外供货引发的“鲇鱼效应”,更证明AI产业正从垄断走向多元共生。
关于部分企业“闭环买卖”的模式——英伟达投资xAI后xAI随即采购其芯片,微软投资OpenAI后获得巨额云服务订单——可能导致估值虚高,进而带来局部泡沫,尤其是美国前十大科技股占全球股市近25%的极高集中度,也让市场波动的传导风险不容忽视。
但市场不是从来就是二八分化,优势资源集中在20%的机构手里?
从我们的视角来看,所谓AI泡沫:只是短期利益与长期价值、资本狂欢与技术本质的博弈。
即便是真有泡沫,挤掉就是。
文丨傅里叶的猫 海军
编辑丨苏扬 史蓓蓓
主编|成书丽
监制|付天喜





京公网安备 11011402013531号