![]()
硅谷的科技巨头们,正在为一份极不寻常的账单买单。
每一次新品发布会,PPT上反复强调:晶体管数量又翻了多少倍、算力飙升了多少。所有人都在为这颗“大脑”的聪明程度欢呼。
但仔细翻开这笔算力账单,你会发现一个值得警惕的错位:全行业的总开销翻了一倍多,但给“大脑”的预算占比却几乎没有增长。
根据知名研究机构Epoch AI的最新拆解数据,从2024年初到2025年底,全球AI芯片的总组件支出从220亿美元激增至520亿美元。然而,代表着最顶尖制造工艺的“计算大脑”(主逻辑裸片),其成本占比却始终停留在13%至14%。
![]()
这也就意味着,真正掏空科技巨头口袋的,是负责“记忆”的仓库——内存。
数据显示,高带宽内存(HBM)在AI芯片组件中的成本占比,已经从52%一路攀升至63%。在这300亿美元的总支出增量里,单单是HBM这一项,就贡献了约200亿美元。
![]()
这个数据为什么值得关注?
因为大众只看到了云端AI芯片的算力狂欢,却不知道这场看似高大上的算力竞赛,已经变成了一场深刻的产业重构。它不仅在重塑全球半导体资金的流向,甚至直接导致了我们身边的廉价智能手机,正在大规模萎缩。
大脑越来越便宜,“记忆”为何成了刺客?
大众往往以为,眼下的AI争夺战依然停留在算法、架构等“脑力”层面的比拼。但实际上,真正的战争早已悄然演变成了一场客观的、物理的、生产线上的肉搏战。
要搞懂这个错位,我们得先降维通俗地弄明白:AI芯片到底是个什么构造?它和以前的电脑芯片有啥区别?
在传统的通用芯片(CPU)时代,所有的架构设计都在追求“单兵作战能力”。你可以把CPU想象成一位绝顶聪明的顶级学者。为了不让他浪费时间去远处的图书馆(主内存)找资料,工程师在学者的手边塞满了各种私人书架(缓存),甚至允许他“乱序执行”,随时找活干,绝对不让他闲着。
但AI大模型根本不需要这种复杂的逻辑判断,它要的是简单粗暴的暴力算术矩阵。
于是,GPU和TPU等AI加速芯片上场了。它们不再是单打独斗的学者,而是数万名同时做加减乘除的流水线工人。这些芯片同样是从硅晶圆(Wafer)上光刻下来的,但内部结构全是大规模并行的计算核心。
瓶颈随之出现:这群工人算得实在太快了!
打个比方,现在的各大AI芯片就像是一个班级里的尖子生,大家的计算能力都已经极其强大。数据表明,过去20年里,硬件的峰值计算能力飙升了60,000倍,但内存容量仅仅提升了100倍,互连带宽更是只提升了30倍。既然大家的做题速度(计算逻辑)都差不多且难以拉开巨大差距,比拼的重点自然就变成了最现实的物理条件:谁能搞到最高规格的高带宽内存(HBM),以及谁能在纳米级的物理流水线上把这些数据最快地“喂”给大脑。
由于计算性能的提升速度,远远超过了内存带宽的改善速度,搬运原材料(数据)的通道彻底瘫痪了。这就是困扰了计算机界几十年的物理学幽灵——“内存墙”(Memory Wall)。
通道不够宽怎么办?行业祭出了一种技术难度极高、成本也极高的解法:高带宽内存(HBM)。
既然平铺的通道不够宽,那就把DRAM存储芯片像盖摩天大楼一样垂直堆叠起来,并在微观层面上打穿无数孔洞与计算核心直接相连,实现超宽的数据通道。
但这玩意儿,大量消耗底层晶圆产能。生产1GB的HBM,需要吃掉相当于普通DRAM三倍以上的晶圆产能。
利润分化与产业链重塑
当底层晶圆变成了零和博弈,整个产业链的资金流向就彻底变了。
原因很简单:普通商品内存(就是你买电脑和手机里的内存)的毛利率常年在20%至30%区间,而HBM的毛利率则达到70%以上。
面对这种级别的利润差异,存储三巨头(美光、SK海力士、三星)的动作果断而激进。
老牌存储大厂美光(Micron)在2025年12月发布了一份引发广泛关注的决定,宣告其运营了29年的消费级品牌Crucial(英睿达)即将终结。随后在2026年2月,美光正式停止了消费端的所有发货,将所有空出来的产能全面转向利润更高、更具定价权的AI和企业级数据中心市场。
![]()
韩国双雄更是大幅受益。2026年第一季度,靠着全数售罄的HBM订单,SK海力士实现了72%的营业利润率。三星电子的半导体部门同样以70%以上的利润率,贡献了全公司94%的利润。
现实代价:消失的廉价手机
巨头在云端数钱,终端手机厂商却面临直接冲击。
晶圆都被抽走去造AI用的HBM了,普通手机用的标准内存自然面临断崖式的缺货。短短一年间,老一代的LPDDR4价格大幅上涨了250%,LPDDR5也上涨了220%。
![]()
在这波涨价潮中,手机的物料成本里,内存占比从原本的15%左右,一路飙升到了最高50%。
结果就是,低端智能机在商业上已难以为继。分析师指出,低于100美元的智能手机已经“永久性不再经济”。原本卖50美元的手机,现在因为内存太贵,被迫涨到120美元以上。
占据非洲近半壁江山的手机品牌传音,2025年净利润暴跌54%,被迫砍掉40%的出货目标。Oppo和Vivo也分别削减了超20%和近15%的预期。在印度,100美元以下的手机市场在2026年一季度同比萎缩了59%。
硅谷扇动了一下名为AI的翅膀,使得亚非拉低价位市场用户的数字接入门槛大幅抬高。
下半场:封装瓶颈与AI创投的“破局”之路
内存吃掉了AI芯片63%的成本,但这还不是唯一的门槛。
再贵的HBM和逻辑计算芯片,也必须通过台积电的CoWoS等先进封装工艺,极其精密地缝合在微缩底板上。这道工序目前是真正的物理卡脖子环节。台积电CEO魏哲家直言,CoWoS产能极度吃紧,到2026年都已完全售罄。英伟达甚至提前包揽了超过60%的产能。
那么,未来的商机和趋势究竟在哪?
随着行业从早期的“模型训练”走向大规模的“AI代理(Agentic AI)”推理,模型需要保持长时间的记忆和极长的上下文,这让“内存墙”的压力成倍放大。为了破局,行业分化出了两条路:
第一条路,是英伟达的“暴力加码”。
2026年投产的新一代Rubin架构,就是为极致吞吐量而设计的。单颗Rubin GPU不仅塞进了3360亿个晶体管(是上一代的1.6倍),更首发搭载了容量高达288GB的HBM4内存,带宽达到惊人的22 TB/s。而美光的HBM4目前正以两倍于上一代的速度快速爬坡,专供Rubin。英伟达的目标是用极高的内存带宽,把推理成本打下来。
第二条路,是初创公司的“从架构底层破局”。
既然逻辑计算本身只占13%的成本,那只要能尽量绕开昂贵的HBM,就能重塑整个算力市场的利益分配。2026年,初创公司MatX拿到了5亿美元B轮巨额融资。他们设计了一款基于“可拆分脉动阵列”的专用芯片,利用SRAM(静态随机存取存储器)的超低延迟特性来直接搞定长文本推理。欧洲初创公司Semidynamics也刚刚在台积电3nm工艺上流片,主攻减少数据移动的AI推理新架构。
而在终端租赁市场,算力正在逐渐褪去神秘且昂贵的光环。
华尔街已经推出了追踪GPU租赁价格的“硅数据指数”(Silicon Data Indices),像炒大豆、炒原油一样每天盯盘算力的现货价格。在2026年的现货平台上,曾经一卡难求的H100,其小时租赁底价已经被Thunder Compute等平台打到了惊人的1.38美元/小时。
算力大宗商品化的时代已加速到来。在这个剧烈的周期波动中,真正稀缺且昂贵的,不再是单纯的“大脑计算能力”,而是数据的流转、存储的吞吐,以及纳米级基板上的物理封装手艺。看懂这张被内存主导的错位账单,才是真正摸清巨头底牌的开始。(本文首发钛媒体APP,作者 | 硅谷Tech_news,编辑 | 林深)





京公网安备 11011402013531号