当前位置: 首页 » 资讯 » 科技头条 » 正文

字节跳动加量采购国产芯片

IP属地 中国·北京 第一财经资讯 时间:2026-06-17 22:11:30

2026.06.17


本文字数:3033,阅读时长大约5分钟

作者 |第一财经 吕倩 陈杨园

字节跳动数据中心建设进展再添新消息,行业人士称字节跳动正与天数智芯讨论采购至少5万颗AI芯片,主要用于推理工作。

据记者多方了解,本次洽谈供货芯片主要用于大模型推理负载,对应天数智芯智铠系列云端推理GPU,训练场景使用天垓系列。若交易达成,天数智芯将成为华为和寒武纪之后,字节跳动的第三家GPU供应商。

截至发稿,字节跳动与天数智芯方面暂未发表回应。

以字节跳动为代表的互联网大厂加码自建数据中心,并非短期应急补充算力缺口,而是折射产业深层变革:AI算力需求迎来结构性切换、企业算力自主可控战略持续升级,训推硬件分线布局与国产算力规模化替代同步进入落地周期。

投入独立数据中心建设

近年来,字节跳动在算力投入方面的动态持续更新。

字节跳动明确训练、推理两套芯片供应链完全拆分:大规模模型训练采用华为昇腾、寒武纪高端训练卡;线上C端豆包、企业MaaS海量并发推理引入天数智芯智铠系列等专用推理GPU。

若本次洽谈落地,天数智芯将正式入局字节算力版图。其中,华为昇腾聚焦集群训练、超大规模模型预训练底座;寒武纪兼顾部分中高端推理、垂直行业私有化部署;天数智芯智铠侧重线上流量型海量推理主力供给。

除了字节跳动,互联网大厂均在密集布局数据中心,包括百度在全国布局万卡级AI算力集群规模;阿里巴巴2026财年单季度资本开支超380亿元,预估未来三年超3800亿元加码云和智算硬件;腾讯在全国多地建设腾讯云HCC高性能AI集群,2026年下半年大规模导入国产算力,同步对外提供混元大模型MaaS、游戏AIGC、视频生成推理服务。

面壁智能AI Infra技术负责人李宇轩对第一财经记者分析称,互联网大厂密集构建多供应商算力体系主要基于供给确定性、议价权与成本结构,在大厂算力需求中,推理体量远大于训练,而推理对芯片的要求(互联、显存带宽、生态成熟度)比训练低一个台阶。国产芯片在推理侧已达可用水平,这让更多供应商成为能落地的工程选择,而非纸面战略。

同时,信创国产化是面向政企、央国企业务无法规避的硬性合规要求,多条技术路线并行布局,能让企业保留技术选择空间,不至于被单一厂商的硬件、生态迭代节奏束缚。沂景资本董事总经理谢思远认为,部分互联网厂商重要客户来自国企及关键行业,在算力体系建设过程中,通常会更加重视国产化能力与信创适配要求。从生态匹配角度来看,目前互联网大厂与国产芯片厂商之间仍然存在不少关键障碍需要解决,双方还处于持续磨合和博弈的过程中。

清微智能高级副总裁卢强对记者表示,互联网厂商推进算力供应链多元化,核心原因不是单一的国产替代,而是需求、供给和供应链安全等多维度叠加。大模型推理需求增长很快,海外高端芯片供给受出口管制影响不确定,企业必须建立多供应商体系。同时,国产芯片在推理场景的性价比、交付可控性和本地化服务能力提升后,已经从PoC验证进入规模化部署窗口。

竞争关键在于“谁的Token成本更低”

站在市场经济逻辑视角,国内大规模数据中心投建,本质是下游AI算力真实需求持续释放带来的市场驱动结果。

曦望Sunrise联席CEO王湛对记者表示,2026年国内大模型进入应用爆发期,DeepSeek V4等模型带来的Token市场爆发,Agent快速普及。行业竞争的关键变成了“谁的Token成本更低”。国产推理芯片在特定场景下的性价比和每瓦性能已有不错表现。

具体场景包括大厂的高并发推理集群,如搜索推荐、智能客服、短视频多模态生成等场景,以及智能体应用,每天产生数万亿次Token消耗,是目前国产推理芯片采购的最大金主;另一大场景是大模型头部企业与MoE架构的常态化训练与微调,随着MoE架构普及,行业对算力的调度与局部推理能力要求暴增。

据灼识咨询全球AI推理芯片行业报告,AI芯片行业正从以训练为核心向以推理为核心的范式发生根本性转变,AI推理芯片的需求正急剧增长,预计到2030年,全球AI推理芯片行业规模将达到30696亿元人民币,其中中国AI推理芯片行业规模将达到11664亿元人民币。

优刻得新兴事业部副总经理刘华判断,接下来办公场景、业务AI化等需求仍会不断增长,推动算力需求旺盛,且AI行业3-5年内仍将处于高速发展期。

多重因素刺激下的推理需求激增,造成暂时的供需失衡。王湛提到,市场出现“一卡难求”,行业头部企业疯狂“抢”GPU卡、买内存、租数据中心、扩建推理算力等,导致整个供应链承压。今年一季度,算力租赁成本上涨近30%至40%,预计全年AI推理的算力需求达到训练的4-5倍。

卢强判断,短缺客观存在,尤其集中在高端AI加速卡、HBM、先进封装、整机服务器等环节。目前行业交付周期拉长、热门型号排产紧张、整机报价随供需和内存价格波动上行。

谢思远预估,下半年随着行业竞争加剧,同质化现象将越来越明显,聚焦Token领域的价格战将出现,整体价格反而可能呈下降趋势。

国产算力生态追赶中

据香港理工大学研究能耗推算,在超大规模云端设置中由于“十亿级别”的用户高频请求,推理能耗已占AI总能耗约60%—90%。另外,中国工程院指出,2026年一季度中国推理需求已达到训练需求的8倍。

交银国际研报分析认为,这一结构性变化意味着,对于数据中心运营商而言,支撑大规模推理任务的高密度、低延迟算力需求将成为增长主力。随着国产GPU扩产在即,叠加超大型云厂商订单滚动释放,预计2026年下半年项目落地节奏将较上半年进一步加快。

预计今年二季度新模型开发与存量模型迭代仍将支撑需求韧性。同时,企业端和客户端推理逻辑需求不断提升,正成为行业中长期驱动力。可作为即时供应补充的数据中心运营商有望凭借资源和客户粘性提升份额。

刘华认为,尽管存在短期压力,但中长期看,英伟达供应压力会促进国产算力的成长。“目前国产卡由于产能和适配问题供货一时上不来,但会逐渐放量,这是一个此消彼长的过程”,他表示。

受地缘出口管制约束,国内产业虽短期内仍需采购英伟达高端算力作为补充,但具备替代能力的国产算力生态已进入规模化建设落地阶段。

包括字节跳动在内的国内互联网厂商,短期靠采购解决需求,中期靠国产多供应商降低风险和成本,长期靠自研将利润留在自己手里。类似谷歌TPU逻辑,自研芯片核心目的不是卖给他人,而是尽可能摆脱被动境地。

大厂内部业务多元、场景丰富,因此训练、精调、高并发推理、图像处理对算力的要求不同。多供应商体系允许他们用A芯片做大规模训练,用B芯片做长文本推理,用C芯片做轻量级边缘计算,有利于实现TCO最优化。

谢思远对记者表示,互联网大厂构建多供应商算力体系的核心考量是性价比。大厂们本质希望以尽可能低的成本获得更多可用算力资源。对于互联网大厂而言,无论采用哪家供应商的产品,最终都要回到成本、性能和稳定性的综合比较上。在供给受限的背景下,降低对单一厂商的依赖风险是必要的,但这更多是一种风险管理需求。真正决定采购规模和采购比例的,仍是实际部署后的经济性表现。

相较而言,传统智算中心承担了产业培育和基础设施建设的功能角色,相比实际使用率,带动国产芯片企业营收增长和产业发展更加重要,互联网云厂商建设算力网络本质上属于市场化行为。

在此趋势下,行业处于从“可用验证”走向“规模使用”的阶段性节点。过去客户更多看单卡指标,现在看千卡、万卡集群稳定性与单位成本。大订单会明显改善厂商收入、现金流和供应链议价能力,但行业格局不会只靠一两个订单决定,最终仍由产品迭代、生态、交付和客户复购决定。从算力市场角度来看,互联网厂商大规模布局数据中心仍将是一个关键节点。

微信编辑| 雨林

:bianjibu@yicai.com

:business@yicai.com

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。