![]()
大模型开始让中国云计算行业格局发生变化。
文丨贺乾明
火山引擎团队最近为一个 “坐标” 感到振奋。
11 月 17 日,国际市场调研机构 Gartner 发布 《AI 应用开发平台魔力象限》。这份报告中,火山引擎凭借豆包大模型和火山方舟大模型服务平台,在 “挑战者” 象限排名第一。在落地能力指标上,火山引擎仅次于 Google、AWS、微软、IBM 四家海外云计算公司。
![]()
据了解,Gartner 评估的 AI 应用开发平台,主要是云计算行业常说的 MaaS(模型即服务)平台。因为毛利高、潜力大,MaaS 是当前各大云计算公司看重的业务方向。
在权威市场调研报告中排名前列,在火山引擎 5 年的发展历程中并不多见。
2020 年 6 月正式上线以来,比中国云计算同行晚 10 年的火山引擎尝试各种方向,从数据驱动增长服务到云原生,增长始终缓慢。无论是在行业报告还是市场认知中,火山引擎经常被归于 “Others”。对于一个被字节寄予厚望的业务来说,无疑是一种煎熬。
直到大模型爆发改变了云计算行业的竞争规则,火山引擎迎来弯道超车的机会。“这几年 AI 快速普及,我觉得挺幸运的。” 火山引擎总裁谭待今年接受我们访谈时说。
大趋势对所有参与者都是公平的。过去三年,火山引擎在 AI 领域激进投入,展现出极强的战斗力。Gartner 之前,也有市场调研机构 IDC 发布数据,2025 年上半年中国公有云大模型服务市场,火山引擎以 49.2 % 的份额占比位居中国第一。
这背后,不仅有火山引擎 “必须赢” 的意愿和战略决心,也离不开字节体系饱和式的资源投入和能力支撑。
渴望增长的火山引擎,更激进地押注 AI
火山引擎从上线开始,就是字节高层寄予厚望。他们认为,做好火山引擎对字节成为一家优秀的科技公司、保持技术竞争力很重要,把其视为公司战略级业务。
2021 年,谭待给火山引擎写了一份商业计划书,定下千亿年收入的目标。在同一年,中国云计算市场的第一名阿里云,年收入也才刚到 600 亿。
如何实现这一目标,成为火山引擎团队的难题。在以 CPU 为算力底座的传统云计算市场,火山引擎的发展缓慢。他们无论提供字节的增长经验 “数据驱动增长”,还是押注云计算领域的新方向 “云原生” 服务,都没能带来太多收入增长。
云计算是一个先发者占优势的市场。有需求的客户早已与头部的云厂商绑定,数据迁移成本高,业务流程盘根错节,后来者很难撼动。即便是企业出于分散风险考虑采用 “多云策略”,火山引擎也要面对一长串竞争对手。
而且它还要面临中国云计算行业的共同难题:平台依赖的电力、带宽等基础设施成本并不受企业自身控制;大量传统企业出于数据安全、合规或历史惯性等原因,仍倾向于自建数据中心。
“那是一个存量的市场,增长就是慢。” 火山引擎的管理层判断,只有技术迭代时,他们才能有迅速增长的空间。他们评估了区块链、元宇宙、AI 等多个技术方向后,决定押注 AI。
AI 的基础设施依赖 GPU,而不是原有云计算平台曾大力投入、建立规模优势的 CPU 芯片。在这个增量市场上,所有的云公司基本在同一条起跑线上。
而且 AI 的爆发也会催生一批新的公司,“它们往往不是云计算领域的传统客户”。 在他们看来,这会是一个比肩互联网、移动互联网起步的机会,市场上原本的大型云平台,都是跟着新技术变革发展壮大。
那时云计算行业对 AI 技术发展潜力还没有形成共识。当时整个行业能够消耗大量资源的客户只有少数自研自动驾驶系统的公司,它们也想着自己组建数据中心,给云计算厂商提供的增长空间不大。在 2021 年前后,多数云计算公司都没有采购太多 GPU,甚至会退单。一直寻求增长空间的火山引擎坚持了下来。
直到 2022 年下半年,火山引擎发现一些大模型创业公司,如 MiniMax、智谱等,开始在火山引擎上训练大模型,随后 OpenAI 推出 ChatGPT,他们意识到增长机会可能就要来了。
火山引擎有相对独特的卡位。一位云计算从业者说,传统的云计算公司面对大模型技术多少都有包袱,他们的多数收入来自出售虚拟机、存储等资源,想要朝着新方向迅速发力比较困难。而火山引擎没有那么多负担,可以更激进地调整架构,让它更适应 AI 时代。
而且字节有中国最大的推荐引擎算法模型,在 2022 年就需要把数千张 GPU 做成单一集群训练模型。火山作为字节的云服务供应商,积累了训练大规模模型的经验。
2023 年 4 月,火山引擎举办发布会,宣布中国做大模型的公司七成在火山引擎上。两个月后,火山引擎团队把过去训练大模型的套件整合成服务平台 “火山方舟”,为企业客户提供大模型精调、推理、评测、部署等服务。
“很多公司选择火山,不是因为我们有卡,而是因为我们能够稳定地把模型训练出来。” 谭待说。
不过到年底,大模型行业的格局就发生了变化。海外开源模型成熟,中国企业从头自研大模型的热情开始退却,直接购买 GPU 算力的客户大幅减少。有限的客户也面临着更激烈的竞争,阿里投资了多家大模型创业公司,一部分投资额度被折算为阿里云算力资源。
与此同时,大模型调用成本下降,企业客户开发大模型应用的热情高涨。火山引擎内部达成共识:大模型的算力使用,将从训练大模型为主转移到使用大模型(推理)为主。
他们决定重点发力 MaaS 产品,Token 消耗量成为业务发展的核心指标。
我们了解到,火山引擎也调整了销售团队的业绩考核指标,把销售 MaaS 产品排在第一位。销售卖同等价格的 MaaS 产品得到的回报,要比卖传统云服务更高。明年,火山引擎也会延续这一策略。
字节饱和式投入 AI,火山引擎增长的助力
云计算本质上是体系的比拼,市场上排名靠前的云公司都有庞大的业务体系托举。
火山引擎成立并不是像 AWS 或者阿里云诞生时那样,集团要单独开一个新业务,而是字节的成熟技术外溢。字节高层也希望火山引擎对外提供技术服务获取收入的同时,也能反过来强化公司的技术能力。
这一定位决定,火山与字节其他业务的组织联系要比其他云平台更紧密。“字节做火山一个重要的原则就是技术内外同源。” 谭待说,火山的基础设施方面就和字节复用一个大团队,保证体系能够协调在一起。
因此字节决定 “饱和式投入”AI 时,整个体系的力量都能高效地传导至火山引擎。火山引擎有专门的团队参与到 Seed 部门的模型研发中,同时 Seed 部门训练出来的模型,也是火山引擎对外提供 MaaS 服务的基础。
在产品侧,字节的 Flow 部门开发了从软件到硬件、覆盖多个方向 AI 应用,它们都通过火山引擎的 MaaS 平台调用大模型。字节在抖音、飞书等产品中加入大模型功能时同样如此。
这让火山引擎在大模型发展的早期阶段就具备了规模效应。火山引擎近期公布,到今年 9 月,豆包大模型的日均使用量超 30 万亿 tokens,已经逼近国外科技巨头。
不论是训练大模型还是对外提供服务,都是规模生意。训练领先的大模型需要投入海量资金。字节跳动的体量和决心,使其能够招揽一批研究者,并积极采购可用算力,高强度地研发、迭代大模型。
大模型的应用也只有上了规模,才能够找到更多优化空间,成本才有可能被压低。2024 年 5 月,火山引擎宣布大幅降低豆包大模型的调用价格,核心语言模型的定价一度比同行低 99.3%,主要的目的就是扩大火山引擎上的大模型使用规模。
“规模大了,服务器多、负载高,天然就对技术有很高的要求,会强迫我们做好各种事情。” 谭待曾说,规模大了后,做优化收益也很大,“ 1 万台服务器利用率优化一个点,和 100 万台服务器优化一个点,收益差 100 倍。可以组建强大的团队做得更好。”
字节的饱和式投入 AI ,也让火山引擎在大模型领域有了垂直优化的空间。美国管理学家克莱顿·克里斯坦森(Clayton Christensen)在提出 “创新者窘境” 理论后,曾在《创新者的解答》中补充:当新技术还不能满足用户的主流需求时,那些 “垂直整合”“封闭架构”,能够掌控关键部件的公司,往往能在各个环节榨取性能,从而获得更大的竞争优势。
Gartner 的《AI 应用开发平台魔力象限》也在一定程度上印证了这个理论。在 ChatGPT 爆发之初,Google 是被 OpenAI 和微软组合冲击最大的一方。现在从 “落地能力” 和大模型能力来看,Google 排名全球第一。他们能够迅速反超,除了拥有丰富的技术储备和顶级研究人员,还在于 Google 能从芯片(TPU)、软件开发平台、大模型到全球产品的垂直整合能力。
火山引擎很难像 Google 那样,在国内做到从芯片到软件的垂直整合。不过它也凭借字节的 AI 体系尽可能建立了从模型、到平台再到产品的整合。
谭待说,火山引擎不仅在这个体系中优化技术,也获得了客户线索,“很多客户都会拿着跟豆包(应用)的聊天 Case 找过来,问火山引擎能不能在企业场景中实现类似的效果。”
据火山引擎披露,现在他们的大模型服务已经覆盖八成头部咖啡茶饮品牌、九成主流汽车品牌、八成头部券商、八成系统重要性银行、七成 985 高校、9 家全球出货排名前十的手机厂商等。
大模型服务市场规模还小,但让云计算行业发生变化
Gartner 的 AI 应用开发平台魔力象限报告只是一个阶段总结。如果只是看这个细分市场,规模与整个云计算领域相比仍有巨大差距。
根据市场调研机构 IDC 的报告,2025 年上半年中国 MaaS(模型即服务)市场规模只有 12.9 亿元人民币,但增速达到 421.2%。
“这个事太早期了。” 谭待此前说,他会告诉团队 “马拉松才跑 500 米,别取得一点点小成绩就满意了。”
火山引擎也在积极布局新的增长点:Agent(智能体)。今年举办的多场发布会上,火山引擎介绍的技术方案几乎全部围绕着 Agent。
在谭待看来,过去的云平台为网页和 app 设计,其上限是 “全世界所有人的时间总和”。而 Agent 能自动思考、规划并执行任务,它工作的总时长将远超 app 时代的天花板,“能创造更大的经济价值”。
火山引擎积极押注大模型,已经开始推动中国云计算行业的格局发生变化。我们了解到,火山引擎在大模型领域的增长也在带动其传统云计算服务。目前火山引擎一定比例的 CPU 算力、数据库等需求来自大模型客户。
在谭待的规划中,当年定下的千亿目标,大模型市场会占到一半多,剩下的都会来自存量市场。这意味着,火山引擎也在把 AI 当作撬动存量市场的杠杆。
据了解,火山引擎今年的收入目标是突破 200 亿元人民币,同比增长超过 100%。这个体量与行业头部云厂商年收入千亿元的规模还有差距,但它也是一个信号:火山引擎不只是 Gartner 细分领域报告中的挑战者,也正在成为中国云计算领域的挑战者。
不过头部的云计算公司同样在 MaaS 方向上发力,它们正在利用过去积累的存量客户、企业端的销售经验等,把 AI 能力集成到客户已有的云服务中。火山引擎的发展,也会是一场艰难的攻坚战。
题图Top Gun: Maverick





京公网安备 11011402013531号