当前位置: 首页 » 资讯 » 科技头条 » 正文

蔡崇信吴泳铭想要的回报,阿里云能不能做到

IP属地 中国·北京 编辑:陈阳 强调Next 时间:2026-05-21 23:56:30
两个第一,两场战争,火山引擎依然是阿里云的最大变量。

强调Next

5月20日,阿里云发布新一代旗舰模型Qwen3.7-Max。当晚蔡崇信和吴泳铭发布股东信表态,再次强调阿里云的战略地位。

两周前,火山引擎刚刚披露一组数字:根据IDC报告 2025年全年,火山引擎在中国企业级MaaS市场的Token调用量份额达到49.5%,阿里云28%,百度10%。

阿里云的模型更强了。但在调用量这张榜单上,它还落在火山引擎后面将近二十个百分点。

而就在Qwen3.7-Max发布会的前一天,阿里云高调发布了另一个行业榜单。Omdia统计的包含IaaS、PaaS、MaaS全链条的AI云整体收入,阿里云以35.8%排在第一,火山引擎14.8%。

两张榜单,两个第一,两种叙事,足以窥见双方的竞争烈度。两张榜单背后,谁在建真正的护城河,还没有答案。

01.评测的游戏,已经不只是跑分

昨天的发布会上,阿里云列出的评测清单比以往长了很多。除了GPQA、数学、代码这些通用项,还出现了SWE-Pro、MCP-Mark、Qwen SVG、Qwen World Bench、Qwenclaw、ClawEval等一批更偏Agent场景的测试。

大模型行业跑了三年基准测试,MMLU、HumanEval、Arena已经被磨得快没有区分度了,回答不了谁更强这个问题。

于是新一轮竞争转移到了出题权上。Agent任务的评测更复杂,变量更多:模型本身的能力、工具接口质量、任务拆解方式、评分规则,每一个环节都能影响最终结果。这给了有研发余量的大厂足够的操作空间,他们把自己擅长的任务形态写进评测框架,在新赛道上先占有利位置。

OpenAI有自己的Evals,Anthropic有Claude工程任务集,Google有AIME和代码竞赛系列。阿里云这次密集推出Qwen前缀的专项测试,逻辑一样。火山引擎的豆包大模型2.0在今年2月密集更新了多模态能力评测维度,重点强调OS Agent和复杂指令遵循,刻意回避了与Qwen正面竞争的赛道选择。

各家都在用自己擅长的题目给自己打分。阿里出的题阿里能赢,火山出的题火山能赢,有参考意义,但不大。

旗舰模型之间的能力差距还在快速收窄,benchmark的边际解释力也在同步下降。一个模型在某张榜单领先0.5分,未必能转化为真实业务中的稳定优势。企业客户最终关心的不是谁拿了第一,而是模型能不能持续完成任务、出错后能不能自己改正、成本能不能算清楚。

Agent竞争的重心正在从回答质量迁移到执行可靠性。这是Qwen3.7-Max这次想证明的东西,但仅靠发布会数字还不够。

02.开发者入口:三条截然不同的路

阿里云强调,Qwen3.7-Max具备跨框架泛化能力,并点名支持Claude Code、OpenClaw、Qwen Code等工具。

Claude Code是Anthropic今年增长最快的产品线之一,用户基数和粘性越来越高。

阿里云的切入方式是把工具层和模型层显式拆开。开发者继续用Claude Code,但底层调用换成Qwen。

阿里云的如意算盘是,让Anthropic做生态,自己做替换。这个逻辑能不能跑通,取决于Anthropic愿不愿意配合,而Anthropic现在正在把Claude和Claude Code绑得越来越紧。

火山引擎走的是另一条路。2026年3月,它正式发布ArkClaw。这是一款云端SaaS版的OpenClaw托管服务。

字节的策略是不让开发者折腾本地环境、配API、装Python,在火山方舟控制台开通会员、点立即创建,两分钟内一个云端OpenClaw实例就跑起来了。ArkClaw深度绑定飞书生态,支持飞书应用市场一键安装,聊天窗口里直接@智能体就能订会议室、批量生成文档、管理多维表格。

DeepSeek也在同一时间节点出手。近日DeepSeek发布了Harness产品经理和Harness研发工程师两个新岗位,岗位 JD直接写明:除模型本身以外,所有工作都属于Harness的范畴,相关人员将参与DeepSeek桌面端Agent产品的全过程,并定义DeepSeek对Harness的理解。更早的3月,DeepSeek曾一口气放出17个Agent方向岗位,要求候选人深度使用过Claude Code、OpenClaw、Manus等知名Agent。从大量招聘到组建专项团队,DeepSeek从只做模型到也做上层产品的转变,现在已经够明确了。

阿里云盯住全球开发者工具链里的模型替换空间,火山引擎把Agent能力嵌进中国企业最常用的办公IM,DeepSeek则直接做桌面端Agent产品,正面和Claude Code竞争。三家的目标客群有交叉,核心打法差异很大。

这三种路径各有壁垒,也各有弱点。ArkClaw的优势在低门槛和飞书生态的自然渗透,弱点是字节的B端客户以前沿开发者和AI创业公司为主,进入金融、制造、政府等重型企业客户的能力还有限,也很难像阿里云那样把模型服务和存储、数据库、安全等周边云产品打包销售。阿里云的全栈布局让它在企业客户里有更强的话语权,但这也意味着销售周期更长、客制化交付更重。DeepSeek的强项是模型本身的技术声誉,但产品、运营、用户留存,这些都不是做模型的公司天然擅长的事。

有开发者坦言,即便阿里推出了百炼平台也没有迁移的打算。迁移本身就是成本。除非千问的能力强到明显碾压其他模型,或者完全免费,我才会考虑迁移。

Anthropic已经开始把Claude模型和Claude Code绑定得更深:更稳定的项目级上下文、更精细的工具调用协议,以及一些设计上只有Claude才能完整激活的能力。工具层和模型层一旦重新耦合,第三方模型即便能接入,也只是能跑,而不是好用。

03.模型强不等于云收入强

发布Qwen3.7-Max的同一天,阿里巴巴集团主席蔡崇信和CEO吴泳铭联合发布致股东信,措辞罕见地直接:AI业务已跨越初期投入阶段,正式迈入商业化回报周期。信中还写道,阿里正在加大对全栈AI能力的投资,要打造更强大的MaaS产品,来更高效地实现模型与应用的连接。

这是阿里云最想讲的资本故事:模型越强,云业务越受益。

阿里的布局从云基础设施、大模型、企业客户、电商和办公场景、芯片到服务器全覆盖,是国内云厂商中最接近真正意义上AI全栈的。去年11月,阿里启动百炼战役,目标是短期内将百炼Token调用规模提升三倍以上;今年3月,集团CEO吴泳铭直接带队成立Alibaba Token Hub事业群。市场大体上认可这个方向。

但增长数字并不意味着增长质量。

回到开头那两张榜单。IDC按Token调用量统计,火山引擎2025年全年占49.5%,阿里云28%;Omdia按全链条AI云收入统计,阿里云35.8%,火山引擎14.8%。这种双第一格局的背后,是两套完全不同的商业逻辑。

有数据显示,按Token计费的MaaS服务收入,目前仅占整个AI云市场规模的不到1%。Token调用量增速惊人,但它还没有成为真正的收入大头。这意味着,火山引擎MaaS Token调用量第一的标签,和AI云收入第一之间,还有相当长的距离需要穿越。同样,阿里云全栈AI云收入领先,也不能直接转译为Qwen的模型价值被充分兑现。

一个企业选择阿里云的AI服务,可能是因为Qwen能力够强,也可能是因为价格低、合规要求、或者原本就在阿里云采购体系里。三种来源,只有第一种值得讲故事,后两种不过是传统云业务的收入换了个AI的壳。阿里云目前没有披露,也没有办法轻松披露,这三类收入各占几成。

AI云业务最危险的一种形态是:增长数字好看,但质量不扎实。试用量大、留存少;调用量涨、毛利被GPU成本吃掉;项目签了不少,多数是重定制交付,规模化复制难。这种情况下,Qwen再强,也只是帮阿里云多卖了一些算力,并没有真正建立模型层的护城河。

这个问题对火山引擎同样存在。Token调用量不一定转化出高质量的企业级收入。据媒体报道,阿里云的一线销售直言,2024年以后,火山引擎对阿里云的威胁最大,双方经常激烈争夺同一个客户。但争夺的是哪类客户,是利润薄、易流失的AI创业公司,还是金融、制造这类黏性高、采购周期长的企业客户?两者的含金量差距很大。

百度是另一个参照系。它曾是AI公有云服务市场的连续多年第一,但正在悄悄转换策略。百度智能云今年北京机场的广告从AI公有云市场份额领先改成了中国云厂商大模型市场项目数量&金额中标王。这隐含的信息是:央国企客户才是百度云的舒适区,MaaS的硬碰硬已经不是它的主战场。

有质量的AI云收入特征应该是:客户持续调用、使用深度递增、迁移成本随时间上升、单位成本随规模下降,并且模型能力能带动存储、数据库、安全、数据治理等周边云服务协同增长。

这条链路,几家AI云厂商目前都还没有在财报层面讲清楚。

04.谁在建真正的护城河

Qwen3.7-Max发布后,外界还会继续比较它和Claude、GPT、DeepSeek谁更强,但结果的重要性会下降。

Agent时代的竞争,已经不是单纯的模型能力竞赛。模型能力是基础,评测权决定话语权,开发者入口决定调用权,云基础设施决定交付能力,收入质量决定商业价值。

从这个视角来看,中国AI云形成了大致四种路径。

火山引擎的路径是用豆包App的C端海量用户打磨B端能力,用极致价格和低门槛工具快速跑量,把Token调用量第一建立成认知壁垒,再从调用量反推企业深度合作。这条路的风险是,客户结构偏浅,一旦有更低价的竞争者出现,切换成本不高。Token第一的标签,护城河还是流量泡沫,现在还说不清楚。

阿里云的路径是用模型能力争夺技术话语权,用百炼平台和全栈产品矩阵绑定企业工作负载,通过支持Claude Code这样的主流工具争夺开发者,最终让模型、工具链、云基础设施形成闭环。这条路的风险是,链路长、节点多,任何一环出问题都会影响整体,而全栈意味着每个细分战场都要维持竞争力,资源消耗巨大。

百度走的是第三条路,放弃MaaS的正面消耗,守住政企和央国企市场,用合规和安全能力筑壁垒。这条路最稳,但也最没有弹性。

DeepSeek选择正面和Claude Code竞争。这条路如果走通,DeepSeek就不再是一个给各家云厂商和开发者提供底层模型的公共基础设施,而是一个有自己产品入口的Agent玩家。它要挑战的,本质上是Anthropic,而不是阿里云或火山引擎。

阿里云在这四条路径里的特殊性在于,它不能只证明Qwen强,还要证明Qwen能进入真实工作流,能留住开发者,能带动企业工作负载迁移,最后能变成高质量云收入。

蔡崇信和吴泳铭在股东信里说,AI业务已经迈入商业化回报周期。这个判断对不对,Qwen3.7-Max是重要的测试变量。

Qwen3.7-Max的看点不是今天超过了谁,而是半年后有多少开发者把它写进了自己的工作流,有多少企业的工作负载因为它而不想走。

这场竞争最终检验的,不是哪家模型跑赢了哪张榜单,而是谁先把模型能力转化成了客户不愿离开的理由。这才是AI云竞争真正的终局问题。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。