财闻 张晓迪 发自杭州
5月20日,杭州飘着蒙蒙细雨,上午8点30分左右,通往西湖南岸西子宾馆的道路出现了不同程度的堵车,来自全国各地的2000多名技术人员来到这里。“芯片、模型、Token、Agentic,”等不及的人提前下车,边走边讨论着将要在这里召开的阿里云峰会。
峰会当天,阿里云一系列产品密集发布,其中包括,真武M890芯片、磐久AL128超节点服务器、千问云官网、STAROps智能运维平台、MuleRun(骡子)Agent平台、Qwen3.7-Max模型、百炼开放平台,以及AI视频创作平台“万镜一刻”。
财闻注意到,这是自2024年吴泳铭接管阿里云回归集团,开启“AI全栈”战略以来,阿里云第一次集中展示AI技术成果。
过去一个财年,阿里集团的AI模型及应用服务ARR(年化经常性收入)超过80亿元,AI业务收入在整个集团的占比突破30%。
回到本次会议,20、21日这两天,阿里云的产品经理们卖力地向参会者介绍和演示着这些按Token计费的AI技术产品。
基于这些新产品,阿里内部预计AI模型及应用服务ARR在年底将突破300亿元。
千亿投资之后,阿里的AI业务开始真正成为收入引擎,而不仅仅是成本中心。与此同时,阿里云也迎来了身份转变,这家卖算力的云厂商,正在跃迁为一家卖Token的“AI云工厂”。阿里云资深副总裁刘伟光在会上说:“阿里云正在进行全栈技术革新,从底层芯片、Agentic Cloud、模型到推理平台全面升级,建设中国最大的AI工厂。”
阿里集团的一名管理人员告诉财闻,2018年阿里芯片战略启动的时候,是没有预料到8年后行业的这种发展和热潮的,在持续不断地投入和具体的技术推进后,今天,阿里云才能抓住为AI行业提供基础设施的机会。
技术底座:从芯片到模型到Skills,一套为Agent准备的完整工具链
财闻在现场看到,此次阿里云发布的多个技术产品是已经上线、可付费、客户在用的产品,这些产品围绕Agent工作负载,形成了完整的技术体系。
其中最硬核的是芯片,20日,平头哥发布的真武M890,144GB显存,片间互联带宽800GB/s,性能是上一代真武810E的3倍。配套的ICN Switch 1.0互联芯片,P2P时延低于150纳秒,支持128卡紧密互联。搭载这套方案的磐久AL128超节点服务器,已在百炼平台上支持Qwen、DeepSeek、Kimi等主流模型。
随着Agent应用的爆发,AI的核心任务逐渐从纯对话转向任务执行,这不仅需要高AI算力支撑,其任务规划、状态管理、工具调用等环节极其依赖CPU,CPU成为影响Agent执行效率的关键部件。平头哥拥有自研的服务器CPU倚天系列,可与真武AI芯片协同,提升AI推理效率,有效应对Agent高并发任务的负载压力。
![]()
重要的是规模信号,平头哥首次公布,真武系列AI芯片累计出货56万片,已服务中国电信、中国一汽、浦发银行等400多家客户。未来两年,真武V900、真武J900也将陆续推出。加之此前自研的倚天CPU、磐脉智能网卡、镇岳存储主控芯片,平头哥的芯片版图已经从AI芯片扩展到“算力、网力、存力”全栈自研。
模型层面,Qwen3.7-Max在第三方机构Arena全球大模型盲测总榜中位列国产第一,超过Kimi-K2.6、DeepSeek-v4-pro、GLM-5.1,与GPT、Claude、Gemini最强模型接近。但比跑分更有说服力的,是一个实战案例,在从未接触过的真武M890芯片上,Qwen3.7-Max仅凭一份任务说明,从零自主工作35小时,独立完成了一个生产级AI计算内核的编写与调优,最终性能较官方版本提升10倍。通义大模型事业部负责人周靖人在会上说:“大模型正在从对齐人类偏好,转向对齐任务目标。过去追求的是模型说得好,现在要求模型做得到。”
![]()
千问云官网是这次发布中针对Agent的产品。打开页面,没有产品列表,没有控制台入口,只有一行Agent可读的指令。阿里云将所有模型服务的核心能力封装为标准化Skills和CLI工具,智能体可以直接解析并调用。刘伟光说得直白:“过去模型服务平台为人服务,未来用模型的主力将是Agent。”
除了千问云本身,与其同步上线的是Skills官网门户及首批官方Skills产品,共覆盖12条产品线、60余款云产品,所有Skills均经过官方质量检测与安全合规扫描,内置HITL人工确认机制,确保高危操作必须经人工审核后才能执行。这意味着企业可以将核心资产管理权限交给Agent,而不用担心失控。
如果把大模型比作Agent的“大脑”,那么Skills就是Agent操作云的“手脚”。
过去十余年,云计算的交互模式始终是“人操作控制台”和“代码调用API”。但当AI Agent进化为能自主决策、跨系统执行任务的智能体时,它们并不擅长点击按钮或理解验证码。
而Skills将底层复杂的OpenAPI参数与鉴权逻辑封装为Agent易于理解和调用的标准化指令,让数万API从“面向程序员”走向“面向AI可理解”。
阿里云同步开源了GitHub仓库,并与Clawhub、ModelScope魔搭社区、百炼等平台打通,开发者可一键获取Skills,即插即用。
Skills门户的上线,标志着阿里云迈出了向“Agentic Cloud”转型的关键一步。
商业变现:从“卖算力”到“卖Token
技术的下一步是变现能力。过去一个财年,阿里云的AI模型及应用服务ARR已超过80亿元,AI业务收入占比突破30%。管理层预计年底ARR将达到300亿元,届时MaaS收入将取代ECS成为阿里云最大产品线。
这意味着阿里云的增长引擎,正在全面切换为以Token为计量单位的AI收入。
![]()
会上,阿里云宣布百炼全面开放,智谱GLM-5.1、MiniMax M2.7、Kimi K2.6、可灵、Vidu Q3等模型已上架,通过千问云官网售卖。通过开放接入所有主流第三方模型,百炼将自身定位为“模型界的应用商店”,其核心壁垒不是单个模型本身,而是整体推理效率、调度能力和开发者生态。
截至2026年3月,百炼平台客户数同比增长8倍,Token消耗规模连续攀升。
对于此次发布的千问云门户网站,吴泳铭曾表示,在商业变现能力上,“MaaS业务的毛利率天然高于IaaS业务。”
另外,阿里云办公智能体MuleRun(骡子)目前已服务43个国家和地区的企业和用户,单月付费超200美金的用户占比达34%,付费用户每周活跃2.6天,人均每周完成13个端到端的工作任务。MuleRun负责人陈宇森举例称巴西一位自由职业者通过MuleRun输出了完整的营销网站、竞品分析、短视频脚本,全程未打开Word和PowerPoint。
5月21日发布的万镜一刻AI视频创作平台,用户仅需自然语言对话即可驱动视频生产。每一个视频片段的生成都对应大量的推理计算,直接转化为平台的Token消耗。
从芯片到模型,从模型到MaaS,从MaaS到Agent应用,阿里云的商业变现路径很清晰,底层自研芯片降低算力成本,中层百炼平台提供高毛利MaaS服务,上层MuleRun和万镜一刻创造增量Token消耗。三层叠加,构成了从成本到收入的完整闭环。
从“三驾马车”到“TokenHub”,挑战仍然在
与技术路线和商业模式确定同步而行的是阿里云组织架构的多番调整。
2024年初,吴泳铭接管阿里云后将混合云事业部更名为政企事业部。销售端形成了公共云、政企、海外“三驾马车”的格局。
2026年3月4日,通义千问技术负责人林俊旸等多位核心技术人员同日离职。仅仅12天后,阿里云整合了通义实验室、MaaS业务线、千问事业部、悟空事业部、AI创新事业部成立了ATH事业群,全称Alibaba Token Hub,吴泳铭亲自挂帅,并称该事业群的核心目标是“创造 Token、输送 Token、应用Token。”
随后的4月8日,阿里宣布通义实验室升级为通义大模型事业部,由原阿里云CTO周靖人担任负责人,这意味着大模型从研究导向正式转向商业化实体。
与此同时,原数据库产品负责人李飞飞出任阿里云CTO,负责AI云基础设施建设。
![]()
此外,阿里首次在集团层面成立了技术委员会,吴泳铭担任组长,核心成员包括周靖人、李飞飞和吴泽明三人。其中周靖人兼任首席AI架构师,吴泽明则专职担任集团CTO并负责AI推理平台建设,同时卸任了淘宝闪购CEO的职务。
吴泳铭对此表示,阿里正处于AGI爆发的前夜,这套组织架构正是为“数以百亿计AI Agent”的时代所做的准备。
ATH事业群的一位技术人员告诉财闻,组织架构调整后,内部工作节奏整体肯定是比以前更紧了,但工作成效确实也是显而易见的。
不过,捋顺架构,跑通技术和商业闭环并没有意味着前路坦途。
芯片产能瓶颈是眼下最现实的挑战。吴泳铭曾在稍早前的财报会上坦承,自研芯片在阿里云的“部署量还是不大,主要是产能受限”。国产芯片还面临制程相对落后、生态工具链尚不完善,如果自研芯片的渗透率无法在未来一年内从当前的不足三成提升到五成以上,阿里云改善毛利率的核心逻辑就会打折扣。
与此同时,模型能力竞争是决定MaaS业务天花板的关键,Qwen3.7-Max目前虽位列国产第一,但与GPT和Gemini的最强版本仍有差距。
与此同时,字节跳动已将2026年AI资本开支上调至2000亿元以上,DeepSeek等创业公司在特定领域的表现同样惊艳。MaaS的本质是卖Token,企业客户为Token付费的前提是模型能力足够强、Token的价值超过成本。如果竞品模型在关键benchmark上超越Qwen,企业客户的切换成本并不高,百炼平台的议价能力将迅速下降。
周靖人在会上说“从说得好到做得到”,但“做得到”的能力能不能持续领先,这是一场不能停歇的马拉松。
此外,全球化进展缓慢也为增长空间带来挑战。根据财报,阿里云的海外收入占比仍然偏低,与AWS和Azure的全球化程度差距巨大。欧洲的GDPR(欧盟2018年5月颁布的《通用数据保护条例》,被称为“史上最严”的数据保护法案)合规门槛、海外企业对国内云厂商的品牌认知短板、全球开发者生态的差距,都是短期内摆在阿里云面前的挑战。





京公网安备 11011402013531号