步入Agentic AI(智能体)时代,阿里云正在重构其全栈技术体系。
5月20日,在2026阿里云峰会上,阿里云宣布完成面向Agentic时代的全面升级,重磅发布全新“芯-云-模型-推理”全栈技术体系,同步推出全新AI产品官网“千问云”、搭载自研AI芯片真武M890的超节点服务器,以及最新旗舰模型Qwen3.7-Max。
阿里云最新全栈技术体系
这场干货满满的大会充分展现出阿里云拥抱AI智能体的决心。阿里云智能集团资深副总裁、公共云事业部总裁刘伟光表示,Agent突破临界点之后可以24小时不间断工作,对AI和云的需求无穷无尽。阿里云正在进行从底层芯片、Agentic Cloud、模型到推理平台的全面升级,建设中国最大的AI工厂。
经过此次激进升级,Agent驱动的MaaS(模型及服务)收入将取代ECS(云服务器弹性计算服务),成为阿里云最大的产品线。这意味着,阿里云的增长引擎,正在全面切换为以Token(字元)为计量单位的AI收入。
真武系列AI芯片累计出货56万片,Token收入5个月狂飙15倍
在大会上,阿里云公布了激进的芯片路线图,强调公司的重点不再只是卖模型或算力,而是直接对标谷歌TPU芯片与Gemini模型的结合。
在芯片层,阿里发布基于新一代AI芯片真武M890的磐久AL128超节点服务器,搭载自研互联芯片ICN Switch 1.0,可让128张AI芯片组成一台计算机,P2P时延低于150ns,主打解决Agent场景下的海量并发推理和大模型训练需求。
平头哥新一代训推一体AI芯片真武M890也在会上首次亮相,其性能是上一代真武810E的3倍。同时,平头哥首次公布了真武系列芯片的路线规划:未来两年将实现“一年一上新”,陆续推出算力更强的真武V900、真武J900两代芯片。目前,真武系列AI芯片累计出货56万片,服务来自20多个行业的400多家客户。
真武系列AI芯片路线图。阿里云
在会后采访中,刘伟光对澎湃新闻等媒体表示,用户需要的是“几何式的组合”,即模型能力、芯片能力和云能力这三者的完整有机结合:“如果今天没有芯片这个环节,要说打造有最好的性价比、最开放的云,其实是有点虚的。这一环补上来之后,我们的全栈路线就是一个完美的故事线了……如果未来拼的是让每一块芯片都能跑出比我们竞争对手更多的、更高质量的token,那我们就胜利了。”
同时,阿里云方面指出,Agent的运行底座依然极度依赖传统的CPU和存储资源,AI云的边界正在大幅拓宽。阿里云副总裁张启表示,把GPU云和CPU云对立起来的逻辑并不成立,Agent今天大部分的运行资源还是要CPU资源,行业判断两者在未来可能会达到1:1的比例。
在稳定底座带来的强大实力基础上,据张启介绍,在大模型的MaaS市场,阿里云现在是规模第一。而自今年以来,Token收入开始迎来大爆发,去年下半年之前只能被称为“序章”,今年才真正进入了“战场”:“从阿里云的数据来看,在过去的5个月,日均Token收入大概增长了15倍。”
刘伟光进一步指出:“等到token覆盖了一切的时候,那么整个企业、整个市场的IT支出结构也会发生巨大的变化,包括软件外包也好,都会发生巨大的产业变革。”他给出了未来AI生态的终极商业构想:从现有的按Token消耗量计费,最终演进为为结果付费,并形成一个由智能体自我驱动、互相交易的闭环经济体。
核心判断:用户主体从人类全面转向Agent
阿里云还在做一件更底层的事:把云产品本身变成Agent能用的东西。阿里云首席技术官李飞飞认为,传统云产品的交互逻辑是为人设计的,但Agent工作负载是“无规律弹性、短生命周期、瞬时起量即走”,与传统云计算的稳态负载截然不同。
这就意味着,传统云产品的设计逻辑是面向人的,但许多信息对Agent毫无意义。为此,阿里云对云产品进行了Skill化、MCP化和CLI化改造,让每一个云产品都变成Agent可以“像调函数一样调用”的标准化能力模块。
这也是阿里云成立17年以来,首次在阿里云官网之外推出全新产品官网“千问云”的原因,其背后的核心判断是:未来的云计算主要使用者将是AI智能体。
打开该网站页面,首页只有一行Agent可读的prompt指令。阿里云将所有模型服务的核心能力封装为标准化的Skills和CLI工具,智能体可以直接解析这条指令,“学会”网站的全部能力,并根据需求自主调用。
对此,张启解释道:“今年年初,公司内部有一个重要的判断……除了AI产品,经典云计算产品的主要使用对象也将逐渐从人类工程师变成Agent。在未来实现‘Agent优先’之后,底层的云资源也会更多地由Agent去调用。”
基于这样的判断,阿里云在模型上也做出了调整。Qwen3.7-Max是阿里巴巴最新发布的旗舰大模型,在三方机构Arena全球大模型盲测总榜中,Qwen3.7-Max超过Kimi-K2.6、DeepSeek-v4-pro、GLM-5.1,与GPT、Claude、Gemini最强模型接近,位列国产模型第一。
而比单纯的跑分更有说服力的是一个实战案例:在训练时从未接触过的真武M890芯片上,Qwen3.7-Max仅凭一份任务说明,从0开始自主工作35小时,便独立完成了一个生产级AI计算内核的编写与调优,最终性能较官方版本提升10倍。
Qwen3.7-Max实战案例。阿里云
该案例展示的不是模型“回答问题”的能力,而是模型“自主完成复杂工程任务”的能力。对此,阿里巴巴通义大模型事业部负责人周靖人表示:“大模型正在经历一次核心范式转移——从对齐人类偏好,到对齐任务目标。过去我们追求的是模型‘说得好’,现在要求模型‘做得到’。Qwen3.7-Max的设计初衷,就是让模型真正成为Agent的智能内核,具备自主规划、持续迭代、跨工具协作的能力。”





京公网安备 11011402013531号