如果你刚好参加了阿里云杭州5.20峰会,一定会深刻感受到一种新的气息,云计算那个“老登时代”彻底结束了,未来正在从Agent开始变局。
我们都知道,千问是阿里云大模型的统称,但你万万没想到,千问背后还有一个千问云。这是一个新的官网,人点进去,不会看到任何产品列表、价格表、控制台入口。但这不是给人看的,而是给Agent看的。这说明,阿里云正在把云的用户,从“人”换成“Agent”。
这件事,看似只是上新了一个服务,但是背后的影响有多大,可以说是无法衡量。换个角度理解,这就像当年的淘宝,把首页从货架改成了代码编辑器。疯狂吗?疯狂。但如果你相信未来90%的云服务调用将由AI Agent完成,那这步棋非走不可!
更狠的是,阿里云为此重新发明了一整套东西:
芯片:真武M890
模型:Qwen3.7-Max(国产第一,能自己干活35小时)
云架构:Agentic Cloud(云产品全部Skill化)
入口:千问云(一行代码替代整个官网:qianwenai.com)
用阿里云资深副总裁刘伟光的话来说,这次新品发布不是个别产品的小打小闹,而是推出了全新“芯-云-模型-推理”全栈式技术体系。
阿里云新动作一出,资本市场嗨了,阿里股价飙涨8%。上周阿里财报披露,AI模型及应用ARR突破80亿元,预计年底冲到300亿。
但这还不是最刺激的,更狠的还在最后。会议期间,刘伟光透露了一个关键点:Agent驱动的MaaS收入,将取代ECS成为阿里云最大的产品线。
这句话翻译过来,意思就是:按token收钱,即将取代按服务器收钱。云的商业模式,正在经历根本性位移。
至于,这次发布会到底发布了哪些“硬核技术”,先来看最底层的硬件部分!
真武芯片M890和一台“128颗芯片组成的大号计算机”
平头哥亮出了新一代AI芯片真武M890,144GB显存,片间互联带宽800GB/s,性能是上一代真武810E的3倍。
这颗芯片需要结合服务器一起使用。阿里云把它塞进了一台叫磐久AL128的超节点服务器里——这台服务器里还藏了一颗自研的ICN Switch 1.0互联芯片,能让128张AI芯片像一台计算机一样协同工作,P2P时延低于150纳秒。
150纳秒是什么概念?你眨个眼要100毫秒,也就是1000万纳秒。这相当于在子弹飞行的距离里,完成了128个大脑之间的同步。
平头哥还公布了未来两年的路线图:真武V900、真武J900已经在路上。目前真武系列AI芯片累计出货56万片,服务中国电信、一汽、浦发银行等400多家客户。
加上倚天CPU、磐脉智能网卡、镇岳存储芯片……平头哥的芯片版图已经从“单点突破”走到了“全面覆盖”。
平头哥半导体副总裁高慧解释得很直白: “Agent在执行任务时,可能在毫秒间连续发起数十次模型调用。我们需要算力、网力、存力的系统级协同,让每个Agent都能流畅运行。”
说白了,Agent这种新物种对算力的“吃法”,和人类完全不一样。人类是点菜,Agent是自助餐——还是无限量的那种。
Agentic Cloud把云变成Agent能“摸到”的东西
芯片层搞定了,但更头疼的问题来了:传统云产品,Agent根本不会用。
传统云产品的设计逻辑是面向人的:控制台、菜单、配置项、仪表盘……这些视觉化的信息,对人很友好,但对Agent来说就像给鱼看菜单——完全不可读。
借用阿里云首席技术官李飞飞的话来说:“传统云产品的交互逻辑是为人设计的,用户看着控制台点击按钮,或者通过API编写代码调用。但Agent工作负载是‘无规律弹性、短生命周期、瞬时起量即走’。”
于是,阿里云的解法是:把云产品Skill化、MCP化、CLI化。
听不懂?我来解释一下。
就是把每一个云产品,都封装成Agent可以“像调函数一样调用”的标准化能力模块。Agent不需要知道背后有多少配置项、多少权限逻辑,只需要知道:我输入这个指令,你给我那个结果。
阿里云还为此搭建了一套完整的Agent运行环境:沙箱执行环境、多Agent协同能力、跨任务记忆能力、数据流转通路、全域智能运维……这套东西的总称,叫Agentic Cloud。
Qwen3.7-Max像是一个能自己干活35小时的“数字员工”
芯片和云架构是骨架,模型是灵魂。
在这次大会上,阿里发布了旗舰模型Qwen3.7-Max。在三方机构Arena全球大模型盲测总榜中,它超过了Kimi-K2.6、DeepSeek-v4-pro、GLM-5.1,位列国产第一,紧咬GPT、Claude、Gemini。
但比榜单排名更有说服力的,是一个实战案例。
在一块模型训练时从未见过的芯片(真武M890)上,Qwen3.7-Max仅凭一份任务说明,从零开始自主编程35小时,独立完成了432次内核评估、1158次工具调用,最终把推理内核的性能提升了10倍。
没有人类干预,没有中间指导,35小时,从零到生产级。
为什么这么厉害?阿里巴巴通义大模型事业部负责人周靖人点出了核心:“大模型正在经历一次核心范式转移——从对齐人类偏好,到对齐任务目标。过去我们追求的是模型‘说得好’,现在要求模型‘做得到’。”
Qwen3.7-Max的设计初衷,就是让模型真正成为Agent的智能内核,真正具备自主规划、持续迭代、跨工具协作的能力。
有个信息点,值得重点关注一下。近3个月内,千问旗舰模型已经迭代了3.5、3.6、3.7三个版本。这个节奏,摆明了是在为Agent时代的指数级需求加速卡位。
百炼推理平台是Agent背后那个“生产车间”
芯片有了,模型有了,云也重构了。Agent真正跑起来的地方,叫百炼推理平台。
阿里云在这上面堆了一套技术栈,专门应对Agent场景的特殊挑战。比如:
并池调度:把GPU资源统一调度,提升整体利用率
上下文缓存:消除多轮对话和长链路任务中的重复计算开销
吞吐弹性调度:应对并发请求的波峰波谷
Agentic RL:基于Agent实际执行反馈的强化学习,让模型越用越好
还有个容易被忽略但极其关键的点:安全治理。
一个24小时不间断执行任务的Agent,如果没有边界约束,后果不堪设想。百炼内置了HITL(Human in the Loop)人工确认机制,确保高危操作必须经过人工审核。
生态策略上,百炼保持开放。除了阿里自研的千问模型,智谱GLM-5.1、MiniMax M2.7、Kimi K2.6、可灵、Vidu Q3等第三方模型也已上架。
一行代码的官网,和一个时代的终结
最后,回到那个最“反人类”的官网。
千问云是阿里云成立17年来,首次在阿里云官网之外推出的全新产品官网。
首页没有产品列表,没有控制台,没有导航结构,只有一行Agent可读的指令。
阿里云把所有模型服务的核心能力封装成了标准化的Skills和CLI工具。Agent可以直接解析这条指令,“学会”网站的全部能力,并根据需求自主调用。
这背后的逻辑变化,值得细品。
过去十年,云的交互逻辑是“人登录控制台→选产品→配参数→调API”。
现在,Agent不看网页、不点按钮,它需要的是结构化的能力描述、明确的调用协议、可预期的反馈机制。
上一次中国头部科技公司以如此决绝的方式重构产品入口,可能要追溯到移动互联网早期,当所有人把PC官网的流量让位给App的那个阶段。
只不过这一次更彻底:App至少还需要人去打开,而Agent只需要“读”一条指令。
语音模型浮出水面,三项第一,让Agent“听得懂人话”
顺便提一嘴,就在峰会第二天(5月21日),阿里语音大模型也在全球权威评测平台Artificial Analysis上登顶了。
Fun-Realtime-ASR:词错误率仅1.8%,100个词里听错不到2个字。支持毫秒级响应,覆盖30多种语言和7大中文方言。
Fun-Realtime-Audiochat:在“语音推理”和“对话流畅度”两项上均斩获第一。97.6%的推理得分意味着它能高效完成意图判断、情感分析、多步推理;97.8%的对话流畅度说明它在处理抢话、打断、沉默等真实对话场景时,已接近人类水平。
这套语音模型已经融入千问App、高德地图、钉钉等应用。对Agent来说,“听懂人话”是基本功——阿里显然不想在这一环掉链子。





京公网安备 11011402013531号