当前位置: 首页 » 资讯 » 科技头条 » 正文

AI开始“动手”了,全世界第一个带头的是阿里千问

IP属地 中国·北京 量子位 时间:2026-01-15 14:18:49

梦瑶 发自 凹非寺
量子位 | 公众号 QbitAI

当代打工人「酷刑」四件套,看看友友们有没有躺枪:

一点外卖就贼纠结还嫌麻烦、Excel一开人先宕机,攻略越做头越大、买东西还总能买贵……

(光想想都脑仁疼.jpg



但好消息是:可以不用疼了,因为现在AI,已经能《直接上手》替我们把这些糟心事儿给办了。

这!是AI帮我选购下单的27杯霸王茶姬,一键魂穿「淘宝闪购」,优惠券自动加好,顺手帮我小薅一把~



还有这!AI帮我制定了一份超详细的南京旅游攻略,自动直达「飞猪」页面,订机酒、订门票全都一把掐!



不卖关子,这就是阿里千问App的新能力,一口气上线400多项新功能,把淘宝、闪购、支付宝、飞猪这些阿里自家生态全给安排进来了。

四天前,谷歌宣布了与沃尔玛等零售商的AI购物合作计划,但目前尚未上线。

而阿里领先于谷歌,目前已成为了全球首个大规模开放“搜索-决策-支付-履约”全链路AI功能的科技公司。

不用在N个App间来回跳转,说一句指令,就能在手机里把点外卖、买东西、订机票、订酒店,甚至是办签证、查社保这些事儿轻松搞定。

Qwen模型+最全阿里生态强强联手,AI终于不只会聊天,也开始有模有样地替人上手做任务了。

(ps:新功能现在已全面开放测试,大家可以直接搓搓搓!!)

现在的千问APP,能直接上手帮咱办事儿了

不知道大家有没有跟我一样的感受:我们平时用AI,实际上就为了一个目的——让它替我们把事儿给办了。

这几年像ChatGPT、千问、Gemini等主流大模型确实都在往这方面发力使劲儿,但一个现实问题是,AI确实能帮咱干活儿,但这活儿,仅停留在数字世界的「信息形态」。

举个简单栗子,AI能给咱提供外卖建议,但没法帮咱点外卖;能帮忙做攻略,但真要到订机酒这种事儿上,还得自己上手,AI的办事能力一旦从赛博环境走向真实世界,手和脚就有点施展不开了。

而这事儿真正难的地方,还不完全在模型能力本身,而在一个更现实的问题上——《生态》。

因为在真实世界中,大多数应用系统之间本身就是封闭的,权限、流程、入口层层分离,AI想伸手都伸!不!出!来!更别提干活儿了,真挺难的…



但——要是这个AI,本身就同时握着「顶尖」的模型能力,又拥有完整、可调度的「生态体系」呢,那事情可就不一样了。

这一次,依托于Qwen最强模型阿里最丰富的生态,千问App在一套全新的Agent架构下,把AI的整体能力,实打实地往前抬了一个level。

购物、外卖、支付、地图、票务、娱乐,这些生活中最基础也最高频的能力,被一口气接进了千问App的同一条执行链路里。

生态被打通,最强模型也已站在了执行位,AI真·能在物理世界帮咱干活儿了。(千问:兄弟团办事儿保证不孬哈~

问题来了——那,千问App具体能帮忙干哪些活儿呢?下面咱一起边测边唠!!!

一句话,几十杯奶茶直接到位

咱先来看看千问App的有啥变化。

阿里这回给千问搞了个很低调的小图标作为办事儿入口——叫「任务助理」,长得有点像个*符号,点进去涵盖了精选、资讯调研、office办公、应用开发、生活办事几大板块:



需要说明的是,我们除了能在「任务助理」体验千问的办事儿能力外,还可以直接通过首页聊天框对话的方式,调用阿里生态完成点外卖、做攻略等基础日常需求。

大家看自己使用习惯,选择合适的入口体验就ok~

先来测测我大家在日常生活中需求比较大的一个办事能力——批量闪购

(毕竟在单位和学校没少组团点单发车…

为了测试千问App的语义理解能力,我特地向它发布了一个模糊的指令:帮我下单30杯茉莉奶白。



本来以为这种信息不全的需求AI多半会糊弄一下,结果没想到它先是主动追问了我的下单偏好,一步步引导我把关键条件补齐:



大概1分钟出头,千问App就直接调用了「淘宝闪购」,把理解需求、确认地址、挑选商品、生成方案、直达下单页面这一整套流程搞定了。

还有一个小细节是,在帮我选饮品的同时,它还顺手给了两套差异化的选购方案,一个是优先快速完成订单,一个是更注重饮品多样性,有点贴心了啊我说!!!

我也特意核对了一下:数量对、冷热对,全程没跳转平台,商品还能二次修改规格,整体体验和在淘宝闪购里手动下单的准确性几乎没差,但操作确实更省事了。

一句话搞定几十杯,剩下的就是坐等奶茶到位,外卖纠结党、下午茶发车党有救了,这要自己弄得鼓捣20分钟…

哦对了,直到快下单我才发现:这AI还顺手帮我领了张闪购券???让AI最大化给我薅羊毛、领红包,真的不要太爽吧!

旅游出行,一把跑通

再来看看大家节假日用得最多、也最容易累的旅游出行场景,这次负责跑腿的,是《高德&飞猪》。

眼瞅着快过年了,最近看了看北京飞三亚的春节旅游攻略,那叫一个眼花缭乱,这回我干脆交代给千问,让它帮我制定一份五天四晚的三亚旅游攻略~

千问,帮我制定一份五天四晚的三亚旅游攻略,2月12号北京出发,22号回京,酒店帮我找价位1500以下的。



没过一会儿,千问就给我甩出了一份超详细、图文并茂、还带交互功能的旅游攻略。(震惊.jpg)

景点推荐、导航路线、酒店推荐、订机票、订酒店,这种原本需要自己上手干的苦差事,都被它安排得明明白白:



为了让我更清楚地知道每天的行程路线,千问还直接生成了一份可交互的路线图。

每天去哪儿、怎么走、先后顺序,一眼就能看懂,而且还支持交互和地图缩放,真·指哪儿打哪儿:



不仅如此,我们还可以直接在旅游攻略里实现订机票、订酒店、打车、看路线,全程不用切换App:



当然,像打车查路线这种事儿也不一定要进旅游攻略,在首页聊天框里直接跟千问说需求同样可以,基于实时和预测路况,千问还能给出避免堵车、少换乘、赶时间等更贴合当下情况的路线方案。

emm…用下来最大的感受只有一个:下次出门旅游,真没必要再打开八百App和群聊看攻略了,谁也别想再靠信息差薅我羊毛了!!!

纠结型购物,终于有解了

我们再来看一个生活中经常用得到的场景——淘宝买东西

对于我这种有选择困难症的人来说,买个东西往往要在淘宝里来回点十几款,对比参数、翻评价、看测评,折腾半天,最后还不一定选得出来……

都接入淘宝了,千问肯定在选商品、比价方面比咱更擅长,这次我给AI的指令是这样的:

千问,帮我推荐一款扫地机器人,2000—3000元左右,家里有只猫。

值得一提的是,我们不仅可以通过打字输入的方式给AI下指令,还可以通过「语音」的方式吩咐千问办事儿:



从结果来看,千问并不是简单甩几个商品链接过来,而是基于真实使用需求做了一次拆解

一边考虑预算和养宠场景,一边结合个人偏好,把推荐方案分成了「均衡之选」「边角清洁专家」「性价比之王」三种不同取向。

这样一来,无论你是更看重清洁效果、性价比,还是想选个稳妥不翻车的型号,都能快速对号入座。

不仅如此,千问还根据淘宝海量供给与真实评价,融合全网测评与口碑,对我的意图和约束条件做了一次完整的理解和推理:



怎么选、选哪款、值不值,一眼就清楚了。

日常办公应用开发都不在话下

最后我们来唠唠对牛马党来说非常实用的一个场景——日常办公应用开发

在「任务助理」的office办公和应用开发板块中,汇集了N多个超实用的功能,例如表格处理、图标生成、幻灯片制作、做网站或小程序等等,很适合在有办公和开发需求的时候帮咱一把~



这次我干脆让千问化身调研专家,让它帮忙生成一份有关2025年具身智能行业报告的PPT,顺便看看它在行业理解和结构化内容组织上的水平咋样~



从市场规模与趋势预测,到技术发展路径,再到企业动态和机会总结,逻辑确实很规整,该有的重点要点都有。

而且说句实话,千问是真的有点审美在的,藏蓝色的PPT背景,搭配3—4个克制的字体颜色,看久了也不累,整体观感非常舒服。(就问学生党和牛马党爱不爱!!!)

当然,千问能办的事儿也不止前面说的这些。

像「调用支付宝」查询政务、帮忙挑选餐厅,给餐馆打电话帮定座位等等,这类能力解决的都是我们日常生活里最具体、最琐碎的需求。

大家感兴趣的话可以直接上手搓搓看~

最强模型+最全生态,人机交互走到新拐点

如果只把千问这波办事能力理解成「功能突然变多了」,可能还是有点片面了。

因为这一轮能力的集中释放,本质可以理解为千问App在顶尖模型能力最全生态体系上同时形成合力后的自然结果。

对Agent类应用来说,底层模型到底能不能打,几乎直接决定了任务能不能跑通,以及用户最终能感受到的体验上限。

而这恰好是千问App最擅长、也是优势最集中的地方。



一方面,阿里本身就拥有目前全球最完整、也最活跃的开源Qwen模型家族。

Qwen系列的衍生模型数量已经超过18万个,其中Qwen3-Max的综合性能稳居全球前三,在Agent和Coding方向的能力尤其突出,只有模型底子够硬,才有办成事儿的前提。

在具体的技术路径上,千问App这次基于MCP和A2A协议,引入了一套全新的「通用Agent体系」——

由主Agent负责理解需求、拆解任务和整体规划,多个具备反思能力的子Agent,则在各自领域内独立决策、执行和校正。

这种分工带来的最直观变化是:任务不再一股脑儿全堆在一起,而是被拆开各自去跑,大幅提升了跨领域、长链路的复杂任务执行效率和准确率。

这一套能力叠加下来,才在技术底层上让千问App真正长出能干活儿的手、能跑流程的脚,以及能兜住全局的大脑。

除了强大的底层技术能力外,生态这方面也值得好好聊聊。

大家对阿里的生态体系都不陌生,高德、飞猪、淘宝闪购、淘宝这些我们一天可能打开八百回!!

可以说是覆盖了咱们生活的方方面面。在国内甚至全球,能做到如此全面生态的科技公司,都很难找出第二个。

也正因为这些场景离生活足够近,每天都有大量真实的下单、支付、履约和服务结果在持续发生,这些被一遍遍验证过的结果,本身就成了最有参考价值的现实依据。

千问App正是建立在这些真实的用户行为和商家反馈之上,来做决策判断并给出建议,这样一来,信息来源从描述走向可验证,输出给我们的信息也就更加真实有效,形成了一套可追溯的去伪存真机制。

技术到位、生态跑通,再回头看千问App为什么能把事儿办成、而且还能办得又快又好,其实也就不难理解了。

回看技术史,真正具有跨时代意义的时刻,往往并不是技术已经足够成熟的时候,而是第一次有人把「未来」,真正演示给现实世界看。

2007年,乔布斯在发布第一款iPhone手机时,通过Google Map定位最近的星巴克,再手动拨打电话谎称要订购4000杯咖啡,当即博得了满场的欢呼声。



19年后的今天,类似的场景已经不再需要演示,只需要对千问App说一句话,包含个性化需求的500杯奶茶就可以真实送到我们身边。

中国的AI,把乔布斯当年的想象,真正变成了结果。

回顾过去几十年的技术演进,我们会发现,人机交互本身其实已经经历过两次清晰的跃迁。

上世纪90年代,人通过鼠标点击逐条指挥计算机完成任务;移动互联网时代,人通过手指触控App把需求拆解成一个个操作步骤。

现在,当AI可以直接上手把执行任务完整跑通时,技术的演进步伐再次发生了变化——人机交互正在迈入第三次重要跃迁,而千问App这类产品正把这一步率先落到现实中。

甚至我们可以想象,大量零散重复的生活琐事,可能会全部被AI接管;相当一部分执行型、流程型工作,将由AI完成;人类获取知识和做出判断的方式,也会越来越多地通过AI来实现。

通过接入阿里最丰富的生态平台,以Qwen模型作为能力中枢,千问App让AI首次具备了面向现实世界的落地能力——

从点一杯奶茶、查询航班,到下单、订酒店,生活中那些最琐碎、最分散的小事,如今都可以在每个人手中的App里,交给AI一次跑通。

当执行成为模型的内建能力,AI产品就不只是一个界面交互层,而是平台操作系统的一部分,这个方向一旦被验证,交互方式、服务入口、平台形态都会跟着一并重塑。

从这个角度看,千问与其说是在展示全球科技的想象力,不如说,它已经在为想象力提供一个「被验证过了」的起点。

全世界看到的第一个通过Agent工具、大规模完成真实世界复杂任务的AI助手——来自阿里千问

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。