文 | 强调Next
过去二十年,电商平台争的是“在哪里买”。下一场仗,争的是“谁替你决定买什么”。
这听起来像是用户的福利,但仔细想想,把购物决策交给一个由平台训练、为平台服务的AI。这到底是更好的购物体验,还是一套更隐蔽的流量收割?
豆包、千问赶在618前密集上线购物功能,这个问题开始有了真实的测试场。
强调Next用同一批问题测了豆包和千问,希望通过一系列问题看看真实的AI到底会不会改变我们的购物习惯?
需要提前说明的是,以下都是个案测试,样本有限,结论只能作为观察这个行业的一个窗口,不代表两款产品的全面表现。
01.实测:四组问题,两套逻辑
1、基础推荐:预算3000以内买笔记本
![]()
豆包的回答像做过功课的朋友,先给需求过滤(“不适合大型游戏,优先8G+256GSSD”),再推具体商品卡,附价格、配置、适用场景。底部“选购提醒”主动警告“i7独显低价机”多为老款改装陷阱,给出配置底线。最后追问用途,引导对话继续。
点开商品卡可以直接进入下单页面、付费,闭环流程比较顺畅,但不知道这个商家的推荐逻辑,以及是否是推广的结果。点击“查看更多商品”可以选择更多店铺购买,排在首位的是一个直播间。随机测试了几个其他的产品,也基本都是把直播间放在首位,说明在豆包的流量分发逻辑里,直播间的权重高于普通商品列表。
![]()
千问识别了需求,按使用场景做了分类推荐,但是信息的结构化呈现不如豆包。而且千问没有直接给产品购买链接,而是进入一个商品结果页,需要用户自己筛选,给的产品差别也比较大,需求匹配不是很准确,比较像用几个关键词搜出来的淘宝结果页。
千问比较人性化的推荐了一个性价比选项:买一个二手的苹果MacBook,但标注售价6237元,明显超出3000元预算,属于明显的预算匹配失控。
小结:豆包把决策做完再给你,但最终购买的落点突出直播间;千问把商城入口打开让你自己决策,整体感觉智能程度相对差一些,同时在多个测试中,千问都推荐了“二手产品”,这倒是体现了阿里的电商生态丰富性优势。
2、反向纠偏:戴森吸尘器比米家贵,但效果一样,对不对?
两家都没有顺着错误前提走。
![]()
豆包直接亮出“不对”,回答很明确,且分场景说清楚差异,附实时商品卡,追问是否需要按预算推具体型号。这里有明显的商品推销动作,但还算可接受。
![]()
千问用三列对比表格拆解各维度差异,给出分场景结论,纯信息输出,没有挂商品。
小结:两家都合格。但显然豆包的推销意识更强,会主动发现机会卖货。千问的回答更像纯工具,不过也带出了一点AI的通病,过于谨慎,显得不够果断、专业。
3、高客单价复杂决策:预算8000买相机,拍娃
![]()
豆包先提炼核心需求,“对焦快、追焦稳、直出好看,优先APS-C微单”,给三套预算方案,每套都有机身价+剩余预算配镜头的建议。商品卡来自官方旗舰店,数据可查。
![]()
千问的文字推荐框架完整,品牌推荐(索尼A6400、富士X-T30II)都是专业判断。
但商品卡完全错位,推荐“全新微单方案”挂的是53元的库洛米儿童玩具相机,“二手全画幅方案”挂的是7.78元的玩具相机。其他商品也都价格差异巨大,不太符合8000元预算的需求。
8000元预算,千问推荐了7块8的玩具。语言理解层做对了,商品匹配层断了线。
小结:豆包在高客单价场景下表现相对稳定,推荐逻辑清晰;千问的文字判断没问题,但商品卡匹配出现严重错误,语言层和商品层之间明显没有打通。
4、跨平台比价:同款AirPods4在京东、淘宝、拼多多哪里最划算
这是本次测试最有意思的一组。
![]()
千问直接坦白:作为淘宝AI购物助手,没办法帮你查京东和拼多多的实时价格。然后老实地给出淘宝内部的省钱攻略,价格是真实拉取的数据。商品推荐上也比较克制,不是上来就直接推商品链接,而是问过用户之后再推。
![]()
豆包给出了一套完整的三平台比价,结论清晰,各平台价格详细,还附上三条差异化购买建议。看起来很专业。
但可能都是骗你的:
第一,豆包既没有接入京东,也没有接入拼多多,这套比价数据是搜索相关资料后由模型生成的,不是实时拉取的。以“淘宝普通版636元(88VIP+券+国补)”为例,这是叠加多重优惠后的理论最低价,普通用户实际上拿不到。
第二,它又开始主动卖货了,答案底部挂的商品卡是自家抖音商城的AirPods 4,和需求里让它分析的三个平台没有任何关系。再次体现了强推销逻辑。
千问说“比不了”,诚实的说出了局限。豆包给了答案,但用户看到一套完整的比价表,会自然地以为这是实时真实数据,而实际上可能是一个幻觉。在购物决策这件事上,一个编出来的答案比没有答案更危险。
小结:这组测试最能看出两家的底层策略差异,也明显的反映了生态的局限性。这种移动互联网时代的“花园围墙”在AI时代依然无解。有意思的是,豆包推销抖音电商产品的意识更激进,有机会就往购买路径上引;千问反而更克制,更多时候是给信息、给方向,而不是直接递商品卡。
02.这届AI购物,差在哪里
1、推荐的底层,未必是用户利益
这是所有平台型AI购物共同面临的矛盾,不是技术能解决的问题。
淘宝天猫的核心商业模式是广告和竞价排名。如果千问的推荐真的完全按“最适合用户”排序,大量付费商家的广告投入就失去了意义,整个生态的商业逻辑就断了。已有媒体实测发现,千问推荐的商品高度集中在付费权重更高的商家范围里,销量上万的高性价比平价款被压到了数十位之后。
豆包同样如此。它的推荐池是抖音商城,商品卡点进去首先出现的是直播间,这不是巧合,而是字节电商流量分发逻辑的体现。AI推荐的背后,是平台希望你进入哪个消费场景。
传统搜索结果里,广告和自然结果之间还有一个“广告”标签。AI推荐说的是“根据你的需求为你精选”,用户几乎无法分辨推荐背后是算法还是商业。包装越自然,越值得警惕。
2、AI做了决策,但没有管住全程
豆包在推荐卡片这一层做了不错的过滤,但点开“查看更多商品”之后,预算约束消失了,3000元预算的笔记本测试里,¥3739的新款和¥4499的高配版照样出现。千问在预算匹配上同样失控,MacBook Air那张价格高达6237元的商品卡就是例证。
这暴露了当前AI购物产品共同的工程短板:AI的决策层和平台的商品召回层之间,没有打通。AI理解了用户需求,给出了有判断的推荐,但一旦用户离开这个推荐卡片,就切换回了传统电商的逻辑,按销量、按广告权重、按平台利益来排序。AI只影响了购物链路的第一步,没有影响后面的每一步。
更根本的问题是:商品数据的标准化和实时同步本身就是一个巨大的工程难题。豆包的比价数据依赖模型生成而非实时拉取,千问的商品卡偶尔错误匹配到儿童玩具,本质上都指向同一件事。在电商这个高度依赖实时库存、实时价格、实时促销信息的场景里,大模型的知识更新速度还跟不上商品世界的变化速度。
3、对话购物的效率,还没有超过搜索
AI购物的核心承诺是用自然语言表达需求,比输入关键词更高效。但从测试结果来看,这个承诺主要在“需求明确+标品+决策简单”的场景下成立。
问“预算3000的笔记本”,AI能给出不错的回答。但真实的购物决策往往不是这样的,用户的需求是模糊的,比较的维度是多维的,信任的建立需要时间。当豆包给你推荐一台相机但你不知道商品卡的来源是否可信,当千问的比价只覆盖淘宝一个平台,用户会本能地打开另一个App去交叉验证,这时候AI购物不但没有提升效率,反而多了一个确认步骤。
03.618:入口之争,但主战场不在这里
回到最初的问题:这届AI购物,会改变618的格局吗?
答案大概率是:不会,至少今年不会。
功能层面,无论是豆包还是千问,目前跑得比较顺滑的还是外卖、标品这类低决策成本的品类。618的主战场,家电、手机、电脑、服装等这些高决策成本、强比价需求、重信任背书的品类,AI推荐的可靠性和用户的信任度,还远没到可以“代劳”的程度。
用户习惯层面,从搜索式购物切换到对话式购物,是一次认知方式的迁移,不是一次App更新能完成的事。大多数用户今年618,依然会打开熟悉的购物App,按熟悉的方式比价下单。AI购物的尝鲜者,还是少数。
一些潜在的需求可能在对话的过程中被激发,但是用户是直接在豆包、千问里完成闭环,还是再去购物App比价,还不好说。
所以今年618的AI购物,更准确的定位是:一次公开的压测,一个象征意义的节点。各家用这个窗口验证技术路线、测试用户接受度、跑通支付闭环,为真正意义上的AI购物时代做准备。
真正的AI购物,要解决的问题还很多:推荐数据的实时性和准确性、跨平台比价的可能性及可信度、个性化推荐和商业利益之间的透明边界、高决策成本品类的信任机制……这些问题,靠功能迭代能解决一部分,但更多的是需要整个行业重建用户和平台之间的信任契约。
那个时刻,还没到来。





京公网安备 11011402013531号