当前位置: 首页 » 资讯 » 科技头条 » 正文

智谱AutoGLM与豆包手机的分歧,是AI时代的安卓苹果之战?

IP属地 中国·北京 钛媒体APP 时间:2025-12-10 14:21:17


12月10日深夜,智谱开源了其核心AI Agent模型AutoGLM,引发AI圈关注。

距离AutoGLM第一次出现在公众视野里,已经过去了111天。AutoGLM是智谱AI开发的跨端通用智能体,通过自然语言指令自主完成手机、电脑等设备的复杂操作,实现“一句话搞定任务”的人机交互体验。

作为全球一个具备“Phone Use”能力的AI Agent,AutoGLM核心功能围绕“自主执行”展开。它能模拟真人点击、滑动、输入等动作,稳定处理外卖点单、机票预订、朋友圈互动等数十步流程,覆盖50多个高频中文应用的核心场景,同时支持跨端协同(手机+电脑),例如,手机发指令让电脑自动生成PPT、整理数据,任务在云端运行,不占用本地设备资源。

2025年8月,AutoGLM 2.0面向公众开放,强调“执行型助手”定位,不再局限于对话或信息查询,而是“动手”完成任务,比如,办公场景中从检索资料到生成视频、PPT的全流程执行,生活场景中跨应用预订服务等。

但是,由于三方功能的实际体验不够顺畅,在实际体验过程中,授权动作繁琐,语义理解易错等方面问题,让AutoGLM的首次亮相并未在C端引发现象级传播。

但其构建的新技术范式仍引发了行业震动。

智谱官方表示,这一次AutoGLM选择开源,主要基于三方面原因:

一是避免AI手机能力被少数厂商垄断,通过开放技术底座推动行业共建; 二是保护用户隐私,让数据与控制权完全归属使用方,支持私有化部署; 三是共享32个月的技术积累,降低Agent开发门槛。本次开源内容包含训练好的核心模型、Phone Use能力框架、50+高频App的Demo及文档,均以MIT和Apache-2.0许可证开放。

据智谱官方,AutoGLM开源的首要意义是对抗技术垄断,将“AI使用手机”这一核心能力基础设施化和民主化。

文档指出,如果“会用手机的AI能力”只掌握在极少数厂商手中,用户的手机将越来越像“别人家的入口”,开发者的创新也会受制于人。通过开源,AutoGLM将这项能力变为行业可以共同拥有和打磨的公共底座。

开源使得任何开发者或团队都能像使用“积木”一样,将AutoGLM集成到自己的系统中,或进行拆解、重写和改造。这降低了Agent开发的门槛,可以催生出多样化的AI原生应用、硬件和解决方案,加速Agent生态的繁荣。

同时,基于Phone Use能力涉及的支付、社交、企业系统等敏感领域的问题,AutoGLM团队强调,将控制权交还给用户,以此解决信任核心问题。团队明确表示,“不希望也不应该把这些东西握在自己手里”。

有行业人士对作者表示:“AutoGLM开源的意义远超一个普通的代码开放项目。它是一次战略性的生态卡位和规则定义,其目标是成为未来AI Agent,尤其是终端通用Agent的基础,就像Android之于移动应用生态。”

结合最近“豆包AI手机”的热潮来看,智谱AutoGLM这次开源,也意味着各家公司在智能手机终端的通用Agent之争,正走上完全不同的道路。

而这两条路径,正好与多年之前的安卓与苹果之争十分类似。

从策略目标层面来看,AutoGLM的策略,是成为AI时代的基础设施和公共底座,是一套类似于安卓的软件开发环境。而豆包手机助手的策略,是直接抢占硬件入口,通过“AI附体手机”的方式,抢占用户与数字世界交互的终端。

从AI能力部署层面来看,AutoGLM采用“云端智能体”范式,为AI配备专属的云手机、云电脑,任务在云端虚拟设备中执行,不占用、不干扰用户本地设备;豆包手机直接采用“终端具身智能”范式,让AI直接在用户真实的物理手机上进行“模拟点击”操作,并将AI能力深度集成到手机硬件和系统层,实现多任务并行。

智谱AutoGLM的开放模式将训练模型、能力框架等开源,将操作执行能力封装为API,供开发者融入各类硬件;而豆包与手机厂商(中兴努比亚)合作,推出专属硬件,抢占用户终端,其“模拟点击、调度一切”的模式,直接挑战了微信、淘宝等超级应用的生态壁垒和用户入口,因此,引发了平台的“封禁”。

智谱AutoGLM与豆包手机助手的路线分歧,某种程度上像是传统意义上软件与硬件谁来定义谁的问题,后续必定还有更多的玩家进入这场角力,而智谱AutoGLM这次开源,更像是通用AI Agent话语权之争的大幕拉开的一个重要信号。(作者|陶天宇,编辑|李程程)

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。