当前位置: 首页 » 资讯 » 科技头条 » 正文

全球首个「手机通用Agent」上线,人人可用

IP属地 中国·北京 编辑:冯璃月 学术头条 时间:2025-08-20 16:17:42


还记得「」吗?

去年10月智谱发布全球首个Phone-Use产品AutoGLM,开启Agent的新时代。

今天,AutoGLM 2.0再次升级,将Agent应用提升到新的高度——

全球首个手机Agent人人可用

开创Agent+云手机/云电脑的新技术范式,不抢占用户手机和电脑;突破硬件限制,在任何设备、任何场景下运行,帮助用户代理操作;国产模型(GLM-4.5、GLM-4.5V)驱动,具备推理、代码与多模态的全能能力

即刻起,人人都可使用AutoGLM。我们将快速迭代推出新功能( “定时任务” 很快上线,AI每天主动替你干活)。应用商店搜索“AutoGLM”, 或点击文末“阅读原文”。

操作执行助手

过去的AI多停留在“对话”层面;一般的智能体助手也多局限于信息查询和总结。

AutoGLM 2.0 则实现了质的飞跃——它不再只是“说”,而是真正能够“做”。

事实上,在AutoGLM 1.0中,我们已探索过让AI代替用户完成部分手机操作,但只在有限场景下生效。随着AutoGLM 2.0的发布,它已经成长为一名执行型助手,能够在「云端」自主完成多样化的任务。

在生活场景中,用户只需一句话,就能让 AutoGLM 操作美团、京东、小红书、抖音等几十个高频应用:点外卖、订机票、查房源,例如帮你买「秋天的第一杯奶茶」。

在办公场景中,它同样能跨网站执行全流程工作,操作网页版的飞书、网易邮箱、知乎、微博、抖音、微头条等网站:从信息检索到内容撰写,再到生成视频、PPT 或播客,并直接完成小红书、抖音等社交媒体平台内容发布。

这意味着,AI不再是一个“聊天工具”,而是一个能真正替你干活的全能代理人。不仅能给出答案,还能把任务完整执行,帮助用户节省时间与精力,彻底改变人与AI的协作方式。

为AI配一台手机

AutoGLM的主要亮点,是一个APP让一部手机成为真正的“新物种”。

在AutoGLM 2.0中,我们为AI配备了专属智能体手机/智能体电脑,让它可以在云端自主干活、完成任务,而无需占用用户的本地设备,期间用户可以使用其他 APP(如刷抖音、打游戏)。

这意味着AI不仅能“自动驾驶手机”,还可“异步代理办公”。让手机变成具备自主执行、跨端协作能力的智能体手机。

AutoGLM会以这样的产品形态出现,源于我们对AGI早期形态的理解。我们认为从Agent到AGI,还需要满足3A原则:

Around-the-clock(全时):24 小时运行,即使用户离线,Agent 依然在执行任务;Autonomy without interference(自主零干扰):独立运行,不占用用户屏幕与算力,平行世界的搭子;Affinity(全域连接):跳出浏览器对话框,跨越手机、电脑、手表、眼镜、家电等设备,操作物理世界。

AI新硬件

借助AutoGLM强大的云端执行能力,人与设备的交互方式正在被重新定义。

我们已将AutoGLM的操作执行能力封装为API,开发者只需简单接入,即可将这一能力无缝融入各类硬件设备,从AI眼镜等可穿戴设备到传统家电。

AutoGLM首次让硬件具备完整的手机级操作能力,无需在端侧堆叠复杂系统或大容量电池。例如,可以通过智能眼镜点一杯咖啡。

今日起,AutoGLM移动端API申请通道及开发者生态共建计划正式上线。除手机与电脑外,手表、眼镜、家电等设备都能成为Agent驱动的智能助手。

期待与更多开发者共同探索AI融入物理世界的无限可能。 传送门:https://autoglm.zhipuai.cn/misc/developer-apply

技术SOTA

AutoGLM可以在国内免费向所有人开放,因为它是纯国产Agent,成本相较于接入国外模型的Agent有了数量级的下降。

AutoGLM由智谱最新开源SOTA语言模型GLM-4.5与视觉推理模型GLM-4.5V驱动。AutoGLM将基座模型原生能力发挥到极致,并结合在「端到端异步强化学习」方面的多项突破成果,可以完成推理、编码、研究、Agentic与GUI操作等多类任务,并可根据需求灵活调用最合适的「大脑」完成执行。

ComputerRL:提出API-GUI协同范式,提升数据多样性与计算效率;改进GRPO并提出 Entropulse 机制,增强探索与策略多样性。MobileRL:创新难度自适应强化学习方法(推理自举预热 + 难度自适应GRPO),显著提升移动端任务的稳定性与收敛效率。AgentRL:通过交叉采样与任务优势归一化机制,解决多任务训练中的不稳定与梯度分布不均,增强整体鲁棒性与效率。

Device Use基准测试(涵盖手机、电脑和网页操作)中,AutoGLM表现优于ChatGPT Agent、UI-TARS-1.5和Claude Sonnet4,展现出更强的鲁棒性与通用性,处于主流Agent的SOTA水平。


更多技术细节,请参阅GLM团队的三篇最新技术论文:

ComputerRL: Scaling End-to-End Online Reinforcement Learning for Computer Use Agents(https://arxiv.org/abs/2508.14040)MobileRL: Advancing Mobile Use Agents With Adaptive Online Reinforcement Learning(https://github.com/Xiao9905/AutoGLM/blob/main/static/papers/mobilerl_0820.pdf)

AgentRL: Reinforcing Multi-task LLM Agents From Zero (Upcoming)


免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。