2月11日,智谱正式推出新一代旗舰模型GLM-5,主攻编程与智能体能力,官方称已实现开源领域最优表现。这是继DeepSeek后,国产AI大模型春节档的又一重要发布。
GLM-5参数规模由上一代的355B扩展至744B,激活参数从32B提升至40B。智谱方面证实,此前在全球模型服务平台OpenRouter登顶热度榜首的神秘模型“Pony Alpha”即为GLM-5。
内部评估显示,GLM-5在前端、后端、长程任务等编程开发场景中,平均性能较上一代提升超20%,真实编程体验逼近Claude Opus 4.5水平。该模型已上线chat.z.ai平台。此次发布标志着国产大模型在技术路径与能力表现上持续缩小与国际领先水平的差距,为开发者群体提供了新的开源选择。
参数规模翻倍 预训练数据大幅扩容
智谱新一代旗舰模型GLM-5在模型架构层面实现关键升级。参数规模由上一代355B(激活32B)扩展至744B(激活40B),预训练数据量从23T提升至28.5T,更大规模的算力投入驱动通用智能能力显著增强。
该模型首次引入DeepSeek稀疏注意力机制,在保持长文本处理效果无损的前提下,有效降低部署成本并提升Token利用效率。该技术路线与DeepSeek-V3/V3.2保持一致。
架构配置方面,GLM-5构建78层隐藏层,集成256个专家模块,每次激活8个,激活参数约44B,稀疏度5.9%,上下文窗口最高支持202K token。
编程能力显著提升
新一代旗舰模型GLM-5在内部Claude Code评估集中表现突出。前端、后端及长程任务等编程开发场景下,该模型较上一代GLM-4.7实现全面超越,平均性能提升逾20%。
GLM-5能够以极少人工干预,自主完成Agentic长程规划与执行、后端重构、深度调试等复杂系统工程任务。官方称,真实编程环境中的使用体感已逼近Claude Opus 4.5水平。
智谱将GLM-5定位为最新一代旗舰级对话、编程与智能体模型,重点强化其在复杂系统工程与长程Agent任务中的处理能力。
智能体能力实现开源最优表现
GLM-5在Agent能力上达成开源SOTA,多项评测基准中位列开源第一。在BrowseComp(联网检索与信息理解)、MCP-Atlas(大规模端到端工具调用)及τ2-Bench(复杂场景下自动代理工具规划与执行)三项测试中,GLM-5均取得最优表现。
为实现能力突破,该模型构建了全新的“Slime”训练框架,支持更大规模模型架构与更复杂的强化学习任务,显著提升强化学习后训练流程效率。
此外,智谱提出异步智能体强化学习算法,使模型具备从长程交互中持续学习的能力,有效激发预训练模型的深层潜力。该机制已成为GLM-5的核心技术特色之一。
国产大模型春节档密集发布
智谱清言GLM-5的发布,成为国产AI大模型春节档密集竞逐的最新注脚。同日晚间,Minimax亦上线Minimax 2.5,距离上一版本2.2发布仅间隔一个多月。
此轮发布潮已持续升温。DeepSeek此前已推出新模型,阿里千问的Qwen 3.5、字节跳动的SeeDance 2.0等产品也于近期相继亮相。多家厂商不约而同选择在春节窗口期集中推新,折射出国产大模型赛道竞争正进入白热化阶段。
目前GLM-5与Minimax 2.5的详细技术文档尚未完全披露,其实际性能表现仍有待开发者社区与专业机构的后续验证。





京公网安备 11011402013531号