当前位置: 首页 » 资讯 » 科技头条 » 正文

智谱 GLM-5 意外“泄露”?复用 DeepSeek 架构性能炸裂,市值狂飙 200% 坐稳国产 AI 顶流

IP属地 中国·北京 编辑:顾雨柔 Chinaz 时间:2026-02-11 10:34:00

国产大模型赛道在2026年春节期间爆点频出。继 DeepSeek 成为现象级产品后,智谱 AI 的新一代大模型 GLM-5 也揭开了神秘面纱。 这一动作直接引爆资本市场,智谱股价近期大涨 200%,总市值冲至1500亿港币,达 IPO 时的3倍之多。

马甲曝光:神秘模型“Pony Alpha”即为 GLM-5

前几日,全球模型服务平台 OpenRouter 上出现了一款代号为 “Pony Alpha” 的匿名模型,因其代码编写能力直逼 Claude Opus 而引发全球热议。

身份确认:该模型的系统提示词自曝为 GLM 身份。

“指纹”识别:网友通过验证 GLM 家族特有的逻辑 Bug(如输入“锅内倒入植物油烧热”得到特定异常答案),几乎可以断定其归属。

核心黑科技:复用 DeepSeek 架构,参数翻倍

GLM-5在技术路线上选择了与DeepSeek-V3相同的稀疏注意力架构 (DSA),这被视为一种极具性价比的演进策略。

规模跨越:总参数量高达 745B,是前代 GLM-4.7的2倍。

计算效率:拥有256个专家,每次激活8个(约44B 激活参数),稀疏度仅为5.9%。

长文本与多模态:支持最高 202K token 的上下文窗口。 同时,针对2026年的市场需求,GLM-5强化了视频理解等多模态能力,补齐了此前DeepSeek纯文本架构的短板。

行业影响:部署门槛进一步降低

由于采用了 DSA 架构,GLM-5可以直接复用 vLLM、SGLang 等主流推理框架的现有优化方案。 这意味着企业级用户在部署该模型时,技术门槛和算力成本将大幅降低。

在国产 AI “偷家”海外大模型的浪潮中,智谱凭借 GLM-5的强悍表现,再次证明了其在模型性能与工程实现上的顶尖实力。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。