智谱 GLM-5 意外“泄露”？复用 DeepSeek 架构性能炸裂，市值狂飙 200% 坐稳国产 AI 顶流

IP属地中国·北京 编辑：顾雨柔 Chinaz 时间：2026-02-11 10:34:00

国产大模型赛道在2026年春节期间爆点频出。继 DeepSeek 成为现象级产品后，智谱 AI 的新一代大模型 GLM-5 也揭开了神秘面纱。这一动作直接引爆资本市场，智谱股价近期大涨 200%，总市值冲至1500亿港币，达 IPO 时的3倍之多。
马甲曝光:神秘模型“Pony Alpha”即为 GLM-5
前几日，全球模型服务平台 OpenRouter 上出现了一款代号为 “Pony Alpha” 的匿名模型，因其代码编写能力直逼 Claude Opus 而引发全球热议。
身份确认:该模型的系统提示词自曝为 GLM 身份。
“指纹”识别:网友通过验证 GLM 家族特有的逻辑 Bug（如输入“锅内倒入植物油烧热”得到特定异常答案），几乎可以断定其归属。
核心黑科技:复用 DeepSeek 架构，参数翻倍
GLM-5在技术路线上选择了与DeepSeek-V3相同的稀疏注意力架构（DSA），这被视为一种极具性价比的演进策略。
规模跨越:总参数量高达 745B，是前代 GLM-4.7的2倍。
计算效率:拥有256个专家，每次激活8个（约44B 激活参数），稀疏度仅为5.9%。
长文本与多模态:支持最高 202K token 的上下文窗口。同时，针对2026年的市场需求，GLM-5强化了视频理解等多模态能力，补齐了此前DeepSeek纯文本架构的短板。
行业影响:部署门槛进一步降低
由于采用了 DSA 架构，GLM-5可以直接复用 vLLM、SGLang 等主流推理框架的现有优化方案。这意味着企业级用户在部署该模型时，技术门槛和算力成本将大幅降低。
在国产 AI “偷家”海外大模型的浪潮中，智谱凭借 GLM-5的强悍表现，再次证明了其在模型性能与工程实现上的顶尖实力。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

裁员12万还不够？美科技白领与AI展开生存赛，学者建议缩短周工时保就业

老外实测特朗普T1手机：软硬件均有明显短板

OpenAI为何打算推迟IPO？

苹果游说美政府放行长鑫DRAM供应分析师称难以缓解涨价与供给

正面硬刚iPhone 18 Pro！华为Mate 90系列9月发布：首发麒麟2026+鸿蒙7

“劫持式”开屏广告，又回来了？

全站最新

裁员12万还不够？美科技白领与AI展开生存赛，学者建议缩短周工时保就业

老外实测特朗普T1手机：软硬件均有明显短板

OpenAI为何打算推迟IPO？

苹果游说美政府放行长鑫DRAM供应分析师称难以缓解涨价与供给

热门推荐

裁员12万还不够？美科技白领与AI展开生存赛，学者建议缩短周工时保就业

美国拟解禁Anthropic旗下AI模型Fable 5，公众访问最早本周恢复

老外实测特朗普T1手机：软硬件均有明显短板

OpenAI为何打算推迟IPO？

苹果游说美政府放行长鑫DRAM供应分析师称难以缓解涨价与供给

正面硬刚iPhone 18 Pro！华为Mate 90系列9月发布：首发麒麟2026+鸿蒙7

“劫持式”开屏广告，又回来了？

小鹏MONA L03定档7月2日中国首秀，实车预计自7月1日起到店

厦门国升产业链创新基金登记成立出资额10亿

广州华立学院“特殊规定”：小米汽车被拒之门外其他车辆预约即入

岚图追光S纯电轿跑SUV登场，华为智驾赋能，与小米YU7错位竞争展实力

7家车企完成首轮强制ESG信披，精细化提质转型成为改进方向

打破两个全球纪录，智元第1.5万台机器人下线，6天直播成功率99.99%

重要突破、再添里程碑！上周末，我国多领域成果密集“上新”

每天1300部AI短剧上线投流成本持续攀升“堆量”难以为继