智谱推出原生Agent模型GLM-4.5：国产第一，开源SOTA“一手实测强到离谱”

IP属地中国·北京 编辑：胡颖 AI寒武纪 时间：2025-07-29 08:10:59

就在刚刚智谱终于推出了开源SOTA王炸模型GLM-4.5
看到智谱新模型GLM-4.5发布，非常开心，也替大家开心，自己开心因为我终于可以和大家聊一下我的看法和使用体验了，替大家开心是是因为这款模型一定会颠覆大家的想象，最近一个月大家的时间线应该被高强度刷屏了Grok 4，Kimi K2，ChatGPT Agent，Qwen3 coder ，那么接下来GLM-4.5表现会怎么样，我们拭目以待
说实话我已经憋了两天了，这次我很有幸拿到了内测资格，几乎没怎么休息，马不停蹄的测试，除了吃饭睡觉都在干活
体验地址：
智谱清言chatglm.cn和 Z.ai 免费体验满血版GLM-4.5
先来了个预告，我对GLM-4.5与三款（Kimi K2，Qwen3 coder，Claude sonnet4 ）顶尖模型进行了头对头的的前端测试，还对Claude code 调用GLM-4.5进行了终端对比测试，GLM-4.5表现让我非常震惊，只能说那个曾经的国产大模型六小虎不仅回来了，而且一举达到巅峰，具体请看文章后续测试
GLM-4.5参数与性能表现
两个MoE架构型号，支持 thinking与 non-thinking两种工作模式：
GLM-4.5（总参数355B，激活32B），参数量仅为DeepSeek-R1 的 1/2、Kimi-K2 的 1/3
GLM-4.5-Air（总参数106B，激活12B）
GLM-4.5 在推理、代码、智能体综合能力（平均分）达到开源模型 SOTA 水平，首次在单个模型中实现了推理、代码、Agentic 等多能力原生融合，综合平均分，GLM-4.5 取得了全球模型第三、国产模型第一
SWE-Bench Verified表现非常凶残，相同规模下，GLM-4.5 系列实现了最佳性能
API 调用价格：输入 0.8 元/百万tokens、输出 2 元/百万tokens，远低于主流模型定价，生成速度高速版超过 100 tokens/秒，目前API 已上线开放平台 BigModel.cn，可以一键兼容 Claude Code 框架
一手测试
先声明一下，所有测试都是一次提示，没有经过任何二次提示修改，全程对GLM-4.5，Kimi k2, Qwen3 coder，Claude code sonnet 4进行头对头测试
GLM-4.5 前端测试
1.GLM-4.5生成互动宇宙弦
炫酷的数字艺术，测试模型复杂提示词遵循能力，先直接看最终效果：
自动播放
要求让GLM-4.5 扮演一位资深的前端开发者，同时也是一位热爱物理模拟和数据可视化的生成艺术家，创建一个名为“互动宇宙弦网 (Interactive Cosmic String Web)的数字艺术作品，实现双模式鼠标交互：
模式一：引力源默认行为：鼠标在画布上移动时，它会成为一个引力中心。所有粒子都会受到一个朝向鼠标指针的微弱拉力，使它们优雅地向鼠标聚集，形成星云或星系的效果
模式二：斥力爆发 - 点击时触发：当用户在画布上单击鼠标时，会以鼠标点击点为中心，产生一个强大但短暂的斥力冲击波
这个冲击波会瞬间将所有粒子向外推开，模拟恒星爆炸的效果，然后粒子会慢慢恢复漂移和相互连接的状态
当我看到最终生成效果时，我整个人都是麻的，唯美，科幻，最重要的是GLM-4.5实现了所有功能，可以用鼠标交互，点击鼠标，宇宙弦会散开，随后又会在引力的作用下恢复到一个点，这完全完成了提示词的要求
下面我对GLM-4.5（右上），Kimi k2（左上）, Qwen3 coder（右下），Claude code sonnet 4（左下）互动宇宙弦头对头测试过程，只有Qwen3 coder表现相对好一定，但是当不点鼠标时，粒子不会变为相互连接的状态，Kimi k2 生成的鼠标点不动，Claude code sonnet 4纯粹无法渲染
自动播放
给他们打个分，逻辑交互实现加美学完美得分10分，逻辑交互实现得7分，逻辑只实现部分，得2到5分，没有实现逻辑0分
这一轮测试得分如下：
GLM-4.5得10分，
Qwen3 coder得5分，
Kimi K2得3分，
Claude code sonnet 4得0分
完整提示词如下
角色扮演：
你是一位资深的前端开发者，同时也是一位热爱物理模拟和数据可视化的生成艺术家。
任务：
你的任务是使用纯原生 JavaScript 和 HTML Canvas，在一个单独的 HTML 文件中，创建一个名为**“互动宇宙弦网 (Interactive Cosmic String Web)”**的数字艺术作品
核心概念：
在黑暗的宇宙空间中，漂浮着许多发光的“星尘”粒子。当两个粒子足够接近时，它们之间会形成一道能量“弦”。用户可以通过鼠标与这个粒子网络进行互动，既可以像引力源一样吸引它们，也可以像超新星爆发一样将它们推开
详细需求：
场景初始化：
创建一个全屏的、纯黑色的背景。
在画布上随机生成 100个“星尘”粒子（Node）。
每个粒子都具有随机的初始位置和微小的随机初始速度，让它们看起来像在空间中缓慢漂移
核心物理与视觉效果 - “弦”的连接：
这是作品的视觉核心。在每一帧动画中，遍历所有粒子对。
如果任意两个粒子之间的距离小于某个阈值（例如 150 像素），就在它们之间绘制一条线（即“弦”）。
关键视觉效果：这条弦的不透明度 (opacity) 应该与粒子间的距离成反比。距离越近，弦越亮、越不透明；距离越远，弦越暗、越透明，直至在阈值距离处完全消失。这会创造出一种网络密度越高、区域越亮的视觉效果。
双模式鼠标交互：
模式一：引力源 (Gravity Well) - 默认行为：
鼠标在画布上移动时，它会成为一个引力中心。
所有粒子都会受到一个朝向鼠标指针的微弱拉力，使它们优雅地向鼠标聚集，形成星云或星系的效果。
模式二：斥力爆发 (Repulsive Burst) - 点击时触发：
当用户在画布上单击鼠标时，会以鼠标点击点为中心，产生一个强大但短暂的斥力“冲击波”。
这个冲击波会瞬间将所有粒子向外推开，模拟恒星爆炸的效果，然后粒子会慢慢恢复漂移和相互连接的状态。
美学与风格：
粒子（Nodes）：应该是小而明亮的白色圆点，并带有一点辉光 (glow) 效果，可以使用 context.shadowBlur 实现。
弦（Links）：应该是纤细的、半透明的白色线条，其透明度根据上述规则动态变化。
运动轨迹 (Motion Trail)：采用上一版成功的拖尾效果。每一帧不要完全清除画布，而是用一个低透明度的黑色矩形 (rgba(0, 0, 0, 0.1)) 覆盖，从而让移动的粒子和弦留下优雅的、如彗星般的轨迹。
技术约束：
单一文件：所有代码（HTML, CSS, JavaScript）都必须在同一个 .html 文件中。
无外部库：必须使用纯原生 Web API，禁止使用 p5.js、Three.js 或任何其他第三方库。
流畅性能：动画循环必须使用 requestAnimationFrame 以确保平滑和高效。
请立即开始编写这个令人惊叹的互动艺术作品的完整代码
这一轮测试：GLM-4.5完胜
第一个测试我这里给出了完整的过程及提示词，以下几个例子我都只放最终效果以及点评得分（提示词太长不利于阅读，大家如果需要提示词可以后台私我）
2.GLM-4.5模拟弹力球塌方物理过程
要求模拟一个漂浮在空中的立方体弹力球一层一层塌方，塌方到桌子上弹起来，最后在重力的作用下静止
直接看GLM-4.5最终效果：
自动播放
头对头测试
自动播放
点评：GLM-4.5和Claude sonnet4完成度最好，k2渲染失败和qwen则没有实现逻辑，总体来说GLM-4.5模拟最接近提示词的要求，桌子看起来更真实，按钮UI设计更丰富，综合表现GLM-4.5排第一，Claude sonnet4逻辑完全实现，只是在表现力上稍差
这一轮测试得分如下：
GLM-4.5得9分（第一层掉下来是没有弹起来），
Claude sonnet4得8分（弹力和桌子真实度表现力不够）
Qwen3 coder得2分
Kimi K2 得0分
3.GLM-4.5开发一款3D第三人称飞机飞行游戏
使用 Three.js 开发一款3D第三人称飞机飞行游戏，实现第三人称跟随视角，我的世界》(Minecraft) 风格的方块化美学，可控制飞机俯仰偏转，粒子效果：为飞机尾气添加简单的粒子效果
直接看效果：
自动播放
头对头测试：
自动播放
点评：K2渲染失败，Claude 只有一帧画面卡住不动了，Qwen实现了完整的功能，但是UI界面缺乏WSAD，以及上下左右键偏转提示，GLM4.5功能及UI设计相对是最好的
本轮测试得分如下：
GLM4.5得10分
Qwen3 coder 得8分
Claude sonnet 4得1分
Kimi K2得分 0分
4.GLM-4.5生成个人网页
直接看效果：
自动播放
头对头测试：
自动播放
点评：Qwen3 coder 渲染失败，Cladue code部分渲染成功，Kimi K2实现逻辑功能，但是网页部分图片加载失败，综合表现GLM-4.5排第一
本轮测试得分如下：
GLM4.5得10分
Kimi K2得8分
Claude sonnet 4得3分
Qwen3 coder得0分
综上得分统计如下：
Claude code 调用GLM-4.5 测试
智谱这次对GLM-4.5的API也进行了兼容，可以一键配置，在Claude code 里调用（注意提前安装好Claude code）
首先获取 API Key，前往智谱开放平台获取 API Key
https://open.bigmodel.cn/usercenter/proj-mgmt/apikeys
然后配置一下环境变量
export ANTHROPIC_BASE_URL=https://open.bigmodel.cn/api/anthropic
export ANTHROPIC_AUTH_TOKEN=你的 bigmodel API keys
我这里选择直接在.zshrc中写入，以后重复利用环境变量，由于我天天vibecoding，终端里有claude，qwen，kimi，gemini cli ，为了避免冲突，所以这样配置，就可以直接用zp开启了
alias zp='ANTHROPIC_BASE_URL=https://open.bigmodel.cn/api/anthropic ANTHROPIC_AUTH_TOKEN=你的 bigmodel API keys claude'
开测：这里选择用Kimi K2与 GLM-4.5做对比，如果一切设置正确，启动界面应该如下：
1爬虫制作epub电子书
提示：写一个爬虫抓取要求爬取Paul Graham所有文章为markdown格式，再打包制作成epub电子书
GLM-4.5驱动的Claude code 运行非常丝滑，只用了不到三分钟就写好了爬虫以及制作epub的代码，然后运行这个命令就可以一键完成电子书制作，这是制作好的电子书
自动播放
相比来说Kimi K2速度很慢，运行中间也不断报错，其实K2刚出来了，我用K2完成了这个任务，当时用了36分钟，这次测试中，GLM-4.5完整任务很久后我一直在等K2 ，可惜后续实在没耐心了，就放弃了
总体来说GLM-4.5在这个任务上表现非常好，唯一遗憾的是他需要我手动运行命令，才能完成成品
2制作财报一图流
提示：获取特斯拉最新财报，制作成炫酷的一图流，进行展示
直接看结果，Kimi k2用时8分钟做出了成品，效果展示，谈不上酷炫，但是完成了功能
自动播放
很遗憾的的是GLM-4.5没有完成任务，我看了一下原因，不是模型能力问题，应该是API的网络访问问题，我这里是可以正常访问互联网的，这个希望智谱官方解决一下
除了Claude code兼容以外，智谱也完美兼容Cline，Roo Code等主流代码智能体，最高100tokens/s闪电响应，成本很低
完整使用指南
国内用户：
https://docs.bigmodel.cn/cn/guide/develop/claude
国际用户：
https://docs.z.ai/scenario-example/develop-tools/claude
写在最后
这次拿到内测资格后，我对GLM-4.5进行了大量的测试，但总归是时间有限，只是抛砖引玉，可以说GLM-4.5表现和智谱所官宣的是基本一致的，看到国产一众开源模型，一个比一个好，一个接一个站在世界最顶尖的模型阵列，由衷的祝福，GLM-4.5的确是巅峰之作。

标签：模型鼠标粒子效果智谱性能原生 透明度 核心大家 艺术作品 物理模式飞机数字 视觉效果 塌方弹力美学国产开源距离 双模式 网页对头白色中心黑色画布命令线条时

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

意念控制将如何改变生活？从全球首位脑机接口再就业者说开去

AppGallery Awards 2025发布，Z世代的生活方式都藏在这里

架构重组、引入OpenAI顶尖人才腾讯的AI战略要变了？

比亚迪拥抱鸿蒙生态，申请加入全球智慧物联网联盟

意念控制将如何改变生活？从全球首位脑机接口再就业者说开去|科创观察员

四中全会精神在基层|大山深处，数据标注员越来越多

全站最新

意念控制将如何改变生活？从全球首位脑机接口再就业者说开去

AppGallery Awards 2025发布，Z世代的生活方式都藏在这里

架构重组、引入OpenAI顶尖人才腾讯的AI战略要变了？

比亚迪拥抱鸿蒙生态，申请加入全球智慧物联网联盟

热门推荐

银行间市场数据报告库成立，风险监测添“利器”

良品铺子股权僵局突现“解套”信号：广州轻工放弃控股诉求，转向索赔2073万

苹果最强游戏机！全新iPad mini将搭载A20 Pro

意念控制将如何改变生活？从全球首位脑机接口再就业者说开去

AppGallery Awards 2025发布，Z世代的生活方式都藏在这里

架构重组、引入OpenAI顶尖人才腾讯的AI战略要变了？

比亚迪拥抱鸿蒙生态，申请加入全球智慧物联网联盟

意念控制将如何改变生活？从全球首位脑机接口再就业者说开去|科创观察员

四中全会精神在基层|大山深处，数据标注员越来越多

产业结构不断优化四川汽车产量重回百万辆量级

“天才少女”罗福莉走向台前

蒲慕明院士“灵魂拷问”：脑机接口何时能出DeepSeek式团队

“十五五”目标@奋斗者｜发展新质生产力培育壮大新动能

帮助高位截瘫患者稳定操控智能轮椅与机器狗我国侵入式脑机接口技术迎来新突破

前OpenAI研究员姚顺雨加盟腾讯：任首席AI科学家向刘炽平汇报