
就在刚刚智谱终于推出了开源SOTA王炸模型GLM-4.5
看到智谱新模型GLM-4.5发布,非常开心,也替大家开心,自己开心因为我终于可以和大家聊一下我的看法和使用体验了,替大家开心是是因为这款模型一定会颠覆大家的想象,最近一个月大家的时间线应该被高强度刷屏了Grok 4,Kimi K2,ChatGPT Agent,Qwen3 coder ,那么接下来GLM-4.5表现会怎么样,我们拭目以待
说实话我已经憋了两天了,这次我很有幸拿到了内测资格,几乎没怎么休息,马不停蹄的测试,除了吃饭睡觉都在干活
体验地址:
智谱清言chatglm.cn和 Z.ai 免费体验满血版GLM-4.5
先来了个预告,我对GLM-4.5与三款(Kimi K2,Qwen3 coder,Claude sonnet4 )顶尖模型进行了头对头的的前端测试,还对Claude code 调用GLM-4.5进行了终端对比测试,GLM-4.5表现让我非常震惊,只能说那个曾经的国产大模型六小虎不仅回来了,而且一举达到巅峰,具体请看文章后续测试
GLM-4.5参数与性能表现
两个MoE架构型号,支持 thinking与 non-thinking两种工作模式:
GLM-4.5(总参数355B,激活32B),参数量仅为DeepSeek-R1 的 1/2、Kimi-K2 的 1/3
GLM-4.5-Air(总参数106B,激活12B)
GLM-4.5 在推理、代码、智能体综合能力(平均分)达到开源模型 SOTA 水平,首次在单个模型中实现了推理、代码、Agentic 等多能力原生融合,综合平均分,GLM-4.5 取得了全球模型第三、国产模型第一


SWE-Bench Verified表现非常凶残,相同规模下,GLM-4.5 系列实现了最佳性能

API 调用价格:输入 0.8 元/百万tokens、输出 2 元/百万tokens,远低于主流模型定价,生成速度高速版超过 100 tokens/秒,目前API 已上线开放平台 BigModel.cn,可以一键兼容 Claude Code 框架


一手测试
先声明一下,所有测试都是一次提示,没有经过任何二次提示修改,全程对GLM-4.5,Kimi k2, Qwen3 coder,Claude code sonnet 4进行头对头测试
GLM-4.5 前端测试
1.GLM-4.5生成互动宇宙弦
炫酷的数字艺术,测试模型复杂提示词遵循能力,先直接看最终效果:
自动播放
要求让GLM-4.5 扮演一位资深的前端开发者,同时也是一位热爱物理模拟和数据可视化的生成艺术家,创建一个名为“互动宇宙弦网 (Interactive Cosmic String Web)的数字艺术作品,实现双模式鼠标交互:
模式一:引力源 默认行为:鼠标在画布上移动时,它会成为一个引力中心。所有粒子都会受到一个朝向鼠标指针的微弱拉力,使它们优雅地向鼠标聚集,形成星云或星系的效果
模式二:斥力爆发 - 点击时触发:当用户在画布上单击鼠标时,会以鼠标点击点为中心,产生一个强大但短暂的斥力冲击波
这个冲击波会瞬间将所有粒子向外推开,模拟恒星爆炸的效果,然后粒子会慢慢恢复漂移和相互连接的状态
当我看到最终生成效果时,我整个人都是麻的,唯美,科幻,最重要的是GLM-4.5实现了所有功能,可以用鼠标交互,点击鼠标,宇宙弦会散开,随后又会在引力的作用下恢复到一个点,这完全完成了提示词的要求
下面我对GLM-4.5(右上),Kimi k2(左上), Qwen3 coder(右下),Claude code sonnet 4(左下)互动宇宙弦头对头测试过程,只有Qwen3 coder表现相对好一定,但是当不点鼠标时,粒子不会变为相互连接的状态,Kimi k2 生成的鼠标点不动,Claude code sonnet 4纯粹无法渲染
自动播放
给他们打个分,逻辑交互实现加美学完美得分10分,逻辑交互实现得7分,逻辑只实现部分,得2到5分,没有实现逻辑0分
这一轮测试得分如下:
GLM-4.5得10分,
Qwen3 coder得5分,
Kimi K2得3分,
Claude code sonnet 4得0分
完整提示词如下
角色扮演:
你是一位资深的前端开发者,同时也是一位热爱物理模拟和数据可视化的生成艺术家。
任务:
你的任务是使用纯原生 JavaScript 和 HTML Canvas,在一个单独的 HTML 文件中,创建一个名为**“互动宇宙弦网 (Interactive Cosmic String Web)”**的数字艺术作品
核心概念:
在黑暗的宇宙空间中,漂浮着许多发光的“星尘”粒子。当两个粒子足够接近时,它们之间会形成一道能量“弦”。用户可以通过鼠标与这个粒子网络进行互动,既可以像引力源一样吸引它们,也可以像超新星爆发一样将它们推开
详细需求:
场景初始化:
创建一个全屏的、纯黑色的 背景。
在画布上随机生成 100个“星尘”粒子(Node)。
每个粒子都具有随机的初始位置和微小的随机初始速度,让它们看起来像在空间中缓慢漂移
核心物理与视觉效果 - “弦”的连接:
这是作品的视觉核心。在每一帧动画中,遍历所有粒子对。
如果任意两个粒子之间的距离小于某个阈值(例如 150 像素),就在它们之间绘制一条线(即“弦”)。
关键视觉效果: 这条弦的不透明度 (opacity) 应该与粒子间的距离成反比。距离越近,弦越亮、越不透明;距离越远,弦越暗、越透明,直至在阈值距离处完全消失。这会创造出一种网络密度越高、区域越亮的视觉效果。
双模式鼠标交互:
模式一:引力源 (Gravity Well) - 默认行为:
鼠标在画布上移动时,它会成为一个引力中心。
所有粒子都会受到一个朝向鼠标指针的微弱拉力,使它们优雅地向鼠标聚集,形成星云或星系的效果。
模式二:斥力爆发 (Repulsive Burst) - 点击时触发:
当用户在画布上单击鼠标时,会以鼠标点击点为中心,产生一个强大但短暂的斥力“冲击波”。
这个冲击波会瞬间将所有粒子向外推开,模拟恒星爆炸的效果,然后粒子会慢慢恢复漂移和相互连接的状态。
美学与风格:
粒子(Nodes): 应该是小而明亮的白色圆点,并带有一点辉光 (glow) 效果,可以使用 context.shadowBlur 实现。
弦(Links): 应该是纤细的、半透明的白色线条,其透明度根据上述规则动态变化。
运动轨迹 (Motion Trail): 采用上一版成功的拖尾效果。每一帧不要完全清除画布,而是用一个低透明度的黑色矩形 (rgba(0, 0, 0, 0.1)) 覆盖,从而让移动的粒子和弦留下优雅的、如彗星般的轨迹。
技术约束:
单一文件: 所有代码(HTML, CSS, JavaScript)都必须在同一个 .html 文件中。
无外部库: 必须使用纯原生 Web API,禁止使用 p5.js、Three.js 或任何其他第三方库。
流畅性能: 动画循环必须使用 requestAnimationFrame 以确保平滑和高效。
请立即开始编写这个令人惊叹的互动艺术作品的完整代码
这一轮测试:GLM-4.5完胜
第一个测试我这里给出了完整的过程及提示词,以下几个例子我都只放最终效果以及点评得分(提示词太长不利于阅读,大家如果需要提示词可以后台私我)
2.GLM-4.5模拟弹力球塌方物理过程
要求模拟一个漂浮在空中的立方体弹力球一层一层塌方,塌方到桌子上弹起来,最后在重力的作用下静止
直接看GLM-4.5最终效果:
自动播放
自动播放
点评:GLM-4.5和Claude sonnet4完成度最好,k2渲染失败 和qwen则没有实现逻辑,总体来说GLM-4.5模拟最接近提示词的要求,桌子看起来更真实,按钮UI设计更丰富,综合表现GLM-4.5排第一,Claude sonnet4逻辑完全实现,只是在表现力上稍差
这一轮测试得分如下:
GLM-4.5得9分(第一层掉下来是没有弹起来),
Claude sonnet4得8分(弹力和桌子真实度表现力不够)
Qwen3 coder得2分
Kimi K2 得0分
3.GLM-4.5开发一款3D第三人称飞机飞行游戏
使用 Three.js 开发一款3D第三人称飞机飞行游戏,实现第三人称跟随视角,我的世界》(Minecraft) 风格的方块化美学,可控制飞机俯仰偏转,粒子效果:为飞机尾气添加简单的粒子效果
直接看效果:
自动播放
自动播放
点评:K2渲染失败,Claude 只有一帧画面卡住不动了,Qwen实现了完整的功能,但是UI界面缺乏WSAD,以及上下左右键偏转提示,GLM4.5功能及UI设计相对是最好的
本轮测试得分如下:
GLM4.5得10分
Qwen3 coder 得8分
Claude sonnet 4得1分
Kimi K2得分 0分
4.GLM-4.5生成个人网页
直接看效果:
自动播放
自动播放
点评:Qwen3 coder 渲染失败,Cladue code部分渲染成功,Kimi K2实现逻辑功能,但是网页部分图片加载失败,综合表现GLM-4.5排第一
本轮测试得分如下:
GLM4.5得10分
Kimi K2得8分
Claude sonnet 4得3分
Qwen3 coder得0分
综上得分统计如下:
Claude code 调用GLM-4.5 测试
智谱这次对GLM-4.5的API也进行了兼容,可以一键配置,在Claude code 里调用(注意提前安装好Claude code)
首先获取 API Key,前往智谱开放平台获取 API Key
https://open.bigmodel.cn/usercenter/proj-mgmt/apikeys
然后配置一下环境变量
export ANTHROPIC_BASE_URL=https://open.bigmodel.cn/api/anthropic
export ANTHROPIC_AUTH_TOKEN=你的 bigmodel API keys
我这里选择直接在.zshrc中写入,以后重复利用环境变量,由于我天天vibecoding,终端里有claude,qwen,kimi,gemini cli ,为了避免冲突,所以这样配置,就可以直接用zp开启了
alias zp='ANTHROPIC_BASE_URL=https://open.bigmodel.cn/api/anthropic ANTHROPIC_AUTH_TOKEN=你的 bigmodel API keys claude'
开测:这里选择用Kimi K2与 GLM-4.5做对比,如果一切设置正确,启动界面应该如下:

1爬虫制作epub电子书
提示:写一个爬虫抓取要求爬取Paul Graham所有文章为markdown格式,再打包制作成epub电子书
GLM-4.5驱动的Claude code 运行非常丝滑,只用了不到三分钟就写好了爬虫以及制作epub的代码,然后运行这个命令就可以一键完成电子书制作,这是制作好的电子书
自动播放
相比来说Kimi K2速度很慢,运行中间也不断报错,其实K2刚出来了,我用K2完成了这个任务,当时用了36分钟,这次测试中,GLM-4.5完整任务很久后我一直在等K2 ,可惜后续实在没耐心了,就放弃了
总体来说GLM-4.5在这个任务上表现非常好,唯一遗憾的是他需要我手动运行命令,才能完成成品
2制作财报一图流
提示:获取特斯拉最新财报,制作成炫酷的一图流,进行展示
直接看结果,Kimi k2用时8分钟做出了成品,效果展示,谈不上酷炫,但是完成了功能
自动播放
很遗憾的的是GLM-4.5没有完成任务,我看了一下原因,不是模型能力问题,应该是API的网络访问问题,我这里是可以正常访问互联网的,这个希望智谱官方解决一下

除了Claude code兼容以外,智谱也完美兼容Cline,Roo Code等主流代码智能体,最高100tokens/s闪电响应,成本很低
完整使用指南
国内用户:
https://docs.bigmodel.cn/cn/guide/develop/claude
国际用户:
https://docs.z.ai/scenario-example/develop-tools/claude
写在最后
这次拿到内测资格后,我对GLM-4.5进行了大量的测试,但总归是时间有限,只是抛砖引玉,可以说GLM-4.5表现和智谱所官宣的是基本一致的,看到国产一众开源模型,一个比一个好,一个接一个站在世界最顶尖的模型阵列,由衷的祝福,GLM-4.5的确是巅峰之作。