当前位置: 首页 » 资讯 » 科技头条 » 正文

智谱发布GLM-5. 1 高速版:400 tokens/s飙出全球API新极限

IP属地 中国·北京 编辑:顾雨柔 Chinaz 时间:2026-05-22 16:28:19

5月22日,智谱(02513.HK)在资本市场与技术端同步引爆行业。伴随其港股盘中一度飙升超22%、市值站稳4500亿港元关口,智谱官方正式面向企业客户上线了重磅新品——GLM-5.1高速版 API(GLM-5.1-highspeed)。

该模型在保留旗舰大模型完整基座能力的前提下,实测输出速度达到了惊人的 400tokens/s(每秒输出400个标记),一举刷新了当前全球大模型厂商官方 API 的速度上限。这一速度意味着:一位创作者连续伏案数天才能码出的文字量,它在1分钟内便能交付完毕;原本需要工程师敲键盘3天的系统重构任务,它在一杯咖啡的时间里就能彻底跑完。

核心看点:

打破惯例: 过去行业普遍默认“快意味着模型小/轻量级”,智谱首次在国产大模型中实现了**“旗舰级全尺寸能力”与“极致低延迟”**的完美并存。

硬核战绩: 输出速度达400tokens/s,支持 200K 超长上下文窗口,最大单次输出达128K 标记。

底层黑科技: 由智谱 GLM 团队与 TileRT 团队深度联合打造,重构了系统级推理生态。

定向公测: 现已通过智谱 MaaS(大模型即服务)开放平台向部分特定企业客户定向开放。

“即问即答”有多爽?对速度敏感型场景的“降维打击”

在过去的一年里,国内大模型的 Coding(编程)和 Agent(智能体)协作能力突飞猛进,但“速度”始终是长链路、高频交互任务下的核心瓶颈。智谱官方指出,大模型从“工具”演变为“实时伙伴”,400tokens/s 的体感是颠覆性的:

AI 编程(Coding Agent): 传统的智能体编程往往需要经历几十轮的跨文件调用与长文本对齐。单轮响应若卡顿几秒,整体任务就会拉长到十几分钟。在高速版加持下,写代码如同开启10倍速,函数、接口与底层调用链随着用户键盘敲击同步瞬时展开,大型工程重构无需任何空等。

实时交互与3D游戏: 极低延迟让模型能够完美胜任游戏世界内的实时动态生成、网页 UI 的即时构建,能够跟随用户的连续输入,毫无滞后地改变系统状态与界面反馈。

商业决策集群: 在多智能体(Multi-Agent)并行推演、实时大数据分析场景下,高速版支持“30秒内完成复杂网页 Agent 集群的多人格并行应答”,大幅拉高了高频量化与推演的效率天花板。

无缝实时语音: 在 AI 陪练、智能客服场景中,极速响应能让语音识别(ASR)到合成(TTS)的链路延迟无限趋近于零,带来真正对等、自然的人类对话流。

拆解三层黑科技:400tokens/s 是如何炼成的?

这一全球速度纪录的诞生,核心在于智谱 GLM 团队与 TileRT 团队 联合打造的系统级工程优化。400tokens/s 不是一个好看的“瞬间峰值”,而是一个稳定可用的生产级能力,其底层优化逻辑分为三个层面:

[基础设施层:集群/负载均衡协同]──►[调度系统层:动态批处理&KVCache调度]──►[推理引擎层:TileRT架构重写核心路径]──►400tokens/s稳定输出

推理引擎层(TileRT 深度定制): 针对 GLM-5.1独有的网络架构特点,团队彻底重写了最核心的推理路径与底层算子,让单张显卡(GPU)的吞吐能力和硬件执行效率逼近物理极限。

调度系统层(智能合并): 引入了极为激进的动态批处理(Dynamic Batching)、请求合并技术以及颠覆性的 KV 缓存(KV Cache)调度优化,彻底解决了高并发、多用户调用状态下,传统模型极易出现的拖尾延迟(Tail Latency)现象。

基础设施层(集群协同): 围绕推理集群的组网部署、网络链路拓扑以及超高频负载均衡进行了全方位的硬件级协同调优,确保算力在整条流水线上无损传递。

行业重估:AI 下半场是“价值与时间”的清算

正如瑞银等国际顶级分析机构近期在港股科技论坛上所强调的:这一轮 AI 驱动的行业重估,与移动互联网时代的“流量与时长变现”本质不同。AI 的收费和生存哲学,不是为了把用户耗在软件里,而是“帮用户和企业省时间、提效率,并从创造的实际价值中进行分账”。

智谱 GLM-5.1高速版的推出,完美踩在了这个逻辑的痛点上。它通过将单次 Token 的产出成本与时间成本压缩到原来的数分之一,让企业在部署高频多 Agent 系统时,不再需要在“要高智能(选大模型却很慢)”和“要速度(选小模型却很笨)”之间做痛苦的妥协。

随着智谱在 MaaS 平台上的定向铺开,这一低延迟、高智能的“生产级 AI 能力”,无疑将加速国内软件生态、自动化编程及游戏产业向全面“Agentic(智能体化)”时代的迭代升级。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。