智谱发布GLM-5.1高速版API，刷新全球大模型API速度纪录

IP属地中国·北京 编辑：格隆汇格隆汇 时间：2026-05-22 21:08:48

智谱近日推出GLM-5.1高速版API“GLM-5.1-highspeed”，其模型输出速度达到400 tokens/s，刷新了当前全球大模型厂商API的速度上限。
长期以来，高速模型几乎总是轻量级模型，但GLM-5.1高速版打破了这一行业惯例。它首次在国产大模型中，将旗舰级能力与极致低延迟同时带入生产环境，用户无需再为响应速度牺牲模型质量。
实测显示，在AI编程场景中，写代码仿佛开启了10倍速，模型能够一边理解工程上下文，一边持续生成代码与修改方案；在3D游戏中，玩家控制一个角色在3D地图里移动并输入文字，模型会根据输入的文字瞬时建模，场景实时改变，此前因延迟而无法实现的全新产品形态，开始真正具备落地可能；在交互界面上，在用户提出需求的那一刻，模型可以即时生成恰好匹配该需求的工具与交互，甚至可以做出意图判断。
实现这一速度的核心是TileRT高性能推理引擎。该引擎由智谱GLM团队与TileRT团队联合打造，在推理引擎、调度系统与底层基础设施三个层面进行了系统级优化。其设计思路是彻底抛弃Runtime层的动态调度，在编译期（AOT）将整个计算图静态编排为一个常驻GPU的persistent Engine Kernel。
目前，GLM-5.1高速版适用于AI编程、实时交互、商业决策、实时语音等速度敏感场景，并通过智谱MaaS平台向部分企业客户开放。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

全站最新

阿里云王坚：对AI理解科学的想象，还局限在人类写出来的知识里

智元精灵G2 Max人形机器人发布，将应用于京东物流智狼仓

企业级Agent落地生产困境何解？评估先行成破局关键密码

高德问店上线：AI赋能商户，一站式解决选址经营难题获用户好评

热门推荐

靠“肛需”狂赚5.8亿，一年卖出2亿支：邪修马应龙，还能在舒适区呆多久？

上海银行要苦苦追回的，不仅是宝能系的债丨正经深度

财富链(00616.HK)：预计年度综合亏损净额将大幅收窄至不多于8000万港元

腾讯控股(00700.HK)6月22日耗资5亿港元回购115.4万股

15个“超人”，重塑美元大脑？

ST文峰及控股股东被证监会立案调查

深夜连发3份公告：澜起科技怎么了？

突然爆雷！美股巨头，直线跳水！发生了什么？

连连数字(02598.HK)6月22日耗资116.4万港元回购25.55万股

碧桂园服务(06098.HK)6月22日耗资427.74万港元回购81.7万股

时代锐评|“猴茅”跌停，“猴热”退烧，一场炒作的“猴戏”终于散场

央行罕见亮“红牌”！酷宝支付注册资本变更被驳回，年底牌照续展能否顺利进行？

*ST明德(002932.SZ)：累计回购4.06%股份回购股份的实施期限届满

山东黄金(600547.SH)：副董事长刘钦辞职

根植燕辽文脉，拥抱京津冀大势：辽西振兴的时代新路径