当前位置: 首页 » 资讯 » 科技头条 » 正文

智谱推出GLM-5.1高速版:400 tokens/s 30秒生存成复杂网页代码

IP属地 中国·北京 编辑:陈丽 凤凰网科技 时间:2026-05-22 12:11:56

5月22日,智谱宣布面向部分企业客户推出GLM-5.1高速版API“GLM-5.1-highspeed”,模型输出速度达到400 tokens/s。智谱称,这一速度刷新了当前全球大模型厂商API的速度上限。

该模型基于旗舰级GLM-5.1能力开发,打破了此前“高速模型几乎总是轻量级模型”的行业惯例,首次在国产大模型中实现旗舰级能力与极致低延迟的兼顾。

高速版由智谱GLM团队与TileRT团队联合打造,通过推理引擎、调度系统与底层基础设施的系统级优化实现。据演示,在长程任务中,模型可在30秒内完成复杂网页的代码生成;在Agent Swarm场景下,可瞬间调度50个不同人格并行回答。

该API适用于AI编程、实时交互、商业决策、实时语音等对延迟敏感的场景,目前已向智谱MaaS平台部分企业客户开放。

标签: 模型 智谱 网页 系统 调度 代码 部分 企业 速度 底层 基础设施 语音 商业 决策 客户 惯例 厂商 全球 面向 平台 科技 凤凰网 团队 长程 任务 行业 国产 引擎 人格 能力 代码生成

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。