环球网
6月10日,由中国信息通信研究院云计算与数字化研究所、中国互联网协会算网云协同系统工作委员会举办的可信Token云服务研讨会在北京举办。大会聚焦 Token 云服务质量与价值衡量、产业协同与落地实践,同步发起 “Token 云服务提质赋能计划”。
现场,中国工程院郑纬民院士结合产业发展现状,深度解读Token 服务三层架构,并全面介绍由清程极智打造的AI Ping 一站式 Token 服务平台,为行业破解Token服务模型选型难、服务调度难、运维难等痛点,提供完整解决方案。
郑纬民称,随着大模型应用全面走向规模化落地,Token 服务已成为支撑人工智能产业发展的关键底座。整个行业不再局限于单一算力比拼,逐步形成分工明确、环环相扣的三层架构体系。
其中,底层生产层作为 AI 产能的核心环节,主要负责实现 Token “从无到有”,将物理算力资源转化为 Token 产出能力。这一层的竞争焦点集中在集群规模、服务稳定性、能耗控制以及模型适配效率,是整个 Token 服务体系的基础底座。
中层中转层定位为资源枢纽与连接器,核心作用是整合市面上分散的算力与模型资源,对外提供统一的 Token 接入通道。目前该环节大多以资源整合、流量分发为主,技术门槛相对较低,行业内卷现象较为突出,核心竞争集中在上游资源抢占与渠道运营。
顶层调度层这是 AI 基础设施的智能核心,也是技术壁垒最高的环节。依托专业评测能力与智能路由算法,实现 Token 价值最大化。该层级的竞争核心在于评测精度、路由调度效率以及跨基础设施的适配能力,同时也是引领整个行业标准制定、推动产业升级的关键。
据介绍,三层架构各司其职、环环相扣,理想的产业形态需要三层协同发力,才能让算力资源依托 Token 服务实现普惠落地。然而,产业规模持续壮大的同时,行业发展短板也逐步显现。服务体系统一标准缺位、各家服务商能力参差不齐等问题日渐凸显。
针对行业现存难题,清程极智打造的AI Ping 一站式 Token 服务平台,精准布局token服务顶层调度层,以全域信息汇总、科学评测、智能路由三大核心能力,串联整个 Token 服务链路。
在郑纬民看来,Token 服务三层架构是行业发展的必然形态,底层、中层、顶层唯有协同发展,才能释放 AI 产业的全部潜力。AI Ping 一站式 Token 服务平台立足顶层调度层,不止是评测工具与调用入口,更是串联整个产业的核心枢纽。
另外,清华大学翟季冬教授团队联合清程极智正式发布2026 年 5 月开源模型 Token 服务性能评测排行榜。本次评测覆盖 DeepSeek-V4-Pro、GLM-5.1、Kimi-K2.6、MiniMax-M2.7 四款主流开源模型。
对此,翟季冬表示:“Token 服务三层架构中,底层算力、中层资源整合能力最终都会体现在终端服务指标上。即便是同款模型,服务商的工程优化、集群调度、缓存策略等能力,都会直接影响延迟、吞吐、命中率等核心数据。在大规模、高并发的生产环境中,细微的性能差距都会被放大,直接影响用户体验与企业成本。本次发布的排行榜,不仅是对当前 Token 服务市场的一次全面摸底,更希望以标准化评测为抓手,引导底层、中转层服务商持续优化技术能力,同时为顶层调度层提供可靠的数据支撑,推动整个三层架构高效协同运转。”(青云)





京公网安备 11011402013531号