环球网
近日,清程极智团队对外系统介绍了以赤兔推理引擎、AI Ping评测路由平台、八卦炉智能软件栈为核心的全链路Token解决方案。清程极智围绕大模型推理降本、国产算力生态适配、Token服务质量与性价比三大行业关键痛点,集中展示多项核心技术突破与规模化落地成果,以技术创新推动中国AI产业从“能用”迈向好用、省钱、自主可控的新阶段。
资料显示,清程极智成立于2023年12月,核心团队来自清华大学计算机系高性能计算所,已完成天使轮、PreA、PreA+三轮融资,获得中科创星、中金资本、考拉基金、联想创投、中关村科学城公司等多家投资机构加持,是国内专注AI基础设施(AI Infra)的标杆企业,致力于打造一站式全链路Token解决方案。
当前,全球 AI 产业已进入规模化落地的关键阶段,Token 成为 AI 时代的 “水电煤”,是大模型服务与智能应用的核心生产要素。数据显示,2024 年初至 2026 年 3 月,中国 Token 日均调用量激增约1400 倍,规模突破140 万亿。伴随 Agent 智能体、多模态应用快速普及,Token 正从交互用量转向生产用量,直接推动产业对推理效率、部署成本、服务稳定性的要求持续攀升。
![]()
在 Token 需求爆发的同时,国产算力与国产模型迎来高速发展,但二者之间的推理环节却长期依赖海外引擎,难以充分释放国产硬件性能;而 Token 服务市场也面临乱、贵、慢、选型难等突出问题,供需错位、成本高企、体验不一,成为制约 AI 技术普惠化、规模化落地的核心瓶颈。
针对大模型部署成本高、国产算力适配不足的痛点,清程极智推出赤兔推理引擎。作为完全自主研发的国产推理引擎,赤兔打破海外技术垄断,构建“国产算力+国产引擎+国产模型”全国产化闭环,针对昇腾、海光、沐曦、摩尔线程等国产芯片的硬件特性深度优化,实现标量向量计算、数据表达、硬件调度、卡间互联的全维度适配,解决国产算力“能用不好用”的难题。
在性能与成本上,赤兔推理引擎实现突破性提升:通过软件方案在不具备FP4/FP8硬件能力的算力设备上支持FP4/FP8低位宽浮点数量化,使用FP8量化可降低50%算力门槛,FP4量化可降低75%算力门槛;同样使用浮点数计算部署DeepSeek‑V3满血版模型时,仅需1台8卡910B服务器即可替代传统4台8卡机,硬件成本从600万元降至150万元。目前,赤兔已在券商、能源央企等场景落地应用,某能源央企实现3500+员工全国产化算力稳定使用,算力效率提升近40%,相关案例荣获2025人工智能应用大赛铜奖。
面对Token服务市场服务商林立、指标混乱、选型成本高的行业乱象,清程极智打造AI Ping一站式大模型服务评测与API智能路由平台,成为国内首个集“服务汇总、客观评测、智能路由”于一体的Token服务枢纽。平台已接入30余家主流服务商、600余个大模型服务,覆盖文本、图片、视频等全场景;通过7×24小时多地域分布式监测,实时输出延迟、吞吐、可靠性、价格等核心指标,数据真实可核验;依托智能路由算法,以统一API接口为用户自动匹配最优服务商,实现成本降低超37%、吞吐提升超90%、延迟降低超20%,让开发者“一键调用、省心省钱”,专注业务创新。
此外,清程极智还推出八卦炉智能软件栈,面向大模型训练、微调场景提供高效Token生产与智能调度能力,与赤兔推理引擎、AI Ping平台形成协同,覆盖AI“训练‑推理‑应用”全流程,构建完整的AI基础设施生态。
对此,清程极智相关负责人表示,公司将持续深耕AI基础设施领域,坚持核心技术自主可控,不断迭代赤兔推理引擎对国产芯片的适配能力,完善AI Ping评测与路由服务,联动国产算力、国产模型、行业应用等产业链伙伴,打造高效、普惠、安全的国产AI基础设施体系,响应国家“人工智能+”行动,以技术创新推动中国AI产业高质量发展。





京公网安备 11011402013531号