当前位置: 首页 » 资讯 » 科技头条 » 正文

国内推理GPU独角兽曦望获超10亿元融资

IP属地 中国·北京 证券时报 时间:2026-04-20 21:08:40

4月20日,国内全栈自研AI推理GPU企业曦望(Sunrise)宣布完成新一轮超10亿元融资,本轮融资由多家产业方战投、地方国资及头部财务机构共同参与。据介绍,曦望本轮融资资金将主要用于新一代S3推理GPU的规模化量产交付、全栈软件生态建设,以及S4/S5后续芯片的研发迭代。

据介绍,曦望当前的团队规模已增长至400人,研发人员占比超80%,汇聚了来自英伟达、AMD、华为海思等国内外顶尖芯片企业的核心人才,硕士及以上学历占比超80%。团队融合了芯片设计、高性能计算、AI算法、软硬产品的跨行业人才。

与当前行业主流的“训推一体”路线不同,曦望从成立之日起就All-in推理赛道,以用户真实的Token成本、单位能耗和服务稳定性为芯片设计核心。目前,曦望已推进三代推理GPU迭代、数万颗GPU量产落地,实现了从芯片研发、产品量产到解决方案交付的完整闭环,并保持“芯片均实现一次性流片成功、流片后性能符合设计预期”的标准。

曦望董事长徐冰表示,当前AI算力基建的重心已彻底切换,2026年AI推理计算需求将达到训练需求的4-5倍,推理算力租赁价格半年涨幅近40%。

2026年1月,曦望正式发布新一代旗舰产品启望S3推理GPU,这是国内首款搭载LPDDR6且兼容LPDDR5X内存的推理GPU,该产品基于Agent推理的本质需求,从AICore计算架构到内存IO系统进行了全链路重构。S3专为大模型推理做原生深度定制,通过裁剪训练态所需的模块,将节省出的晶体管与功耗预算集中投向推理,让单位面积有效算力效率提升5倍以上,目标实现Token成本下降90%。

曦望表示,2026年公司将全力推进S3芯片量产交付,完成与国内外主流大模型、多模态模型和Agent框架的全面适配。同时,公司已完成S4高性能推理GPU和S5安全可控推理GPU的技术路线规划,持续加码近存计算、光电共封等前沿技术探索。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。