当前位置: 首页 » 资讯 » 科技头条 » 正文

上海基模+1!阶跃星辰开源最新模型,华为、沐曦、壁仞等国产芯片已适配

IP属地 中国·北京 上观新闻 时间:2026-02-03 00:10:23



2月2日,阶跃星辰发布并开源最新基座模型Step 3.5 Flash,采用了稀疏混合专家(MoE)架构,总参数量达1960亿,最高推理速度可达每秒350个词元。值得一提的是,这款新模型实现了与华为昇腾、沐曦股份、壁仞科技等多家头部国产芯片的适配。

随着AI智能体成为业内主流发展趋势,AI开发从单纯的提示词工程逐渐转向智能体的构建,不过问题也随之而来:尽管底层模型强大,但在规模化场景下往往不够稳定、响应慢、成本高。

为此,阶跃新模型进行了专项优化,在单请求代码类任务上,最高推理速度可达每秒350个词元,可满足多步推理中的低延迟响应需求。同时,依托混合专家架构,每个词元的激活参数也随之降低,显著提升模型在复杂智能体工作流中的响应速度,实现推理能力和运营效率的平衡。


阶跃星辰新模型的性能表现亮眼。

据阶跃星辰披露,在国际多款主流针对智能体能力的测试中,新模型成绩亮眼,特别是在智能体场景和数学任务上具备较强竞争力,已具备支持企业级应用落地能力。

与此同时,由阶跃星辰牵头发起的“模芯生态创新联盟”取得阶段性进展,模型、芯片与平台的协同进入深化落地阶段。

目前,多家头部国产芯片厂商第一时间完成适配。新模型发布即实现与华为昇腾、沐曦股份、壁仞科技、燧原科技、天数智芯、阿里平头哥等多家头部芯片的适配,标志着“模芯协同”生态进入新阶段。

去年7月,阶跃星辰联合近10家芯片及基础设施厂商,共同发起“模芯生态创新联盟”,旨在打通芯片、模型与平台之间的技术壁垒,通过底层联合创新提升模型适配性和算力利用效率,为企业和开发者提供更加高效、易用的大模型解决方案。

“这一进展有助于推动模型与算力的深度协同发展,有效降低推理成本,降低企业和开发者在应用大模型时的综合门槛,加快大模型在实际应用场景中的落地。”阶跃星辰相关负责人表示。

据悉,阶跃星辰已启动新一代模型Step 4的训练工作,将邀请开发者深度参与共建,共同定义下一代智能体基座模型。

原标题:《上海基模+1!阶跃星辰开源最新模型,华为、沐曦、壁仞等国产芯片已适配》

栏目主编:李晔

本文作者:解放日报 查睿

题图上观题图

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。