超越Grok、Gemini，阶跃星辰开源语音模型登顶全球榜首

IP属地中国·北京 澎湃新闻 时间：2026-01-15 16:18:29

当地时间1月14日，据大模型评测榜单Artificial Analysis Speech Reasoning最新结果，中国大模型企业阶跃星辰的原生音频推理模型Step-Audio-R1.1登顶，超越Grok、Gemini、GPT-Realtime等。
该榜单是目前业界评估“原生语音模型”最权威的第三方基准之一，核心考量模型直接处理音频并进行复杂逻辑推理的能力，考察维度包括准确率、首包延迟等。

去年11月，阶跃星辰发布了Step-Audio-R1，可以在不增加额外时延的情况下，端到端理解语音内容。此次发布的Step-Audio-R1.1是R1的升级版，基于推理能力，R1.1不仅能准确识别声音，还可以捕捉到声音背后的情绪和心理状态、言外之意，并能基于环境音推导对物理世界的理解。
目前，阶跃星辰已开源该模型，chat模式也已搭载该模型核心，完整的实时语音API预计将于 2 月上线。（澎湃新闻记者秦盛）

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

图灵奖得主霍普克罗夫特：各国需要制定战略应对AI革命，培养人才是最佳战略

WAIC 2026｜智平方类脑大模型及通用机器人亮相，已落地半导体制造与零售场景

企业微信【群推广码】是什么意思？如何统计每个员工的引流数量？

这才是A股接下来的真剧本

特斯拉推出平衡车，售价1524元！

问界M9续航测试遭质疑，韩路：不可能直播造假，翻车成本极高

全站最新

图灵奖得主霍普克罗夫特：各国需要制定战略应对AI革命，培养人才是最佳战略

WAIC 2026｜智平方类脑大模型及通用机器人亮相，已落地半导体制造与零售场景

企业微信【群推广码】是什么意思？如何统计每个员工的引流数量？

这才是A股接下来的真剧本

热门推荐

Q2手机市场：华为三星苹果吃肉，OPPO小米vivo挨打

最近，投资人都在研究给机器人“喂饭”

卡萨帝守擂、COLMO追赶、三星退场：五大高端家电，谁能笑到最后？

阶跃星辰造手机：一场逻辑自洽但风险极高的豪赌

段永平“左手茅台，右手泡泡玛特”，消费股的春天来了？

港股汽车板块估值分化，定价逻辑是什么？

靠“炒冷饭”冲30亿！《功夫女足》越骂越火，背后24家资本赢麻了

物理AI底座战争：美国公司General Intuition用游戏录像训练机器人

风中有朵Token做的云

一加退出欧美，realme退出国内：OPPO折叠十三年全球版图

中国商业航天2026中场战事：半年融资151亿、15家企业冲IPO

图灵奖得主霍普克罗夫特：各国需要制定战略应对AI革命，培养人才是最佳战略

文远知行发布物理AI认知基础大模型WIIT，构建真实世界理解框架

影视飓风49元AI课一夜售出10万份，单日营收近500万

WAIC 2026｜智平方类脑大模型及通用机器人亮相，已落地半导体制造与零售场景