能听懂人类“弦外之音”，阶跃星辰再开源端到端语音大模型

IP属地中国·北京 编辑：顾雨柔澎湃新闻 时间：2025-09-01 14:26:48

9月 1 日，“多模态卷王”阶跃星辰正式发布开源端到端语音大模型Step-Audio 2 mini，在多个国际基准测试集上取得SOTA（State-of-The-Art，当前最佳水平）成绩，在大部分任务上超越GPT-4o-audio。
技术层面，Step-Audio 2 mini采用了端到端多模态架构，将语音理解、音频推理与生成统一建模，时延更低、输出更快，还能更加精准地理解副语言信息、非人声信号等语音要素。Step-Audio 2 mini首创的音频推理能力，能对情绪、语调、音乐等副语言和非语音信号进行精细理解、推理并自然回应。
同时，该模型支持语音原生的Tool Calling能力可实现联网搜索等操作，有效解决幻觉问题，并让语音模型具有知识储备和推理能力。
目前，Step-Audio 2 mini已在GitHub、Hugging Face等平台发布。（澎湃新闻记者秦盛）

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

五载星途再启航！上海天文馆五周年嘉年华邀你共赴宇宙探索盛宴

70岁的他倒在深夜，留下两座“国之重器”和一支能打硬仗的队伍

Kimi回应马斯克喊话：希望他们出来跟我们掰一掰手腕

独家｜阿里将推出千问办公，旗下三款智能体合并

“Scaling Law要把硬件加进来”，京东给物理AI算了另一笔账

月之暗面回应马斯克：欢迎掰手腕

全站最新

五载星途再启航！上海天文馆五周年嘉年华邀你共赴宇宙探索盛宴

70岁的他倒在深夜，留下两座“国之重器”和一支能打硬仗的队伍

Kimi回应马斯克喊话：希望他们出来跟我们掰一掰手腕

独家｜阿里将推出千问办公，旗下三款智能体合并

热门推荐

五载星途再启航！上海天文馆五周年嘉年华邀你共赴宇宙探索盛宴

每个组都在赔钱！短剧顶流王凯沐直播谈现状

70岁的他倒在深夜，留下两座“国之重器”和一支能打硬仗的队伍

Kimi回应马斯克喊话：希望他们出来跟我们掰一掰手腕

我国杂交水稻育种科研取得重要进展

独家｜阿里将推出千问办公，旗下三款智能体合并

“Scaling Law要把硬件加进来”，京东给物理AI算了另一笔账

三星Galaxy Unpacked 2026发布会前瞻：三款折叠屏新机与智能手表齐亮相

Adobe Project Indigo 1.1版上线：AI助力照片编辑，一键清除干扰元素轻松出片

谷歌Gemini三箭齐发，Flash降价提效、网络安全模型直指Anthropic，旗舰3.5 Pro仍难产

马斯克放言将超越Kimi，月之暗面回应：欢迎较量且信心更足

阿里云函数计算云沙箱7月31日起启用新计费模式降本增效满足多元需求

月之暗面回应马斯克：欢迎掰手腕

北京越野发布豪华品牌泰钽，首款车型预售价29.98万元起

微软与法国AI企业Mistral达成协议，斥资数十亿美元在欧洲建设算力基础设施