Stability AI推出音频模型Stability Audio 3.0，可创作6分钟歌曲

IP属地中国·北京 编辑：赵静 IT之家 时间：2026-05-21 08:12:36

IT之家 5 月 20 日消息，据外媒 TechCrunch 今晚报道，AI 初创公司 Stability AI 推出全新音频生成模型家族 Stability Audio 3.0，其顶级版本据称可生成长达六分钟以上的专业级音乐。
Stability AI 此次共推出了四款不同规格的模型，分别为：45900 万参数的小型 XFS 与小型版、14 亿参数的中型版，以及 27 亿参数的大型版。其中，两款小型模型专注于设备端运行，可本地生成两分钟以内的声音与音乐。
中型和大型模型则展现出更强的架构控制力，能够创作长达 6 分钟 20 秒的完整乐曲，并精准维持音乐结构与旋律基调。这一长度与 2024 年该公司推出的 Stable Audio 2.0 相比，实现了翻倍以上的跨越。
为了回馈开源社区，Stability AI 已将小型 SFX、小型及中型模型开源，公众可以自由下载并修改权重。不过，最顶尖的大型模型目前仅通过 API 与付费托管服务提供，且年营收超过 100 万美元（IT之家注：现汇率约合 682.1 万元人民币）的企业必须购买商业授权。
为了规避合规风险，Stability AI 在去年就已同华纳音乐集团、环球音乐集团达成深度合作。该公司强调，此次推出的最新音频模型全量基于合法授权的数据集训练而成。
Stability AI 目前正紧锣密鼓地为专业音乐人打造一套全新产品线，不过尚未公布具体功能细节。为了推进该项目，曾先后担任环球音频与芬达首席数字官的伊桑卡普兰已正式加盟，负责领衔专业音乐产品业务。

标签：模型参数音频音乐 开源社区 权重 音乐人 旋律汇率

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

iOS 27 第二个开发者测试版似乎暗示了一款新的苹果产品

工业互联网深度下沉，中小工厂全面数字化转型

腾讯阿里百度都来助力可灵，能和字节的seedance掰手腕吗？

浙大校友再战IPO！做半导体“保安”年入18亿，比亚迪、海康威视都下单

彭博：为什么全球机场无法关闭吸烟休息室

李飞飞、Jim Fan、徐丹飞联手，给具身智能指了一条新路

全站最新

iOS 27 第二个开发者测试版似乎暗示了一款新的苹果产品

工业互联网深度下沉，中小工厂全面数字化转型

腾讯阿里百度都来助力可灵，能和字节的seedance掰手腕吗？

浙大校友再战IPO！做半导体“保安”年入18亿，比亚迪、海康威视都下单

热门推荐

iOS 27 第二个开发者测试版似乎暗示了一款新的苹果产品

工业互联网深度下沉，中小工厂全面数字化转型

腾讯阿里百度都来助力可灵，能和字节的seedance掰手腕吗？

浙大校友再战IPO！做半导体“保安”年入18亿，比亚迪、海康威视都下单

彭博：为什么全球机场无法关闭吸烟休息室

李飞飞、Jim Fan、徐丹飞联手，给具身智能指了一条新路

别想用软色情做智能体的跳板

别争了！香农老婆，才是世界上第一个大语言模型

丰田将借助AI把各部门4.5万个专业术语精简至5000个

华为：截至目前，搭载乾崑智驾的车辆已超过190万辆

vivo X Fold6折叠屏手机首销情况曝光，同期约为上一代的90%

清华特奖获得者顾煜贤，加入DeepSeek

苹果采购国产内存不太容易向三星等施压谈判才是真

OpenAI塌房！Scaling law原作曝bug，万亿算力全白烧

全国百强汽车经销商内部通知曝光：亏损板块7月经理级以上全部0工资