智通财经APP获悉,国泰海通证券发布研报称,近日,上海AI独角兽MiniMax发布覆盖文本、视频、语音、音乐的全模态大模型"全家桶",M2在权威榜单中登顶全球开源模型,标志着中国AI企业在全模态技术领域实现全面突破,为商业化落地打开新局面。
国泰海通主要观点如下:
投资建议:近日,上海AI独角兽MiniMax发布全模态“全家桶”,成了覆盖文本、视觉、语音、音乐的全模态技术体系。其文本大模型M2在全球权威测评中跻身第一梯队,并以极致的成本效益突破“性能、速度、成本”的不可能三角,标志着中国AI技术实现从跟跑到领跑的关键跨越。
近日,MiniMax发布全模态“全家桶”,其文本大模型M2登顶全球开源大模型。MiniMax密集发布了四款重磅模型:文本大模型M2、视频生成模型Hailuo 2.3、语音模型Speech 2.6和音乐模型Music 2.0;其中,MiniMax-M2一款专为智能体与代码优化而设计的开源文本模型,以10B激活参数(总参230B)的轻量级架构,在全球权威测评Artificial Analysis(AA)榜单中斩获全球前五、开源第一的成绩,成为首个跻身该榜单全球第一梯队的中国开源大模型。
M2在模型效率与成本控制方面树立了新标杆,发布后调用量激增。M2综合推理成本低至0.53美元/百万Token,仅为Claude 4.5 Sonnet的8%,同时推理速度接近后者的两倍,在模型性能、推理速度与使用成本的"不可能三角"中实现了突破性平衡,为大规模商业化应用提供了坚实的技术基础。MiniMax-M2凭借0.53美元/百万Token的极致性价比,在发布后5天内即在API平台OpenRouter的调用量跃居全球第四、国产第一,编程场景调用量更是位列全球第三。这一市场表现验证了其在高性能与低成本之间的卓越平衡,为国产模型在全球范围内的商业化推广提供了成功范例。
全模态产品矩阵展现完整技术布局,以确保生成质量与稳定性为核心目标。公司的“全家桶”模型里,Hailuo 2.3视频生成模型支持生成最长10秒的原生1080p高清视频,采用噪声感知计算重分配架构,训练和推理效率相比前代提升约2.5倍;Speech 2.6专为语音智能体场景深度优化的语音模型,将首包响应时间压减到250毫秒,达到语音赛道的绝对头部水平;Music 2.0能够生成结构完整、最长5分钟歌曲的音乐模型。特别值得关注的是,在全行业普遍采用简化注意力机制的背景下,MiniMax坚持投入更高成本的完整注意力机制,确保模型在长上下文、复杂逻辑推理等场景下的生成质量与稳定性,这一技术选择体现了企业对基础算法研究的长期投入与对技术品质的极致追求。
风险提示:大模型迭代速度不及预期,算力供给不足,数据隐私合规风险。





京公网安备 11011402013531号