当前位置: 首页 » 资讯 » 科技头条 » 正文

MiniMax发布M3模型 AI大模型竞争转向长上下文与智能体能力

IP属地 中国·北京 编辑:柳晴雪 上海证券报 时间:2026-06-02 10:16:29

上证报中国证券网讯(记者 孙小程)6月1日,国产大模型公司MiniMax正式发布新一代通用模型MiniMax M3。M3采用全新的自研稀疏注意力架构MiniMax Sparse Attention(MSA),在编程及智能体能力、超长上下文及原生多模态等多个关键方向,均实现代际突破。 公开资料显示,M3是国内首个同时具备“前沿Coding能力、1M超长上下文、原生多模态”三项核心能力的大模型,也是目前全球唯一具备完整能力组合的开源选项。 支撑M3三大能力合一的,是其自研的稀疏注意力架构MSA(MiniMax Sparse Attention)。相较传统全注意力机制,MSA能够显著降低长上下文下的计算成本,并将上下文窗口提升至100万token。 这意味着模型在处理长文档、复杂代码仓库、多轮任务协作等场景时,能够在一次推理中保留更完整的信息链路。MiniMax披露,在100万上下文规模下,M3单token计算量仅为上一代模型的约1/20,推理效率显著提升。 评测显示,M3在Coding&Agentic能力明显提升。在衡量Coding能力的SWE-Bench Pro上,MiniMax M3超过GPT-5.5和Gemini 3.1 Pro,接近Opus 4.7。在综合评估SVG生成性能的基准SVG-Bench上,MiniMax M3超过Opus 4.7。 商业化方面,MiniMax同步推出Token Plan订阅方案。Plus版每月49元,提供6亿token;Max版每月119元,提供18亿token;Ultra版每月469元,提供55亿token。

上证报中国证券网讯(记者 孙小程)6月1日,国产大模型公司MiniMax正式发布新一代通用模型MiniMax M3。M3采用全新的自研稀疏注意力架构MiniMax Sparse Attention(MSA),在编程及智能体能力、超长上下文及原生多模态等多个关键方向,均实现代际突破。

公开资料显示,M3是国内首个同时具备“前沿Coding能力、1M超长上下文、原生多模态”三项核心能力的大模型,也是目前全球唯一具备完整能力组合的开源选项。

支撑M3三大能力合一的,是其自研的稀疏注意力架构MSA(MiniMax Sparse Attention)。相较传统全注意力机制,MSA能够显著降低长上下文下的计算成本,并将上下文窗口提升至100万token。

这意味着模型在处理长文档、复杂代码仓库、多轮任务协作等场景时,能够在一次推理中保留更完整的信息链路。MiniMax披露,在100万上下文规模下,M3单token计算量仅为上一代模型的约1/20,推理效率显著提升。

评测显示,M3在Coding&Agentic能力明显提升。在衡量Coding能力的SWE-Bench Pro上,MiniMax M3超过GPT-5.5和Gemini 3.1 Pro,接近Opus 4.7。在综合评估SVG生成性能的基准SVG-Bench上,MiniMax M3超过Opus 4.7。

商业化方面,MiniMax同步推出Token Plan订阅方案。Plus版每月49元,提供6亿token;Max版每月119元,提供18亿token;Ultra版每月469元,提供55亿token。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

全站最新