上证报中国证券网讯(记者 孙小程)6月1日,国产大模型公司MiniMax正式发布新一代通用模型MiniMax M3。M3采用全新的自研稀疏注意力架构MiniMax Sparse Attention(MSA),在编程及智能体能力、超长上下文及原生多模态等多个关键方向,均实现代际突破。 公开资料显示,M3是国内首个同时具备“前沿Coding能力、1M超长上下文、原生多模态”三项核心能力的大模型,也是目前全球唯一具备完整能力组合的开源选项。 支撑M3三大能力合一的,是其自研的稀疏注意力架构MSA(MiniMax Sparse Attention)。相较传统全注意力机制,MSA能够显著降低长上下文下的计算成本,并将上下文窗口提升至100万token。 这意味着模型在处理长文档、复杂代码仓库、多轮任务协作等场景时,能够在一次推理中保留更完整的信息链路。MiniMax披露,在100万上下文规模下,M3单token计算量仅为上一代模型的约1/20,推理效率显著提升。 评测显示,M3在Coding&Agentic能力明显提升。在衡量Coding能力的SWE-Bench Pro上,MiniMax M3超过GPT-5.5和Gemini 3.1 Pro,接近Opus 4.7。在综合评估SVG生成性能的基准SVG-Bench上,MiniMax M3超过Opus 4.7。 商业化方面,MiniMax同步推出Token Plan订阅方案。Plus版每月49元,提供6亿token;Max版每月119元,提供18亿token;Ultra版每月469元,提供55亿token。
上证报中国证券网讯(记者 孙小程)6月1日,国产大模型公司MiniMax正式发布新一代通用模型MiniMax M3。M3采用全新的自研稀疏注意力架构MiniMax Sparse Attention(MSA),在编程及智能体能力、超长上下文及原生多模态等多个关键方向,均实现代际突破。
公开资料显示,M3是国内首个同时具备“前沿Coding能力、1M超长上下文、原生多模态”三项核心能力的大模型,也是目前全球唯一具备完整能力组合的开源选项。
支撑M3三大能力合一的,是其自研的稀疏注意力架构MSA(MiniMax Sparse Attention)。相较传统全注意力机制,MSA能够显著降低长上下文下的计算成本,并将上下文窗口提升至100万token。
这意味着模型在处理长文档、复杂代码仓库、多轮任务协作等场景时,能够在一次推理中保留更完整的信息链路。MiniMax披露,在100万上下文规模下,M3单token计算量仅为上一代模型的约1/20,推理效率显著提升。
评测显示,M3在Coding&Agentic能力明显提升。在衡量Coding能力的SWE-Bench Pro上,MiniMax M3超过GPT-5.5和Gemini 3.1 Pro,接近Opus 4.7。在综合评估SVG生成性能的基准SVG-Bench上,MiniMax M3超过Opus 4.7。
商业化方面,MiniMax同步推出Token Plan订阅方案。Plus版每月49元,提供6亿token;Max版每月119元,提供18亿token;Ultra版每月469元,提供55亿token。





京公网安备 11011402013531号