6月1日,稀宇科技发布了新一代AI大模型MiniMax M3(详情可查看此前太平洋科技的报道内容:)。上周五,稀宇科技开源了MiniMax M3模型权重,同步发布了MSA(MiniMax Sparse Attention)技术论文,详细公开该架构的设计思路与工程落地方案。依托MSA技术,M3在处理超长上下文内容时,计算开销得到显著优化。
MiniMax M3为原生多模态大模型,整体总参数量达428B,实际激活参数量为23B。该模型从训练初始阶段便开展多模态混合训练,通过文本、图像等多类型数据交错学习,在预训练环节完成不同模态语义的深度融合,搭建起统一的跨模态语义体系,为多模态理解、内容生成以及复杂任务处理打下底层基础,也是业内首款从零起步完成多模态混合训练的开源模型。
MiniMax M3在研发阶段便明确方向,兼顾推理能力、长文本处理、多模态表现,同时降低使用门槛,面向个人开发者与企业实现普惠应用。
上线两周时间里,MiniMax M3在Artificial Analysis综合智能指数榜单中,位列全球开源模型首位,收获了全球开发者、科研人员与行业用户的广泛测试与反馈。
面对开源后访问量激增的情况,官方持续进行性能调优。目前模型输出速度已从初始30TPS提升至80TPS,后续还计划将速度再提升30%至40%,进一步改善使用体验。同时平台上线调用数据看板,方便用户实时查看使用额度,统筹使用成本。
结合反馈来看,用户普遍关注模型服务稳定性、高负载下持续运行能力以及规模化部署成本。当下大模型深度融入各类生产场景,智能体可长时间执行复杂长周期任务,Token消耗随之攀升,业内也愈发注重模型性能、使用成本与运行稳定性的平衡。





京公网安备 11011402013531号