蚂蚁百灵发布轻量级推理模型 Ring-mini-2.0，将逐步全面开源

IP属地中国·北京 雷峰网 时间：2025-09-16 16:33:21

近日，据百灵大模型公众号，蚂蚁百灵团队发布并开源了Ring-mini-2.0推理模型。它是基于此前蚂蚁百灵发布的基础语言模型 Ling 2.0 架构，深度优化的高性能推理型 MoE 模型。它在总参数量16B、仅激活1.4B参数的情况下，即可达到10B级别以下dense 模型的综合推理能力，尤其在逻辑推理、代码与数学任务中表现卓越，并支持 128K 长上下文及 300+ token/s 的高速生成。
经过 Long-COT SFT、更稳定持续的RLVR以及RLHF联合优化，Ring-mini-2.0复杂推理的稳定性与泛化性得到显著提升。在多项高难度基准（LiveCodeBench、AIME 2025、GPQA、ARC-AGI-v1 等）中，在输出长度相当的情况下，Ring-mini-2.0性能显著超越10B以下dense 模型，甚至媲美更大参数量的MoE模型（如 gpt-oss-20B-medium），在逻辑推理方面尤为突出。

（Ring-mini-2.0性能表现）
据了解，Ring-mini-2.0继承了Ling 2.0 系列的高效 MoE 设计，仅激活 1.4B 参数，通过 1/32 专家激活比、MTP 层等架构优化，达到约 7–8B dense 模型的等效性能。得益于小激活、高稀疏度的设计，Ring-mini-2.0 在H20 部署下实现 300+ token/s 的吞吐，结合 Expert Dual Streaming 推理优化后可进一步提升至 500+ token/s，大幅降低高并发场景下 Thinking 模型的推理成本。同时，借助 YaRN 外推可支持 128K 长上下文，长输出场景下相对加速比最高可达 7 倍以上。
蚂蚁百灵团队表示将完整开放 Ring-mini-2.0 的模型权重、训练数据和 RLVR+RLHF 训练策略。凭借“小而优”的特点，Ring-mini-2.0 有望成为小尺寸推理模型的首选，为学术和工业界提供理想的研究与应用起点。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

1400亿收编Groq，英伟达的收购史，以及黄仁勋的并购逻辑

「黑影石，200一条，接单速来」

王传福：我直管的总经理，一半出自应届大学生

钉钉“木兰”破土，直面飞书、企微的AI办公终极卡位战？

内存等价格上涨，消息称三星Galaxy S26系列手机定价陷入困境

AI大神吴恩达：很多计算机专业应届生找不到工作，是因为高校课程严重滞后

全站最新

1400亿收编Groq，英伟达的收购史，以及黄仁勋的并购逻辑

「黑影石，200一条，接单速来」

王传福：我直管的总经理，一半出自应届大学生

钉钉“木兰”破土，直面飞书、企微的AI办公终极卡位战？

热门推荐

上海仲裁委金融仲裁院院长郭洪俊解读沪版证券期货仲裁新规：构建专业、高效、灵活、经济的仲裁体系

马斯克：xAI五年内AI算力将超全球机构总和

1400亿收编Groq，英伟达的收购史，以及黄仁勋的并购逻辑

「黑影石，200一条，接单速来」

王传福：我直管的总经理，一半出自应届大学生

钉钉“木兰”破土，直面飞书、企微的AI办公终极卡位战？

内存等价格上涨，消息称三星Galaxy S26系列手机定价陷入困境

超1900万年轻人在闲鱼“偷偷搞钱”

AI大神吴恩达：很多计算机专业应届生找不到工作，是因为高校课程严重滞后

今年卖了超100万辆新能源车，东风汽车转型进入深水区

工信部新规：新车内饰公开，安全优先刻进行业基因

前豆包PC端产品负责人齐俊元加入阶跃星辰，或将融资创业

低空飞行联合实验室在渝成立

电车通编辑买车记：研究半年选了零跑，最后三天却被4S店坑了一波

专访佘远斌：如何用“生命色素”卟啉实现双碳目标和守护舌尖安全｜院士上封面