百灵大模型开源Ling-2.6-flash，提供BF16、FP8、INT4等版本

IP属地中国·北京 编辑：胡颖 IT之家 时间：2026-05-01 01:19:09

IT之家 4 月 29 日消息，蚂蚁集团旗下的百灵大模型今日宣布，Ling-2.6-flash 正式开源。同步提供 BF16、FP8、INT4 等多个版本，方便开发者根据不同硬件环境、推理成本和部署需求灵活选择。
Ling-2.6-flash 是一款总参数量 104B、激活参数 7.4B 的 Instruct 模型，两周前以 Elephant Alpha 的匿名身份登陆 OpenRouter。
官方表示，过去两周里持续收集来自开发者的真实反馈，并针对 Ling-2.6-flash 的使用体验进行了多轮优化，进一步改善了中英文自然切换能力，并提升了其在主流 Coding 框架中的适配效果。
据介绍，Ling-2.6-flash 的核心能力体现在三个方面：
混合线性架构，释放推理效率：通过引入混合线性架构，模型从底层优化计算效率，在 4 卡 H20 条件下推理速度最快可达到340 tokens/s，Prefill 吞吐达到 Nemotron-3-Super 的2.2 倍
Token 效率优化，提升智效比：在训练过程中对 Token 效率进行了针对性校准，力求以更精简的输出完成既定目标。在 Artificial Analysis 的完整评测中，Ling-2.6-flash 仅消耗15M tokens，约为 Nemotron-3-Super 等模型的1/10
面向 Agent 场景进行定向增强：针对当前需求最旺盛的 Agent 应用，在工具调用、多步规划与任务执行能力上持续打磨，使模型在 BFCL-V4、TAU2-bench、SWE-bench Verified、Claw-Eval、PinchBench 等评测中，即使面对激活参数更大的模型，依然能够取得相近甚至 SOTA 级别的表现
IT之家附开源链接如下：
Hugging Face：https://huggingface.co/inclusionAI/Ling-2.6-flash
ModelScope：https://www.modelscope.cn/models/inclusionAI/Ling-2.6-flash

标签：模型百灵能力开源效率效果场景架构版本力求成本 针对性 数量速度校准硬件环境总参条件旗下线性精简方面 开发者 集团蚂蚁规划任务框架面向定向 据介绍 底

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

谁说鱼的记忆只有7秒？｜博览日报

马云与阿里高管集体插秧团建

马云亲自下田插秧！阿里核心高管齐亮相，坐实AI长期深耕的决心

内存成本飙升近翻倍，苹果扛压难继，iPhone 17 Pro等机型或迎涨价潮

小米YU7“深海蓝”配色成绝版？雷军回应：若呼声高或考虑“复活”该色

小米（MI）智能8寸平衡车：舒适安全续航强，亲子共享骑行欢乐时光

全站最新

谁说鱼的记忆只有7秒？｜博览日报

马云与阿里高管集体插秧团建

马云亲自下田插秧！阿里核心高管齐亮相，坐实AI长期深耕的决心

内存成本飙升近翻倍，苹果扛压难继，iPhone 17 Pro等机型或迎涨价潮

热门推荐

谁说鱼的记忆只有7秒？｜博览日报

马云与阿里高管集体插秧团建

马云亲自下田插秧！阿里核心高管齐亮相，坐实AI长期深耕的决心

艺人独立风潮下，太合音乐赴港募资押宝AI：版权摊销侵蚀利润，16亿优先股悬顶

胖东来转线上VS鲜啤店猛扩张，精酿步入岔路口

万亿智谱阴影下，中国互联网巨头们的“身份危机”

补税14亿，北大荒一年白干

美国AI狂飙，亚洲抢先吃饱

7亿收入、万亿市值，智谱值吗？

香水柠檬的“半生”：红了几年，还没真正长大

谁把智谱推上了万亿神坛？

单票价连涨3个月，顺丰不想送难挣钱的快递了

大疆影石打了一年，谁更焦虑？

2026年最大Biotech神话：一款II期药，261名员工，卖了109亿美元

从“工具人”到“悦己者”，中男消费的转折时刻