当前位置: 首页 » 资讯 » 科技头条 » 正文

百灵大模型开源Ling-2.6-flash,提供BF16、FP8、INT4等版本

IP属地 中国·北京 编辑:胡颖 IT之家 时间:2026-05-01 01:19:09

IT之家 4 月 29 日消息,蚂蚁集团旗下的百灵大模型今日宣布,Ling-2.6-flash 正式开源。同步提供 BF16、FP8、INT4 等多个版本,方便开发者根据不同硬件环境、推理成本和部署需求灵活选择。

Ling-2.6-flash 是一款总参数量 104B、激活参数 7.4B 的 Instruct 模型,两周前以 Elephant Alpha 的匿名身份登陆 OpenRouter。

官方表示,过去两周里持续收集来自开发者的真实反馈,并针对 Ling-2.6-flash 的使用体验进行了多轮优化,进一步改善了中英文自然切换能力,并提升了其在主流 Coding 框架中的适配效果

据介绍,Ling-2.6-flash 的核心能力体现在三个方面:

混合线性架构,释放推理效率:通过引入混合线性架构,模型从底层优化计算效率,在 4 卡 H20 条件下推理速度最快可达到340 tokens/s,Prefill 吞吐达到 Nemotron-3-Super 的2.2 倍

Token 效率优化,提升智效比:在训练过程中对 Token 效率进行了针对性校准,力求以更精简的输出完成既定目标。在 Artificial Analysis 的完整评测中,Ling-2.6-flash 仅消耗15M tokens,约为 Nemotron-3-Super 等模型的1/10

面向 Agent 场景进行定向增强:针对当前需求最旺盛的 Agent 应用,在工具调用、多步规划与任务执行能力上持续打磨,使模型在 BFCL-V4、TAU2-bench、SWE-bench Verified、Claw-Eval、PinchBench 等评测中,即使面对激活参数更大的模型,依然能够取得相近甚至 SOTA 级别的表现

IT之家附开源链接如下:

Hugging Face:https://huggingface.co/inclusionAI/Ling-2.6-flash

ModelScope:https://www.modelscope.cn/models/inclusionAI/Ling-2.6-flash

标签: 模型 百灵 能力 开源 效率 效果 场景 架构 版本 力求 成本 针对性 数量 速度 校准 硬件 环境 总参 条件 旗下 线性 精简 方面 开发者 集团 蚂蚁 规划 任务 框架 面向 定向 据介绍

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。