当前位置: 首页 » 资讯 » 科技头条 » 正文

京东推出 JoyAI-LLM-Flash 大模型,推动 AI 技术革新

IP属地 中国·北京 编辑:唐云泽 Chinaz 时间:2026-02-16 12:23:46

京东于 2 月 14 日在 Hugging Face 平台上正式开源了其最新的大模型 ——JoyAI-LLM-Flash。该模型总参数达到 48 亿,其中激活参数为 3 亿,经过 20 万亿文本 Token 的预训练,展现出卓越的前沿知识理解、推理能力和编程技能。

JoyAI-LLM-Flash 采用全新 FiberPO 优化框架,将纤维丛理论引入强化学习,并结合 Muon 优化器及稠密多 Token 预测技术,成功解决了传统模型规模扩展时的不稳定问题。与非 MTP 版本相比,其吞吐量提升了 1.3 倍至 1.7 倍,极大增强了模型的训练效率和应用潜力。

这款模型的架构为混合专家模型(MoE),层数达到 40 层,支持 128K 的上下文长度和 129K 的词表大小,标志着京东在 AI 领域的重要进展。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

全站最新