阶跃Step 3把推理效率卷到DeepSeek的3倍,还拉来了国产芯片半壁江山
值得一提的是,本文作者缪昌新也是 JuiceFS 社区的长期贡献者,自 2021 年项目开源以来持续参与开发,并在最近发布的 1.3版本中贡献了多项 TiKV 性能优化改进。自最初在推理场景中引入 Juic…
Step 3采用MoE架构,总参数量321B,激活参数量38B
借助前几天发布的Kimi K2,月之暗面又强势归来。
10/31 16:58
10/31 16:56
10/31 16:55