阶跃Step 3把推理效率卷到DeepSeek的3倍,还拉来了国产芯片半壁江山
Step 3采用MoE架构,总参数量321B,激活参数量38B
10/31 16:58
10/31 16:56
10/31 16:55