阶跃Step 3把推理效率卷到DeepSeek的3倍,还拉来了国产芯片半壁江山
Step 3采用MoE架构,总参数量321B,激活参数量38B
07/09 12:23
07/09 12:22
07/09 12:21
07/09 12:20